基于文本替换的解释器：加入continuation，重构解释器

基于文本替换的解释器：加入continuation，重构解释器2015-01-12或许在加入continuation之前要先讲讲费这么大劲做这个有什么意义。毕竟用不用continuation的计算结果都是一样的。不过，这是一个兴趣使然的系列，学习这些知识应该完全出于好奇与好玩的想法。所以我才不会告诉你们通过控制continuation可以实现call-with-current-continuation和异常处理等功能呢。

我先简要描述一下加入continuation后解释器是怎么工作的。加入continuation后的解释器是以迭代的方式工作的。迭代的状态量有两个，第一个是一个待求值的表达式或者求到的值，第二个是Continuation。假设解释器的输入是$M$，那么一开始的状态表示为$left<M, {mt} ight>_v$。第一个状态量是个表达式$M$，这时解释器开始对$M$求值。这个过程用记号$ ightarrow_{v}$表示。这个过程可能会将一些“下一步要做的事”保存到continuation。求值到最后，状态会变为$left<V, kappa ight>_c$（如果没有无限循环）。注意到下标变成c，$V$是一个值，所以不能再求值了，下一步要做的是从continuation $kappa$中取出“下一步要做的事”执行。这个过程也叫做“将continuation $kappa$应用到值$V$”，用记号$ ightarrow_{c}$表示。一个解释器的执行过程就是$ ightarrow_{v}$和$ ightarrow_{c}$交替运行，就好像太极里阴阳交替一样。解释器执行到最后状态会变成$left<V, {mt} ight>_c$，已求得值$V$，又没有“下一步要做的事”，也就是运行结束了，输出$V$。说了这么多，本质上整个过程还是一句话：递归转迭代。顺便一提，加入continuation后的解释器叫做CK machine。

先列出目前为止的所有求值过程（call-by-value）： egin{equation*}egin{array}{lcl} eval（X） &=& X \ eval（b） &=& b \ eval（lambda X.M） &=& lambda X.M \ eval（（+ ; M ; N）） &=& eval（M） + eval（N） \ eval（（- ; M ; N）） &=& eval（M） - eval（N） \ eval（（{iszero} ; M）） &=& {true} \ && ext{其中} eval（M） = 0 \ eval（（{iszero} ; M）） &=& {false}, \ && ext{其中} eval（M） eq 0 \ eval（（M ; N）） &=& eval（L[X leftarrow eval（N）]） \ && ext{其中} eval（M） = lambda X.L \ eval（（{fix} ; X_1 ; X_2 ; M）） &=& lambda X_2.M[X_1 leftarrow （{fix} ; X_1 ; X_2 ; M）] end{array}end{equation*} 下面分别介绍各个情况下如何加入continuation。

值与fix表达式

值是最简单的情况，直接应用continuation。 egin{equation*}egin{array}{lcl} left<X, kappa ight>_v & ightarrow_v& left<X, kappa ight>_c \ left<b, kappa ight>_v & ightarrow_v& left<b, kappa ight>_c \ left<lambda X.M, kappa ight>_v & ightarrow_v& left<lambda X.M, kappa ight>_c \ end{array}end{equation*}

fix表达式和值的情况类似： egin{equation*}egin{array}{lcl} left<（{fix} ; X_1 ; X_2 ; M）, kappa ight>_v & ightarrow_v& left<lambda X_2.M[X_1 leftarrow （{fix} ; X_1 ; X_2 ; M）], kappa ight>_c end{array}end{equation*}

（fixX1X2M）,κv→v λX2.M[X1←（fixX1X2M）],κc

基本运算

用$（o^n ; M_1 ; M_2 ; ... ; M_n）$表示基本运算，其中$o^n$是运算符，$M_1, ..., M_n$是参数，$n$是代表参数个数。在我们的语言里目前有两个两参数的基本运算$o^2={+, -}$和一个单参数的基本运算$o^1={{iszero}}$。

计算基本运算前要先对所有参数求值。这里规定从左到右求值。当解释器在求第$i$个参数$M_i$的值时，需要保存到continuation的数据有：运算符$o^n$、已求到的值$V_1, ..., V_{i-1}$（其中$V_1=eval（M）, ..., V_{i-1}=eval（M_{i-1}）$）以及还没求值的参数$M_{i+1}, ..., M_n$。因此，包含基本运算的continuation定义为： egin{equation*}egin{array}{lcl} kappa &=& {mt} \ &|& left<{opd}, kappa, o^n, （V_1 ; ... ; V_{i-1}）, （M_{i+1} ; ... ; M_n） ight> end{array} end{equation*}

求值过程为： egin{equation*}egin{array}{lcl} left<（o^n ; M_1 ; M_2 ; ... ; M_n）, kappa ight>_v & ightarrow_v& left<M_1, left<{opd}, kappa, o^n, （M_2 ; ... ; M_n）, （） ight> ight>_v \ left<V, left<{opd}, kappa, o^n, （M_{i+1} ; ... ; M_n）, （V_1 ; ... ; V_{i-1}） ight> ight>_c & ightarrow_c& left<M_{i+1}, left<{opd}, kappa, o^n, （... ; M_n）, （V_1 ; ... ; V_{i-1} V） ight> ight>_v \ left<V, left<{opd}, kappa, o^n, （）, （V_1 ; ... ; V_{n-1}） ight> ight>_c & ightarrow_c& left<V", kappa ight>_c \ && ext{其中} V" = o^n（V_1, ..., V_{n-1}, V） end{array}end{equation*}

（onM1M2...Mn）,κv V,opd,κ,on,（Mi+1...Mn）,（V1...Vi1）c V,opd,κ,on,（）,（V1...Vn1）c →v→c→c M1,opd,κ,on,（M2...Mn）,（）v Mi+1,opd,κ,on,（...Mn）,（V1...Vi1V）v V′,κc其中V′=on（V1,...,Vn1,V）

函数调用

函数调用$（M ; N）$先计算$M$的值，$N$保存到continuation： egin{equation*}egin{array}{lcl} left<（M ; N）, kappa ight>_v & ightarrow_v& left<M, left<{arg}, kappa, N ight> ight>_v end{array}end{equation*} $M$计算完后从continuation取出$N$计算（我们采用call-by-value的调用方式），同时保存$M$的计算结果$V$： egin{equation*}egin{array}{lcl} left<V, left<{arg}, kappa, N ight> ight>_c & ightarrow_c& left<N, left<{fun}, kappa, V ight> ight>_v end{array}end{equation*} $N$也计算完后，进行$eta$归约： egin{equation*}egin{array}{lcl} left<V, left<{fun}, kappa, lambda X.L ight> ight>_c & ightarrow_c& left<L[X leftarrow V], kappa ight>_v end{array}end{equation*} 这个地方很有意思，可以看到函数调用最后$eta$归约的过程不会使continuation增长。所有求值过程中，会导致continuation增长的几个过程是基本运算中对参数的计算过程、函数调用中对函数的计算过程以及对参数的计算过程。一般也认为函数调用中函数的这个位置（也就是$（M ; N）$中$M$这个位置）也算参数位置，所以判断一个函数调用是不是尾调用的依据是：这个函数调用表达式是不是在一个参数位置，如果在参数位置，就不是尾调用。

上面分析的求值过程里增加了两种continuation： egin{equation*}egin{array}{lcl} kappa &=& ... \ &|& left<{arg}, kappa, N ight> \ &|& left<{fun}, kappa, V ight> end{array} end{equation*}

κ =||...arg,κ,Nfun,κ,V

代码实现

函数value-of/k是$ ightarrow_v$。函数apply-cont是$ ightarrow_c$。编写代码要注意对value-of/和apply-cont的调用都必须是尾调用。

过程$ ightarrow_v$的代码：