你好,我是周爱民。

今天我们讨论动态执行。与最初的预告不同 ,我在这一讲里把原来的第20讲合并掉了,变成了20~21的两讲合讲,但也分成了上、下两节。所以,其实只是课程的标题少了一个,内容却没有变。

动态执行是JavaScript最早实现的特性之一,eval()这个函数是从JavaScript 1.0就开始内置了的。并且,最早的setTimeout()和setInterval()也内置了动态执行的特性:它们的第1个参数只允许传入一个字符串,这个字符串将作为代码体动态地定时执行。

NOTE:setTimeout/setInterval执行字符串的特性如今仍然保留在大多数浏览器环境中,例如Safari或Mozilla,但这在Node.js/Chrome环境中并不被允许。需要留意的是,setTimeout/setInterval并不是ECMAScript规范的一部分。

关于这一点并不难理解,因为JavaScript本来就是脚本语言,它最早也是被作为脚本语言设计出来的。因此,把“装载脚本+执行”这样的核心过程,通过一个函数暴露出来成为基础特性既是举手之劳,也是必然之举。

然而,这个特性从最开始就过度灵活,以至于后来许多新特性在设计中颇为掣肘,所以在ECMAScript 5的严格模式出现之后,它的特性受到了很多的限制。

接下来,我将帮助你揭开重重迷雾,让你得见最真实的“eval()”。

eval执行什么

最基本的、也是最重要的问题是:eval究竟是在执行什么?

在代码eval(x)中,x必须是一个字符串,不能是其他任何类型的值,也不能是一个字符串对象。如果尝试在x中传入其他的值,那么eval()将直接以该值为返回值,例如:

# 值1
> eval(null)
null

# 值2
> eval(false)
false

# 字符串对象
> eval(Object('1234'))
[String: '1234']

# 字符串值
> eval(Object('1234').toString())
1234

这里,eval()会按照JavaScript语法规则来尝试解析字符串x,包括对一些特殊字面量(例如8进制)的语法解析。这样的解析会与parseInt()或Number()函数实现的类型转换有所不同,例如:对8进制的解析,在eval()的代码中就可以使用’012’来表示十进制的10。而使用parseInt()或Number()函数,就不支持8进制,会忽略前缀字符0,得到十进制的12。

# JavaScript在源代码层面支持8进制
> eval('012')
10

# 但parseInt()不支持8进制(除非显式指定radix参数)
> parseInt('012')
12

# Number()也不支持8进制
> Number('012')
12

另外,eval()会将参数x强制理解为语句行,这样一来,当按照“语句->表达式”的顺序解析时,“{ }”将被优先理解为语句中的大括号。于是,下面的代码就成了JavaScript初学者的经典噩梦,也就是“尝试将一个对象字面量的字符串作为代码文本执行”所导致的问题。

# 试图返回一个对象
> eval('{abc: 1}')
1

在这种情况下,由于第一个字符被理解为块语句,那么“abc:”就将被解析成标签语句;接下来,"1"会成为一个“单值表达式语句”。所以,结果是返回了这个表达式的值,也就是1,而不是一个字面量声明的对象。

NOTE:这一个示例就是原来用作第20讲的标题的一行代码。只不过,在实际写的时候发现能展开讲的内容太少,所以做了一下合并。:)

eval在哪儿执行

eval总是将代码执行在当前上下文的“当前位置”。这里的所谓的“当前上下文”并不是它字面意思中的“代码文本上下文”,而是指“(与执行环境相关的)执行上下文”。

我在之前的文章中给你提到过与JavaScript的执行系统相关的两个组件:环境和上下文。但我一直在尽力避免详细地讨论它们,甚至在一些场合中将它们混为一谈。

然而,在讨论eval()“执行的位置”的时候,这两个东西却必须厘清,因为严格地来讲,环境是JavaScript在语言系统中的静态组件,而上下文是它在执行系统中的动态组件。

环境

怎么说呢?

JavaScript中,环境可以细分为四种,并由两个类别的基础环境组件构成。这四种环境是:全局(Global)、函数(Function)、模块(Module)和Eval环境;两个基础组件的类别分别是:声明环境(Declarative Environment)和对象环境(Object Environment)。

你也许会问:不对啊?我们常说的词法环境到哪里去了呢?不要着急,我们马上就会讲到它的。这里先继续说清楚上面的六个东西。

首先是两个类别,它们是所有其他环境的基础,是两种抽象级别最低的、基础的环境组件。声明环境就是名字表,可以是引擎内核用任何方式来实现的一个“名字->数据”的对照表;对象环境是JavaScript的一个对象,用来“模拟/映射”成上述的对照表的一个结果,你也可以把它看成一个具体的实现。所以,

所以,所谓四种环境,其实是上述的两种基础组件进一步应用的结果。其中,全局(Global)环境是一个复合环境,它由一对“对象环境 + 声明环境”组成;其他3种环境,都是一个单独的声明环境。

你需要关注到的一个事实是:所有的四种环境都与执行相关——看起来它们“像是”为每种可执行的东西都创建了一个环境,但是它们事实上都不是可以执行的东西,也不是执行系统(执行引擎)所理解的东西。更加准确地说:

上述四种环境,本质上只是为JavaScript中的每一个“可以执行的语法块”创建了一个名字表的影射而已。

执行上下文

JavaScript的执行系统由一个执行栈和一个执行队列构成,这在之前也讲过。关于它们的应用原理,你可以回顾一下第6讲x: break x),以及第10讲x = yield x)中的内容。

在执行队列中保存的是待执行的任务,称为Job。这是一个抽象概念,它指明在“创建”这个执行任务时的一些关联信息,以便正式“执行”时可以参考它;而“正式的执行”发生在将一个新的上下文被“推入(push)”执行栈的时候。

所以,上下文是一个任务“执行/不执行”的关键。如果一个任务只是任务,并没有执行,那么也就没有它的上下文;如果一个上下文从栈中撤出,那么就必须有地方能够保存这个上下文,否则可执行的信息就丢失了(这种情况并不常见);如果一个新上下文被“推入(push)”栈,那么旧的上下文就被挂起并压向栈底;如果当前活动上下文被“弹出(pop)”栈,那么处在栈底的旧上下文就被恢复了。

NOTE:很少需要在用户代码(在它的执行过程中)撤出和保存上下文的过程,但这的确存在。比如生成器(GeneratorContext),或者异步调用(AsyncContext)。

而每一个上下文只关心两个高度抽象的信息:其一是执行点(包括状态和位置),其二是执行时的参考,也就是前面一再说到的“名字的对照表”。

所以,重要的是:每一个执行上下文都需要关联到一个对照表。这个对照表,就称为“词法环境(Lexical Environment)”。显然,它可以是上述四种环境之任一;并且,更加重要的,也可是两种基础组件之任一!

如上是一般性质的执行引擎逻辑,对于大多数“通用的”执行环境来说,这是足够的。

但对于JavaScript来说这还不够,因为JavaScript的早期有一个“能够超越词法环境”的东西存在,就是“var变量”。所谓词法环境,就是一个能够表示标识符在源代码(词法)中的位置的环境,由于源代码分块,所以词法环境就可以用“链式访问”来映射“块之间的层级关系”。但是“var变量”突破了这个设计限制,例如,我们常常说到的变量提升,也就是在一个变量赋值前就能访问它;又例如所有在同一个全局或函数内部的var x其实都是同一个,而无论它隔了多少层的块级作用域。于是你可以写出这样一个示例来:

var x = 1;
if (true) {
  var x = 2;

  with (new Object) {
    var x = 3;
  }
}

这个示例中,无论你把var x声明在if语句后面的块中,还是with语句后面的块中,“1、2、3”所在的“var变量”x,都突破了它们所在的词法作用域(或对应的词法环境),而指向全局的x

于是,自ECMAScript 5开始约定,ECMAScript的执行上下文将有两个环境,一个称为词法环境,另一个就称为变量环境(Variable Environment);所有传统风格的“var声明和函数声明”将通过“变量环境”来管理。

这个管理只是“概念层面”的,实际用起来,并不是这么回事。

管理

为什么呢?

如果你仔细读了ECMAScript,你会发现,所谓的全局上下文(例如Global Context)中的两个环境其实都指向同一个!也就是:

#(如下示例不可执行)
> globalCtx.LexicalEnvironment === global
true

> globalCtx.VariableEnvironment === global
true

这就是在实现中的取巧之处了。

对于JavaScript来说,由于全局的特性就是“var变量”和“词法变量”共用一个名字表,因此你声明了“var变量”,那么就不能声明“同名的let/const变量”。例如:

> var x = 100
> let x = 200
SyntaxError: Identifier 'x' has already been declared

所以,事实上它们“的确就是”同一个环境。

而具体到“var变量”本身,在传统中,JavaScript中只有函数和全局能够“保存var声明的变量”;而在ECMAScript 6之后,模块全局也是可以保存“var声明的变量”的。因此,事实上也就只有它们的“变量环境(VariableEnvironment)”是有意义的,然而即使如此(也就是说即使从原理上来说它们都是“有用的”),它们仍然是指向同一个环境组件的。也就是说,之前的逻辑仍然是成立的:

#(如下示例不可执行)
> functionCtx.LexicalEnvironment === functionCtx.VariableEnvironment
true

> moduleCtx.LexicalEnvironment === moduleCtx.VariableEnvironment
true

那么,非得要“分别地”声明这两个组件又有什么用呢?答案是:对于eval()来说,它的“词法环境”与“变量环境”存在着其他的可能性!

不用于执行的环境

环境在本质上是“作用域的映射”。作用域如果不需要被上下文管理,那么它(所对应的环境)也就不需要关联到上下文。

在早期的JavaScript中,作用域与执行环境是一对一的,所以也就常常混用,而到了ECMAScript 5之后,有一些作用域并没有对应用执行环境,所有就分开了。在ECMAScript 5之后,ECMAScript规范中就很少使用“作用域(Scope)”这个名词,转而使用“环境”这个概念来替代它。

哪些东西的作用域不需要关联到上下文呢?其实,一般的块级作用域都是这样的。例如一般的块级作用域:

// 对象闭包
with (x) ...

很显然的,这里的with语句为对象x创建了一个对象闭包,就是对象作用域,也是我们在上面讨论过的“对象环境”。然而,由于这个语句其实只需要执行在当前的上下文环境(函数/模块/全局)中,因此它不需要“被关联到”一个执行上下文,也不需要作为一个独立的可执行组件“推入(push)”到执行栈。所以,这时创建出来的环境,就是一个不用于执行的环境。

只有前面所说过的四种环境是用于执行的环境,而其他的所有环境(以及反过来对应的作用域)都是不用于执行的,它们与上下文无关。并且,既然与上下文没有关联,那么也就不存在“词法环境”和“变量环境”了。

从语法上,(在代码文本中)你可以找到除了上述四种环境之外的其他任何一种块级作用域,事实上它们每个作用域都有一个对应的环境:with语句的环境用“对象环境”创建出来,而其他的(例如for语句的迭代环境,又例如swith/try语句的块)是用“声明环境”创建出来的。

对于这些用于执行的环境中的其中三个,ECMAScript直接约定了它们(也就是Global/Module/Function)的创建过程。例如全局环境,就称为NewGlobalEnvironment()。因为它们都可以在代码解析(Parser)的阶段得到,并且在代码运行之前由引擎创建出来。

而唯有一个环境,是没有独立创建过程,并且在程序运行过程中动态创建的,这就是“Eval环境”。

所以Eval环境是主要用于应对“动态执行”的环境。

eval()的环境

上面我们说到,所谓“Eval环境”是主要用于应对“动态执行”的,并且它的词法环境与变量环境“可能会不一样”。这二者其实是相关的,并且,这还与“严格模式”这一特殊机制存在紧密的关系。

当在eval(x)用一般的方式执行代码时,如果x字符串中存在着var变量声明,那么会发生什么事情呢?按照传统JavaScript的设计,这意味着在它所在的函数作用域,或者全局作用域会有一个新的变量被创建出来。这也就是JavaScript的“动态声明(函数和var变量)”和“动态作用域”的效果,例如:

var x = 'outer';
function foo() {
  console.log(x); // 'outer'
  eval('var x = 100;');
  console.log(x); // '100'
}
foo();

如果按照传统的设计与实现,这就会要求eval()在执行时能够“引用”它所在的函数或全局的“变量作用域”。并且进一步地,这也就要求eval有能力“总是动态地”查找这个作用域,并且JavaScript执行引擎还需要理解“用户代码中的eval”这一特殊概念。正是为了避免这些行为,所以ECMAScript约定,在执行上下文中加上“变量环境(Variable Environment)”这个东西,以便在执行过程中,仅仅只需要查找“当前上下文”就可以找到这个能用来登记变量的名字表。

也就是说,“变量环境(VariableEnvironment)”存在的意义,就是动态地登记“var变量”。

因此,它也仅仅只用在“Eval环境”的创建过程中。“Eval环境”是唯一一个将“变量环境”指向了与它自有的“词法环境”不同位置的环境。

NOTE: 其实函数中也存在一个类似的例外。但这个处理过程是在函数的环境创建之后,在函数声明实例化阶段来完成的,因此与这里的处理略有区别。由于是函数声明的实例化(FunctionDeclaration Instantiation)阶段来处理,因此这也意味着每次实例化(亦即是每次调用函数并导致闭包创建)时都会重复一次这个过程:在执行上下文的内部重新初始化一次变量环境与词法环境,并根据严格模式的状态来确定词法环境与变量环境是否是同一个。

这里既然提到了“Eval自有的词法环境”,那么也稍微解释一下它的作用。

对于Eval环境来说,它也需要一个自己的、独立的作用域,用来确保在“eval(x)”的代码x中存在的那些const/let声明有自己的名字表,而不影响当前环境。这与使用一对大括号来表示的一个块级作用域是完全一致的,并且也使用相同的基础组件(即声明环境、Declarative Environment)来创建得到。这就是在eval()中使用const/let不影响它所在函数或其他块级作用域的原因,例如:

function foo() {
  var x = 100;
  eval('let x = 200; console.log(x);'); // 200
  console.log(x); // 100
}
foo();

而同样的示例,由于“变量环境”指向它在“当前上下文(也就是foo函数的函数执行上下文)”的变量环境,也就是:

#(如下示例不可执行)
> evalCtx.VariableEnvironment === fooCtx.VariableEnvironment
true

> fooCtx.VariableEnvironment === fooCtx.LexicalEnvironment
true

> evalCtx.VariableEnvironment = evalCtx.LexicalEnvironment
false

所以,当eval中执行代码“var x = …”时,就可以通过evalCtx.VariableEnvironment来访问到fooCtx.VariableEnvironment了。例如:

function foo() {
  var x = 100;
  eval('var x = 200; console.log(x);'); // 200, x指向foo()中的变量x
  console.log(x); // 200
}
foo();

也许你正在思考,为什么eval()在严格模式中就不能覆盖/重复声明函数、全局等环境中的同名“var变量”呢?

答案很简单,只是一个小小的技术技巧:在“严格模式的Eval环境”对应的上下文中,变量环境与词法环境,都指向它们自有的那个词法环境。于是这样一来,在严格模式中使用eval("var x...")eval("let x...")的名字都创建在同一个环境中,它们也就自然不能重名了;并且由于没有引用它所在的(全局或函数的)环境,所以也就不能改写这些环境中的名字了。

那么一个eval()函数所需要的“Eval环境”究竟是严格模式,还是非严格模式呢?

你还记得“严格模式”的使用原则么?eval(x)的严格模式要么继承自当前的环境,要么就是代码x的第一个指令是字符串“use strict”。对于后一种情况,由于eval()是动态parser代码x的,所以它只需要检查一下parser之后的AST(抽象语法树)的第一个节点,是不是字符串“use strict”就可以了。

这也是为什么“切换严格模式”的指示指令被设计成这个奇怪模样的原因了。

NOTE:按照ECMAScript 6之后的约定,模块默认工作在严格模式下(并且不能切换回非严格模式),所以它其中的eval()也就必然处于严格模式。这种情况下(即严格模式下),eval()的“变量环境”与它的词法环境是同一个,并且是自有的。因此模块环境中的变量环境(moduleCtx.VariableEnvironment)将永远不会被引用到,并且用户代码也无法在其中创建新的“var变量”。

最后一种情况

标题中的eval()的代码文本,说的却是最后一种情况。在这种情况下,代码文本将指向一个“未创建即赋值”的变量x,我们知道,按照ECMAScript的约定,在非严格模式中,向这样的变量赋值就意味着在全局环境中创建新的变量x;而在严格模式中,这将不被允许,并因此而抛出异常。

由于Eval环境通过“词法环境与变量环境分离”来隔离了“严格模式”对它的影响,因此上述约定在两种模式下实现起来其实都比较简单。

对于非严格模式来说,代码可以通过词法环境的链表逆向查找,直到global,并且因为无法找到x而产生一个“未发现的引用”。我们之前讲过,在非严格模式中,对“未发现的引用”的置值将实现为向全局对象“global”添加一个属性,于是间接地、动态地就实现了添加变量x。对于严格模式呢,向“未发现的引用”的置值触发一个异常就可以了。

这些逻辑都非常简单,而且易于理解。并且,最关键和最重要的是,这些机制与我今天所讲的内容——也就是变量环境和词法环境——完全无关。

然而,接下来你需要动态尝试一下:

标题中的代码突破了“严格模式”的全部限制!这就是我下一讲要为你讲述的内容了。

今天没有设置知识回顾,也没有作业。但我建议你尝试一下标题中的代码,也可以回顾一下本节课中提到的诸多概念与名词。

我相信,它与你平常使用的和理解的,有许多不一致的地方,甚至有矛盾之处。但是,相信我,这就是这个专栏最独特的地方:它讲述JavaScript的核心原理,而不是重复那些你可能已经知道的知识。

欢迎你在进行深入思考后,与其他同学分享自己的想法,也让我有机会能听听你的收获。