你好,我是周爱民。欢迎回到我的专栏。书接上回,这一讲我们仍然讲动态执行。
之前我说到过,setTimeout和setInterval的第一个参数可以使用字符串,那么如果这个参数使用字符串的话,代码将会在哪里执行呢?毕竟当定时器被触发的时候,程序的执行流程“很可能”已经离开了当前的上下文环境,而切换到未知的地方去了。
所以,的确如你所猜测的那样,如果采用这种方式来执行代码,那么代码片断将在全局环境中执行。并且,这也是后来这一功能被部分限制了的原因,例如你在某些版本的Firefox中这样做,那么你可能会得到如下的错误提示:
> setTimeout('alert("HI")', 1000)
Content Security Policy: The page’s settings blocked the loading of a resource at eval (“script-src”).
在全局环境中执行代码所带来的问题远远不止于此,接下来,我们就从这个问题开始谈起。
早期的JavaScript是应用于浏览器环境中的,因此,当网页中使用<SCRIPT>
标签加载.js文件时候,代码就会在浏览器的全局环境中执行。但这个过程是同步的,将BLOCK掉整个网页的装载进度,因此有了defer
这个属性来指示代码异步加载,将这个加载过程延迟到网页初始化结束之后。不过即使如此,JavaScript代码仍然是执行在全局环境中的。
在那个时代,<SCRIPT>
标签还支持for
和event
属性,用于指定将JavaScript代码绑定给指定的HTML元素或事件响应。当采用这种方式的时候,代码还是在全局环境中执行,只不过可能初始化为一个函数(的回调),并且this
指向元素或事件。很不幸,有许多浏览器并不实现这些特性,尤其是for
属性,它也许在IE中还存在,这一特性与ActiveXObject的集成有关。
关于脚本的动态执行,你能想象的绝大多数能在浏览器中玩的花样大概都在这里了。当然,你还可以在DOM中动态地插入一个SCRIPT
标签来装载脚本,这在Ajax还没有那么流行的时候是唯二之选。另一种选择,是在Document初始化结束之前使用document.write()
。
总而言之,为了动态执行一点什么,古典时代的WEB程序员是绞尽脑汁。
那么为什么不用eval()
呢?
按照JavaScript脚本的执行机制,所有的.js文件加载之后,它的全局代码只会执行一次。无论是在浏览器还是在Node.js环境中,以及它们的模块加载环境中,都是如此。这意味着放在这些全局代码中的eval()
事实上也就只在初始化阶段执行一次而已。而eval()
又有一个特别的性质,那就是它“总是在”当前上下文中执行代码。因此,所有其他的、放在函数中的eval()
代码都只会影响函数内的、局部的上下文,而无法影响全局。
也就是说,除了初始化,eval()
无法在全局执行。
不同的浏览器都有各自的内置机制来解决这个问题。IE会允许用户代码调用window.execScript()
,实现那些希望eval()
执行在全局的需求。而Firefox采用了另外的一条道路,称为window.eval()
。这个从字面上就很好理解,就是“让eval()
代码执行在window环境中”。而window
就是浏览器中的全局对象global,也就是说,window.eval与global.eval是等义的。
这带来了另外一个著名的、在Firefox早期实现的JavaScript特性,称为“对象的eval”。
如果你试图执行obj.eval(x)
,那么就是将代码文本x
执行在obj
的对象闭包中(类似于with (obj) eval(x)
)。因为全局环境就是使用global来创建的“对象环境(对象闭包)”,所以这是在实现“全局eval()”的时候“顺手”就实现了的特性。
但这意味着用户代码可以将eval
函数作为一个方法赋给任何一个JavaScript对象,以及任何一个属性名字。例如:
var obj = { do: eval };
obj.do('alert("HI")');
现在,“名字”成了一个问题,在任何地方、任何位置,任何对象以及任何函数的上下文中都能“以不同的名字”来eval()一段代码文本。
这太不友好了!这意味着我们永远无法有效地判断、检测和优化用户代码。一方面,这对于程序员来说是灾难,另一方面,对引擎的实现者来说也非常绝望。
于是,从ECMAScript 6开始,ECMAScript规定了“标准而规范地使用eval()”的方法:你仅仅只能直接使用一个字面文本为“eval”字符串的函数名字,并且作为普通函数调用的形式来调用eval()
,这样才算是“直接调用的eval()”。
这个约定是非常非常罕见的。JavaScript历史上几乎从未有过在规范中如此强调一个名字“在字面文本上的规范性”。在ECMAScript 5之后,一共也只出现了两个,这里的"eval"是一个,而另一个是严格模式(这个稍晚一点我们也会详细讲到)。
根据ECMAScript的约定,下面的这些都不是“直接调用的eval()”:
// 对象属性
obj = { eval }
obj.eval(x)
// 更名的属性名或变量名(包括全局的或函数内局部的)
e = eval
var e = eval
e(x)
// super引用中的父类属性(包括原型方法和静态方法)
class MyClass { eval() { } }
MyClass.eval = eval;
class MyClassEx extends MyClass {
foo() { super.eval(x) }
static foo() { super.eval(x) }
}
// 作为函数(或其他大多数表达式)的返回
function foo() { return eval }
foo()(x)
// (或)
(_=>eval)()(x)
总之,你所有能想到的一切——换个名字,或者作为对象属性的方式来调用eval,都不再作为“直接调用的eval()”来处理了。
那么,你可能会想要知道,怎样才算是“直接调用的eval()”,以及它有什么效果呢?
很简单的,在全局、模块、函数的任意位置,以及一个运行中的eval(...)
的代码文本的任意位置上,你使用的
eval(x)
这样的代码,都被称为“直接调用”。直接调用eval()意味着:
x
。而反过来,其他任何将eval()
调用起来,或者执行到eval()
函数的方式,都称为“间接调用”。
而这两讲的标题中的写法,就是一个经典的“间接调用eval”的写法:
(0, eval)(x)
晚一点,我们会再来详细讲述这个“间接调用”,接下来我们先说说与它相关的一点基础知识,也就是“严格模式”。
NOTE:之所以称为“经典的”写法,是因为在ECMAScript规范的测试项目test262中,所有间接调用相关的示例都是采用这种写法的。
ECMAScript 5中推出的严格模式是一项重大的革新之举,它静默无声地拉开了ECMAScript 6~ECMAScript 10这轰轰烈烈的时代序幕。
之所以说它是“静默无声的”,是因为这项特性刚出来的时候,大多数人并不知道它有什么用,有什么益处,以及为什么要设计成这个样子。所以,它几乎算是一个被“强迫使用”的特性,对你的团队来说是这样,对整个的JavaScript生态来说也是如此。
但是“严格模式”确实是一个好东西,没有它,后来的众多新特征就无法形成定论,它奠定了一个稳定的、有效的、多方一致的语言特性基础,几乎被所有的引擎开发厂商欢迎、接受和实现。
所以,我们如今大多数新写的JavaScript代码其实都是在严格模式环境中运行的。
对吗?
不太对。上面这个结论对于大多数开发者来说是适用的,并能理解和接受。但是,要是你在ECMAScript规范层面,或者在JavaScript引擎层面来看这句话,你会发现:咦?!“严格模式环境”是什么鬼?我们从来没见过这个东西!
是的,所谓“严格模式”,其实从来都不是一种环境模式,或者说,没有一个环境是具有“严格模式”这样的属性的。所有的执行环境——所有在执行引擎层面使用的“执行上下文(ExecuteContext)”,以及它们所引用的“环境(Environment)”,都没有“严格模式”这样的模式,也没有这样的性质。
我们所有的代码都工作在非严格模式中,而“严格模式”不过是代码执行过程中的一个限制。更确切地说,即使你用如下命令行:
> node --use-strict
来启动Node.js,也仍然是运行在一个JavaScript的“非严格模式”环境中的!是的,是的,我知道,你可以立即写出来一行代码来反驳上述观点:
# (在上例启动的Node.js环境中测试)
> arguments = 1
SyntaxError: Unexpected eval or arguments in strict mode
但是请相信我:上面的示例只是一个执行限制,你绝对是运行在一个“非严格模式”环境中的!
因为所有的四种执行环境(包括Eval环境),在它们创建和初始化时都并没有“严格模式”这样的性质。并且,在全局环境初始化之前,在宿主环境中初始化引擎时,引擎也根本不知道所谓“严格模式”的存在。严格模式这个特性,是在环境创建完之后,在执行代码之前,从源代码文本中获取的性质,例如:
// (JavaScript引擎的初始化过程)
// 初始化全局,in InitializeHostDefinedRealm()
CALL SetRealmGlobalObject(realm, global, thisValue)
-> CALL NewGlobalEnvironment(globalObj, thisValue)
// 执行全局任务(含解析源代码文本等),in ScriptEvaluationJob()
s = ParseScript(sourceText, realm, hostDefined)
CALL ScriptEvaluation(s)
// 执行全局代码,in ScriptEvaluation(s)
result = GlobalDeclarationInstantiation(scriptBody, globalEnv)
if (result.[[Type]] === normal) {
result = ENGING_EVALUATING(scriptBody)
...
在这整个过程中,ParseScript()解析源代码文本时,如果发现“严格模式的指示字符串”,那么就会将解析结果(例如抽象语法树ast)的属性ast.IsStrict置为true。但这个标记仅仅只作用于抽象语法树层面,而环境中并没有相关的标识——在模块中,这个过程是类似的,只是缺省就置为true而已。
而另一方面,例如函数,它的“严格模式的指示字符串”也是在语法解析阶段得到的,并作为函数对象的一个内部标记。但是函数环境创建时却并不使用它,因此也不能在环境中检测到它。
我列举所有这些事实,是试图说明:“严格模式”是它们相关的可执行对象的一个属性,但并不是与之对应的执行环境的属性。因此,当“执行引擎”通过“词法环境或变量环境”来查找时,是看不到这些属性的,也就是说,执行引擎所知道的环境并没有“严格/不严格”的区别。
那么严格模式是怎么被实现的呢?
答案是,绝大多数严格模式特性都是在“相关的可执行对象”创建或初始化阶段就被处理掉的。例如,严格模式约定“没有arguments.caller和arguments.callee”,那么,就在初始化这个对象的时候不创建这两个属性就好了。
另外一部分特性是在语法分析阶段识别和处理的。例如“禁止掉8进制字面量”,由于“严格模式的指示字符串(‘use strict’)”总是在第一行代码,所以在其他代码parser之前,解析器就已经根据指示字符串配置好了解析逻辑,对“8进制字面量”可以直接抛出异常了。
从等等类似于此的情况,你能看到“严格模式”的所有限制特性,其实都并不需要执行引擎参与。进一步地来说,引擎设计者也并不愿意掺合这件事,因为这种模式识别将大幅度地降低引擎的执行效能,以及使引擎优化的逻辑复杂化。
但是,现在来到了“eval()”调用,怎么处理它的严格模式问题呢?
绝大多数严格模式的特性都与语法分析结束后在指定对象上置的“IsStrict”这样的标记有关,它们可以指导引擎如何创建、装配和调用代码。但是到了执行器内部,由于不可能从执行上下文开始反向查找环境,并进一步检测严格模式标识,所以eval()
在原则上也不能知道“当前的”严格模式状态。
这有例外,因为“直接调用eval()”是比较容易处理的,因为在使用eval()
的时候,调用者——注意不是执行引擎——可以在当前自己的状态中得到严格模式的值,并将该值传入eval()
的处理过程。这在ECMAScript中是如下的一段规范:
...
- If strictCaller is true, let strictEval be true.
- Else, let strictEval be IsStrict of script.
...
也就是说,如果caller的严格模式是true,那么eval(x)
就继承这个模式,否则就从x
(也就是script)的语法解析结果中检查IsStrict标记。
那么间接调用呢?
所谓间接调用,是JavaScript为了避免代码侵入,而对所有非词法方式的(即直接书写在代码文本中的)eval()
调用所做的定义。并且ECMAScript约定:
这样一来,你就没有办法向函数内传入一个对象,并用该对象来“在函数内部”执行一堆侵入代码了。
但是回到前面的问题:如果是间接调用,那么这里的strictCaller
是谁呢?又处于哪种“严格模式”状态中呢?
答案是:不知道。因为当这样来引用全局的时候,上下文/环境中并没有全局的严格模式性质;反向查找源代码文本或解析过的ast树呢,既不经济也不可靠。所以,就有另外一个约定:
也就是说,间接调用将突破引擎对严格模式的任何设置,你总是拥有一个“全局的非严格模式”并在其中执行代码。例如:
# (控制台)
> node --use-strict
# (Node.js环境, 严格模式的全局环境)
> arguments = 1
SyntaxError: Unexpected eval or arguments in strict mode
> 012
SyntaxError: Octal literals are not allowed in strict mode.
# 间接调用(例1)
> (0, eval)('arguments = 1') // accept!
> arguments
1
# 间接调用(例2)
> (0, eval)('012') // accept!
10
# 间接调用(例3,本讲的标题代码,将创建变量x)
> (0, eval)('x = 100') // accept!
> x
100
最后一个疑问,就是为什么“标题中的这种写法”会是一种间接调用。并且,更有对比性地来看,如果是下面这种写法,为什么就“不再是”间接调用了呢?例如
# 直接调用
> (eval)('x = 100')
ReferenceError: x is not defined
at eval (eval at ...)
# 间接调用
> (0, eval)('x = 100')
100
在JavaScript中,表达式的返回结果(Result)可能是值,也可能是“引用(规范类型)”。在“引用”的情况中,有两个例子是比较常见、却又常常被忽略的,包括:
# 属性存取返回的是引用
> obj.x
# 变量的标识符(作为单值表达式)是引用
> x
我们之前的课程中说过,所有这种“引用(规范类型)”类型的结果(Result),在作为左手端的时候,它是引用;而作为右手端的时候,它是值。所以,才会有“x = x”这一个表达式的完整语义:
好了,然而还存在一个运算符,它可以“原样返回”之前运算的结果(Result),这就是“分组运算符()”。因为这个运算符有这样的特性,所以当它作用于属性存取和一般标识符时,分组运算返回的也仍然是后者的“运算结果(Result)”。例如:
# “结果(Result)”是`100`的值
> (100)
# “结果(Result)”是`{}`对象字面量(值)
> ({})
# “结果(Result)”是`x`的引用
> (x)
# “结果(Result)”是`obj.x`的引用
> (obj.x)
所以,从“引用”的角度上来看,(eval)
和eval
的效果也就完全一致,它们都是global.eval
在“当前上下文环境”中的一个引用。但是我们接下来看,我们在这一讲的标题中写的这个分组表达式是这样的:
(0, eval)
这意味着在分组表达式内部还有一个运算,称为“连续运算(逗号运算符)”。连续运算的效果是“计算每一个表达式,并返回最后一个表达式的值(Value)”。注意,这里不是“结果(Result)”。所以它相当于执行了:
(GetValue(0), GetValue(eval))
因此最后一个运算将使结果从“Result->Value”,于是“引用(的信息)”丢失了。在它外层(也就是其后的)分组运算得到的、并继续返回的结果,就是“GetValue(eval)”了。这样一来,在用户代码中的(eval)(x)
还是直接调用“eval的引用”,而(0, eval)(x)
就已经变成间接调用“eval的值”了。
讲到这里,你可能已经意识到:关键在于eval
是一个引用,还是一个值?是的,的确如此!不过在ECMAScript规范中,一个“eval的直接调用”除了必须是一个“引用”之外,还有一个附加条件:它还必须是一个环境引用!
也就是说,属性引用的eval
仍然是算着间接调用的。例如:
# (控制台,直接进入全局的严格模式)
> node --use-strict
# 测试用的代码(in Node.js)
> var x = 'arguments = 1'; // try source-text
# 作为对象属性
> var obj = {eval};
# 间接调用:这里的确是一个引用,并且名字是字符串文本"eval",但它是属性引用
> (obj.eval)(x)
1
# 直接调用:eval是当前环境中的一个名字引用(标识符)
> eval(x)
SyntaxError: Unexpected eval or arguments in strict mode
# 直接调用:同上(分组运算符保留了引用的性质)
> (eval)(x)
SyntaxError: Unexpected eval or arguments in strict mode
所以,无论如何,只要这个函数的名字是“eval”,并且是“global.eval这个函数在当前环境中的引用”,那么它就可以得到豁免,成为传统意义上的“直接调用”。例如:
// (一些豁免的案例,如下是直接调用)
// with中的对象属性(对象环境)
with ({ eval }) eval(x)
// 直接名字访问(作为缺省参数引用)
function foo(x, eval=eval) {
return eval(x)
}
// 不更改名字的变量名(位于函数环境内部的词法/变量环境中)
function foo(x) {
var eval = global.eval; // 引用自全局对象
return eval(x)
}
那么最后一个问题,是“eval怎么返回结果呢”?
这个问题的答案反倒非常简单。由于eval(x)
是将代码文本x
作为语句执行,所以它将返回语句执行的结果。所有语句执行都只返回值,而不返回引用。所以, 即使代码x
的运算结果(Result)是一个“引用(规范类型)”,那么eval()
也只返回它的值,即“GetValue(Result)”。例如:
# 在代码文本中直接创建了一个`eval`函数的“引用(规范类型)”
> obj = { foo() { return this === obj } }
# this.foo调用中未丢失`this`这个引用
> obj.foo()
true
# 同上,分组表达式传回引用,所以`this`未丢失
> (obj.foo)()
true
# eval将返回值,所以`this`引用丢失了
> eval('obj.foo')()
false
今天这一讲结束了对标题中代码的全部分析。由于标题中的代码是一个“间接调用的eval”,因此它总是运行在一个非严格模式的全局中,于是变量x
也就总是可以被创建或重写。
“间接调用(IndriectCall)”是JavaScript非常非常少见的一种函数调用性质,它与“SuperCall”可以合并起来,视为JavaScript中执行系统中的“两大顶级疑难”。对间接调用的详细分析,涉及执行引擎的工作原理、环境和环境组件的使用、严格模式、引用(规范类型)的特殊性,以及最为特殊的“eval是作为特殊名字来识别的”等等多个方面的基础特性。
间接调用对“严格模式”并非是一种传统意义上的“破坏”,只是它的工作机制正正好地绕过了严格模式。因为严格模式并不是环境的性质,而是代码文本层面的执行限制,所以当eval的间接调用需要使用全局时,无法“得到并进入”这种模式而已。
最后,间接调用其实是对传统的window.execScript或window.eval的一个保留。它有着在兼容性方面的实用意义,但对系统的性能、安全性和可靠性都存在威胁。无论如何,你应该限制它在代码中的使用。不过,它的的确确是ECMAScript规范中严格声明和定义过的特性,并且可称得上是“黑科技(Hack skill)”了。
今天有一个作业留给你思考,问题很简单:
欢迎你在进行深入思考后,与其他同学分享自己的想法,也让我有机会能听听你的收获。
今天的课程就到这里。下一讲,我们将讨论“动态函数”,这既是“动态语言”部分的最后一小节,也将是专栏的最后一讲。