再举几个动态语言 eval 手法的例子

2009-08-30编程 编程.Python

  在前一个帖子“什么俺推荐Python[2]”里面,顺便提到了动态语言中常用的 eval 手法。当时为了给大伙儿加深印象,俺举了个数字运算的例子(详见“原文”)来说明 eval 的好处。
  后来有一个“很有才”的同学,在博客评论中提到说:可以用如下编译预处理语句来搞定:
#define Foo(op, p1, p2)    (p1 op p2)
  对此,俺颇不以为然。且不说用 C/C++ 预处理语法来定义”宏函数“,有若干先天缺陷;单说用此方法来满足本例的需求,其【可扩展性】就很成问题。
  俺估摸着:一来,上周的那个例子过于简单,未能充分 show 出 eval 的特长;二来,尚有一些同学没有体验到 eval 带来的强烈快感。所以,俺决定把 eval 的话题再发挥一下,再举几个例子来说事儿。事先声明:本文忽悠的 eval 技巧,大多数动态语言都能实现。考虑到俺相对熟悉 Python,所以本文的例子都拿 py 代码来演示。


★示例1


  先稍微扩展一下之前的例子,把两个数的某种运算扩展为多个数的某种运算。也就是说,给定某种运算类型(比如 * 表示乘法、+ 表示加法)以及若干个数,要求返回运算结果。
  举例:
  给定:"+" 和 4、5、6,返回 15。
  给定:"*" 和 2、3、4、5,返回 120。
  对于诸如 C/C++/Java 等非动态的语言,多半得定义具有两参数的函数:其中一个参数表示运算类型,另一个参数表示数组。至于函数实现,基本上还是那几招。要么通过 switch 来搞定——面向过程的路子;要么抽象出一个用于运算的接口类(纯虚类),然后针对每一种操作符去派生出不同的实现(比如加法类、乘法类)——也就是面向对象的路子。当然,想卖弄 C/C++ 宏技巧的同学,或许也能用宏函数搞定,但代码会比原先复杂得多。
  现在,咱们来看看 Python 的 eval 函数是如何满足该需求的。相比原先的2行代码,这次稍微复杂点,变为5行。思路还是和原来一样,先格式化一个运算表达式的字符串,然后把其它工作统统丢给 eval 搞定即可。
def Foo(sOperator, lstValues) :
sExpr = "";
for n in lstValues[1:] : # 略过第一个元素
sExpr += (sOperator + str(n));
return eval(str(lstValues[0]) + sExpr); # 补上第一个元素并求值

  调用的时候,只需写如下这行,即可打印出 14。
print Foo("+", [2,3,4,5]);


★示例2


  在示例2中,咱们继续把需求复杂化。
  假设要实现一个类似计算器的玩意儿,让用户在【运行时】输入一个四则运算表达式并计算结果。要求支持常见的四则运算符,要求支持运算符之间的优先级(也就是小括号)。这时候,假如你企图用静态语言自己来实现该功能(不依靠第三方的库),那你得费老大老大的劲了。而用 Python,代码反而比示例1还简单(一个 eval 语句搞定)。


★示例3


  看到这里,肯定有同学不服气了:你玩来玩去,都是在搞数值运算,有没有啥新花样啊?
  eval 手法当然不仅仅限于玩数字运算啦!下面就来说说 eval 如何运用于新的场合。
  为了通俗易懂,俺就以邮件客户端为例(估计 99.9% 的同学都用过 Email)。邮件客户端有一个常见的需求是:用户可以自行配置一些过滤规则,用来过滤一些垃圾邮件。
  假设咱们要开发的是一个比较牛逼的客户端,其过滤规则要足够强大:可以根据邮件的不同属性进行条件判定(需求人员要求支持的属性有:标题、正文、发件人、收件人、附件数)。为了体现该软件的牛X,需求人员要求:可以让用户设定各种灵活的嵌套逻辑组合。比如用户可以配置如下这条判定规则:
如果((标题包含"交友" AND (发件人来自"qq.com" OR 发件人来自"kaixin.com")) OR 附件数大于10) 就认定为垃圾邮件

  当然,俺为了叙述方便,用了上面这种伪代码来阐述。真正的用户都是比较傻瓜的,咱肯定要提供一个足够傻瓜的界面来让用户配置过滤规则。
  至于界面如何设计,不是本文的重点,略过不提。目前的关键问题是,如果要支持这种复杂的嵌套逻辑表达式,后台的过滤引擎要如何处理才好?估计有些同学已经看出来了,用静态语言来处理是很棘手滴——因为规则是由用户在运行时任意配置,逻辑嵌套的层次不定,邮件的属性在将来也很可能会扩展。
  这时候,eval 手法又可以大放异彩了。如果用户配置了刚才那条过滤规则,那么界面模块只需要生成如下一个 Python 函数的源代码(说白了就是一个字符串)。
def Filter(sTitle, sContent, sFrom, sTo, nAttachNum) :
if (sTitle.find("交友")!=-1 and (sFrom.find("@qq.com")!=-1 or sTo.find("@kaixin.com")!=-1)) or nAttacheNum>10 :
return True;
else :
return False;

  后台模块可以先通过 Python 内置的 exec 函数,拿上述字符串创建出一个 Filter 函数。以后,每当收到一个邮件,只需把该邮件的各个属性传递给该 Filter 函数,即可完成垃圾邮件判定。
  顺便说一下:喜欢 OO 风格的同学,可以把上述代码重构一下,加入一个 Mail 的类,把 Filter 作为 Mail 的一个方法;喜欢 Pythonic 风格的同学,也可以把上述代码改为更简洁的写法。


★总结


  最后,来个总结发言。这种玩法的奥妙在于:那个传递给 eval / exec 的字符串,既可以看成是【数据】,也可以看成是可执行的【代码】。在动态语言的 eval 手法中,数据和代码得到了完美的结合。有了这种结合,你就获得了【在运行时生成代码的能力】。


俺博客上,和本文相关的帖子(需翻墙)
为什么俺推荐 Python(系列)