智能车制作

标题: 【编程语言】Lisp语言 [打印本页]

作者: Quixote    时间: 2016-10-17 20:29
标题: 【编程语言】Lisp语言
此帖是我对网上各种Lisp语言介绍描述的一个收集,经常用C语言的同学可以了解了解Lisp语言。

转帖网址:http://www.ibm.com/developerworks/cn/java/j-cb02067.html
跨越边界: Lisp 之美编程语言的王道
                                                                 Lisp 长久以来一直被视为伟大的编程语言之一。其漫长的发展过程(接近五十年)中引发的追随狂潮表明:这是一门非同凡响的语言。在 MIT,Lisp 在所有程序员的课程中占了举足轻重的地位。像 Paul Graham 那样的企业家们将 Lisp 卓越的生产力用作他们事业成功起步的推动力。但令其追随者懊恼万分的是,Lisp 从未成为主流编程语言。作为一名 Java™ 程序员,如果您花一点时间研究 Lisp 这座被人遗忘的黄金之城,就会发现许多能够改进编码方式的技术。
入门本文使用 GNU 的 GCL,它针对许多操作系统都有免费下载。但稍作修改,就能使用任何版本的 Common Lisp。请参见 参考资料 获取可用 Lisp 版本的详细说明。
和学习大多数其他语言一样,学习 Lisp 最好的方法就是实践。打开您的解释程序,和我一起编码。Lisp 基本上是一门编译好的语言,通过直接键入命令,就可以轻松地用它进行编程。
列表语言基本上,Lisp 是一门关于列表的语言。Lisp 中的一切内容(从数据到组成应用程序的代码)都是列表。每个列表都由一些原子 和列表组成。数字就是原子。键入一个数字仅仅会返回该数字作为结果:
清单 1. 简单原子>11>aError: The variable A is unbound.
如果键入一个字母,解释程序会报错,如清单 1 所示。字母是变量,所以使用之前必须先为其赋值。如果想要引用一个字母或词语而不是变量,请使用引号将其括起来。在变量前加单引号告诉 Lisp 延迟对后续列表或原子进行求值,如清单 2 所示:
清单 2. 延迟求值和引用>"a""a">'aA
请注意 Lisp 把 a 大写为 A。lisp 假设您希望使用 A 作为符号,因为它没有加括号。后面会讨论赋值,但先要让列表来完成这一任务。简单地讲,Lisp 列表是加了括号并使用空格隔开的原子序列。尝试如清单 3 所示键入一个列表。这个列表是无效的,除非在列表前面加上 '。
清单 3. 键入一个简单列表>(1 2 3)Error: 1 is invalid as a function.>'(1 2 3)(1 2 3)
除非在列表前加上 ',否则 Lisp 会像对函数求值那样对每个列表求值。第一个原子是运算符,列表中其余的原子是参数。Lisp 有数目众多的原语函数,正如您预料的那样,其中包括许多数学函数,例如,+、* 和 sqrt。(+ 1 2 3) 返回 6,(* 1 2 3 4) 返回 24。
操纵列表的有两类函数:构造函数选择函数。构造函数构建列表,选择函数分解列表。first 和 rest 是核心选择函数。first 选择函数返回列表的第一个原子,rest 选择函数返回除第一个原子外的整个列表。清单 4 显示了这两个选择函数:
清单 4. 基本 Lisp 函数> (first '(lions tigers bears))LIONS> (rest '(lions tigers bears))(TIGERS BEARS)
这两个选择函数都获取整个列表,返回列表的主要片断。稍后,您将了解递归如何利用这些选择函数。
如果希望构建列表而不是将其分开,就需要构造函数。与在 Java 语言中一样,构造函数构建新元素:在 Java 语言中为对象,在 Lisp 中即为列表。cons、list 和 append 是构造函数示例。核心构造函数 cons 带有两个参数:一个原子和一个列表。cons 将该原子作为第一个元素添加到该列表。如果对 nil 调用 cons,Lisp 将 nil 作为空列表对待,并构建一个含一个元素的列表。append 连接两个列表。list 包含一个由所有参数组成的列表。清单 5 显示了这些构造函数的实际应用:
清单 5. 使用构造函数> (cons 'lions '(tigers bears))(LIONS TIGERS BEARS)> (list 'lions 'tigers 'bears)(LIONS TIGERS BEARS)> (append '(lions) '(tigers bears))(LIONS TIGERS BEARS)
将 cons 与 first、rest 一起用时可以构建任何列表。list 和 append 运算符只是为了方便,但经常会用到它们。事实上,可以使用 cons、first 和 rest 来构建任何列表,或返回任何列表片段。例如,要获取列表的第二或第三个元素,应该获取 rest 中的 first,或 rest 中的  rest 中的 first,如清单 6 所示。或者,若要构建包含两个或三个元素的列表,可以将 cons 和 first、rest 一起使用,来模拟 list 和 append。
清单 6. 构建第二个元素、第三个元素,然后模拟 list 和 append>(first (rest '(1 2 3)))2>(first (rest (rest '(1 2 3))))3>(cons '1 (cons '2 nil))(1 2)>(cons '1 (cons '2 (cons '3 nil)))(1 2 3)>(cons (first '(1)) '(2 3))(1 2 3)
这些示例也许无法引起您的兴趣,但在如此简单的原语之上构建一门简洁优美的语言,其中的原理让一些程序员激动不已。这些由列表构建的简单指令构成了递归、高阶函数,甚至是闭包和 continuation 之类高级抽象的基础。因此下面将研究高级抽象。
回页首
构建函数可以猜到,Lisp 函数声明为列表。清单 7 构建了一个返回列表第二个元素的函数,展示了函数声明的形式:
清单 7. 构建第二个函数(defun my_second (lst)  (first (rest lst)))
defun 是用于定义自定义函数的函数。第一个参数是函数名,第二个参数是参数列表,第三个参数是希望执行的代码。可以看出,所有 Lisp 代码都表述为列表。借助这项灵活和强大的功能,就可以像操纵其他任何数据一样操纵应用程序。稍后将看到一些示例使代码和数据之间的区别变得模糊。
Lisp 也处理条件结构,如 if 语句。格式为 (if condition_statement then_statement else_statement)。清单 8 是一个简单的 my_max 函数,用于计算两个输入变量中的最大值:
清单 8. 计算两个整数中的最大值(defun my_max (x y)  (if (> x y) x y))MY_MAX(my_max 2 5)5(my_max 6 1)6
下面回顾一下到目前为止看到的内容:
回页首
递归Lisp 提供用于迭代的编码结构,但递归是更受欢迎的列表遍历方式。使用 first 和 rest 组合实现递归效果很好。清单 9 中的 total 函数显示了其运行原理:
清单 9. 使用递归计算列表的总和>(defun total (x)  (if (null x)    0    (+ (first x) (total (rest x)))  ))TOTAL>(total '(1 5 1))7
清单 9 中的 total 函数将列表当作单个的参数。第一个 if 语句在列表为空的情况下中断递归,返回零值。否则,该函数将第一个元素添加到列表其余部分的总和。现在应该明白如此构建 first 和 rest 的原因。first 能够去除列表的第一个元素,rest 简化了将尾部递归 (清单 9 中的递归类型)应用于列表其余部分的过程。
由于性能的原因,Java 语言中的递归是有限的。Lisp 提供一项称作尾部递归优化 的性能优化技术。Lisp 编译器或解释器能够将特定形式的递归翻译为迭代,从而允许以一种更为简单明快的方式来使用递归数据结构(如树结构)。
回页首
高阶函数如果模糊了数据和代码之间的区别,Lisp 会更有意思。在本系列的前两篇文章中,介绍了 JavaScript 中的高阶函数Ruby 中的闭包。这两项功能都将函数作为参数进行传递。在 Lisp 中,由于函数和列表没有任何区别,高阶函数也就非常简单。
高阶函数的最常见用法或许是 lambda 表达式,这是闭包的 Lisp 版。lambda 函数是用于将高阶函数传入 Lisp 函数的函数定义。例如,清单 10 中的 lambda 表达式计算了两个整数的和:
清单 10. Lambda 表达式>(setf total '(lambda (a b) (+ a b)))(LAMBDA (A B) (+ A B))>total(LAMBDA (A B) (+ A B))>(apply total '(101 102))203
如果使用过高阶函数或闭包,那么可能更容易理解清单 10 中的代码。第一行代码定义了一个 lambda 表达式并将其和 total 符号绑定到一起。第二行代码仅显示了这个和 total 绑定到一起的 lambda 表达式。最终,最后一个表达式对包含 (101 102) 的列表应用这个 lambda 表达式。
高阶函数提供比面向对象概念更高层次的抽象。可以用它们来更简洁清晰地表达想法。编程的至高境界就是在不牺牲可读性或性能的前提下,用更少的代码提供更强大更灵活的功能。高阶函数能实现所有这些要求。
Lisp 还有两种类型的高阶函数。其中功能最强大的可能是。宏为后面的执行定义 Lisp 对象。可以将宏看作代码模板。请参考清单 11 中的示例:
清单 11. 宏>(defmacro times_two (x) (* 2 x))TIMES_TWO>(setf a 4)4>(times_two a)8
这个示例应该分为两个阶段进行阅读。第一次赋值定义了宏 times_two。在第二个阶段(称为宏扩展)中,在对 a 求值之前,将 a 扩展为 (* 2 a)。该模板中这项延迟求值方式使宏的功能非常强大。Lisp 语言本身的许多功能都是基于宏的。
结束语从年份上讲,Lisp 也许很陈旧,甚至语法也很陈旧。但如果稍作研究,就会发现该语言有着难以置信的强大功能,它的高阶抽象一如既往地有效,并且生产力很高。许多更为现代的语言从 Lisp 中得到借鉴,但是其中大多数语言的功能无法与 Lisp 媲美。如果 Lisp 拥有 Java 或 .NET 的一部分市场,并且大学中具备 lisp 知识的人也占有一定的比例,我们可能就会立即用它进行编码。



转帖网址:http://www.csdn.net/article/2012-11-22/2812113-The-Nature-Of-Lisp

Lisp的本质简介
最初在Web的某些角落偶然看到有人赞美Lisp时,我那时已经是一个颇有经验的程序员。在我的履历上,掌握的语言范围相当广泛,象C++,Java,C#主流语言等等都不在话下,我觉得我差不多知道所有的有关编程语言的事情。对待编程语言的问题上,我觉得自己不太会遇到什么大问题。其实我大错特错了。
我试着学了一下Lisp,结果马上就撞了墙。我被那些范例代码吓坏了。我想很多初次接触Lisp语言的人,一定也有过类似的感受。Lisp的语法太次了。一个语言的发明人,居然不肯用心弄出一套漂亮的语法,那谁还会愿意学它。反正,我是确确实实被那些难看的无数的括号搞蒙了。
回过神来之后,我和Lisp社区的那伙人交谈,诉说我的沮丧心情。结果,立马就有一大套理论砸过来,这套理论在Lisp社区处处可见,几成惯例。比如说:Lisp的括号只是表面现象;Lisp的代码和数据的表达方式没有差别,而且比XML语法高明许多,所以有无穷的好处;Lisp有强大无比的元语言能力,程序员可以写出自我维护的代码;Lisp可以创造出针对特定应用的语言子集;Lisp的运行时和编译时没有明确的分界;等等,等等,等等。这么长的赞美词虽然看起来相当动人,不过对我毫无意义。没人能给我演示这些东西是如何应用的,因为这些东西一般来说只有在大型系统才会用到。我争辩说,这些东西传统语言一样办得到。在和别人争论了数个小时之后,我最终还是放弃了学Lisp的念头。为什么要花费几个月的时间学习语法这么难看的语言呢?这种语言的概念这么晦涩,又没什么好懂的例子。也许这语言不是该我这样的人学的。
几个月来,我承受着这些Lisp辩护士对我心灵的重压。我一度陷入了困惑。我认识一些绝顶聪明的人,我对他们相当尊敬,我看到他们对Lisp的赞美达到了宗教般的高度。这就是说,Lisp中一定有某种神秘的东西存在,我不能忍受自己对此的无知,好奇心和求知欲最终不可遏制。我于是咬紧牙关埋头学习Lisp,经过几个月的时间费劲心力的练习,终于,我看到了那无穷无尽的泉水的源头。在经过脱胎换骨的磨练之后,在经过七重地狱的煎熬之后,终于,我明白了。
顿悟在突然之间来临。曾经许多次,我听到别人引用雷蒙德(译者注:论文<<大教堂和市集>>的作者,著名的黑客社区理论家)的话:“Lisp语言值得学习。当你学会Lisp之后,你会拥有深刻的体验。就算你平常并不用Lisp编程,它也会使你成为更加优秀的程序员”。过去,我根本不懂这些话的含义,我也不相信这是真的。可是现在我懂得了。这些话蕴含的真理远远超过我过去的想像。我内心体会到一种神圣的情感,一瞬间的顿悟,几乎使我对电脑科学的观念发生了根本的改变。
顿悟的那一刻,我成了Lisp的崇拜者。我体验到了宗教大师的感受:一定要把我的知识传布开来,至少要让10个迷失的灵魂得到拯救。按照通常的办法,我把这些道理(就是刚开始别人砸过来的那一套,不过现在我明白了真实的含义)告诉旁人。结果太令人失望了,只有少数几个人在我坚持之下,发生了一点兴趣,但是仅仅看了几眼Lisp代码,他们就退却了。照这样的办法,也许费数年功夫能造就了几个Lisp迷,但我觉得这样的结果太差强人意了,我得想一套有更好的办法。
我深入地思考了这个问题。是不是Lisp有什么很艰深的东西,令得那么多老练的程序员都不能领会?不是,没有任何绝对艰深的东西。因为我能弄懂,我相信其他人也一定能。那么问题出在那里?后来我终于找到了答案。我的结论就是,凡是教人学高级概念,一定要从他已经懂得的东西开始。如果学习过程很有趣,学习的内容表达得很恰当,新概念就会变得相当直观。这就是我的答案。所谓元编程,所谓数据和代码形式合一,所谓自修改代码,所谓特定应用的子语言,所有这些概念根本就是同族概念,彼此互为解释,肯定越讲越不明白。还是从实际的例子出发最有用。
我把我的想法说给Lisp程序员听,遭到了他们的反对。”这些东西本身当然不可能用熟悉的知识来解释,这些概念完全与众不同,你不可能在别人已有的经验里找到类似的东西”,可是我认为这些都是遁词。他们又反问我,“你自己为啥不试一下?”好吧,我来试一下。这篇文章就是我尝试的结果。我要用熟悉的直观的方法来解释Lisp,我希望有勇气的人读完它,拿杯饮料,深呼吸一下,准备被搞得晕头转向。来吧,愿你获得大能。
重新审视XML
千里之行始于足下。让我们的第一步从XML开始。可是XML已经说得更多的了,还能有什么新意思可说呢?有的。XML自身虽然谈谈不上有趣,但是XML和Lisp的关系却相当有趣。XML和Lisp的概念有着惊人的相似之处。XML是我们通向理解Lisp的桥梁。好吧,我们且把XML当作活马医。让我们拿好手杖,对XML的无人涉及的荒原地带作一番探险。我们要从一个全新的视角来考察这个题目。
表面上看,XML是一种标准化语法,它以适合人阅读的格式来表达任意的层次化数据(hirearchicaldata)。象任务表(to-dolist),网页,病历,汽车保险单,配置文件等等,都是XML用武的地方。比如我们拿任务表做例子:
解析这段数据时会发生什么情况?解析之后的数据在内存中怎样表示?显然,用树来表示这种层次化数据是很恰当的。说到底,XML这种比较容易阅读的数据格式,就是树型结构数据经过序列化之后的结果。任何可以用树来表示的数据,同样可以用XML来表示,反之亦然。希望你能懂得这一点,这对下面的内容极其重要。
再进一步。还有什么类型的数据也常用树来表示?无疑列表(list)也是一种。上过编译课吧?还模模糊糊记得一点吧?源代码在解析之后也是用树结构来存放的,任何编译程序都会把源代码解析成一棵抽象语法树,这样的表示法很恰当,因为源代码就是层次结构的:函数包含参数和代码块,代码快包含表达式和语句,语句包含变量和运算符等等。
我们已经知道,任何树结构都可以轻而易举的写成XML,而任何代码都会解析成树,因此,任何代码都可以转换成XML,对不对?我举个例子,请看下面的函数:
能把这个函数变成对等的XML格式吗?当然可以。我们可以用很多种方式做到,下面是其中的一种,十分简单:
这个例子非常简单,用哪种语言来做都不会有太大问题。我们可以把任何程序码转成XML,也可以把XML转回到原来的程序码。我们可以写一个转换器,把Java代码转成XML,另一个转换器把XML转回到Java。一样的道理,这种手段也可以用来对付C++(这样做跟发疯差不多么。可是的确有人在做,看看GCC-XML(http://www.gccxml.org)就知道了)。进一步说,凡是有相同语言特性而语法不同的语言,都可以把XML当作中介来互相转换代码。实际上几乎所有的主流语言都在一定程度上满足这个条件。我们可以把XML作为一种中间表示法,在两种语言之间互相译码。比方说,我们可以用Java2XML把Java代码转换成XML,然后用XML2CPP再把XML转换成C++代码,运气好的话,就是说,如果我们小心避免使用那些C++不具备的Java特性的话,我们可以得到完好的C++程序。这办法怎么样,漂亮吧?
这一切充分说明,我们可以把XML作为源代码的通用存储方式,其实我们能够产生一整套使用统一语法的程序语言,也能写出转换器,把已有代码转换成XML格式。如果真的采纳这种办法,各种语言的编译器就用不着自己写语法解析了,它们可以直接用XML的语法解析来直接生成抽象语法树。
说到这里你该问了,我们研究了这半天XML,这和Lisp有什么关系呢?毕竟XML出来之时,Lisp早已经问世三十年了。这里我可以保证,你马上就会明白。不过在继续解释之前,我们先做一个小小的思维练习。看一下上面这个XML版本的add函数例子,你怎样给它分类,是代码还是数据?不用太多考虑都能明白,把它分到哪一类都讲得通。它是XML,它是标准格式的数据。我们也知道,它可以通过内存中的树结构来生成(GCC-XML做的就是这个事情)。它保存在不可执行的文件中。我们可以把它解析成树节点,然后做任意的转换。显而易见,它是数据。不过且慢,虽然它语法有点陌生,可它又确确实实是一个add函数,对吧?一旦经过解析,它就可以拿给编译器编译执行。我们可以轻而易举写出这个XML代码解释器,并且直接运行它。或者我们也可以把它译成Java或C++代码,然后再编译运行。所以说,它也是代码。
我们说到那里了?不错,我们已经发现了一个有趣的关键之点。过去被认为很难解的概念已经非常直观非常简单的显现出来。代码也是数据,并且从来都是如此。这听起来疯疯癫癫的,实际上却是必然之事。我许诺过会以一种全新的方式来解释Lisp,我要重申我的许诺。但是我们此刻还没有到预定的地方,所以还是先继续上边的讨论。
刚才我说过,我们可以非常简单地实现XML版的add函数解释器,这听起来好像不过是说说而已。谁真的会动手做一下呢?未必有多少人会认真对待这件事。随便说说,并不打算真的去做,这样的事情你在生活中恐怕也遇到吧。你明白我这样说的意思吧,我说的有没有打动你?有哇,那好,我们继续。
重新审视Ant
我们现在已经来到了月亮背光的那一面,先别忙着离开。再探索一下,看看我们还能发现什么东西。闭上眼睛,想一想2000年冬天的那个雨夜,一个名叫JamesDuncanDavidson的杰出的程序员正在研究Tomcat的servlet容器。那时,他正小心地保存好刚修改过的文件,然后执行make。结果冒出了一大堆错误,显然有什么东西搞错了。经过仔细检查,他想,难道是因为tab前面加了个空格而导致命令不能执行吗?确实如此。老是这样,他真的受够了。乌云背后的月亮给了他启示,他创建了一个新的Java项目,然后写了一个简单但是十分有用的工具,这个工具巧妙地利用了Java属性文件中的信息来构造工程,现在James可以写makefile的替代品,它能起到相同的作用,而形式更加优美,也不用担心有makefile那样可恨的空格问题。这个工具能够自动解释属性文件,然后采取正确的动作来编译工程。真是简单而优美。
(作者注:我不认识James,James也不认识我,这个故事是根据网上关于Ant历史的帖子虚构的)
使用Ant构造Tomcat之后几个月,他越来越感到Java的属性文件不足以表达复杂的构造指令。文件需要检出,拷贝,编译,发到另外一台机器,进行单元测试。要是出错,就发邮件给相关人员,要是成功,就继续在尽可能高层的卷(volumn)上执行构造。追踪到最后,卷要回复到最初的水平上。确实,Java的属性文件不够用了,James需要更有弹性的解决方案。他不想自己写解析器(因为他更希望有一个具有工业标准的方案)。XML看起来是个不错的选择。他花了几天工夫把Ant移植到XML,于是,一件伟大的工具诞生了。
Ant是怎样工作的?原理非常简单。Ant把包含有构造命令的XML文件(算代码还是算数据,你自己想吧),交给一个Java程序来解析每一个元素,实际情况比我说的还要简单得多。一个简单的XML指令会导致具有相同名字的Java类装入,并执行其代码。
这段文字的含义是把源目录复制到目标目录,Ant会找到一个”copy”任务(实际上就是一个Java类),通过调用Java的方法来设置适当参数(todir和fileset),然后执行这个任务。Ant带有一组核心类,可以由用户任意扩展,只要遵守若干约定就可以。Ant找到这些类,每当遇到XML元素有同样的名字,就执行相应的代码。过程非常简单。Ant做到了我们前面所说的东西:它是一个语言解释器,以XML作为语法,把XML元素转译为适当的Java指令。我们可以写一个”add”任务,然后,当发现XML中有add描述的时候,就执行这个add任务。由于Ant是非常流行的项目,前面展示的策略就显得更为明智。毕竟,这个工具每天差不多有几千家公司在使用。
到目前为之,我还没有说Ant在解析XML时所遇到困难。你也不用麻烦去它的网站上去找答案了,不会找到有价值的东西。至少对我们这个论题来说是如此。我们还是继续下一步讨论吧。我们答案就在那里。
为什么是XML
有时候正确的决策并非完全出于深思熟虑。我不知道James选择XML是否出于深思熟虑。也许仅仅是个下意识的决定。至少从James在Ant网站上发表的文章看起来,他所说的理由完全是似是而非。他的主要理由是移植性和扩展性,在Ant案例上,我看不出这两条有什么帮助。使用XML而不是Java代码,到底有什么好处?为什么不写一组Java类,提供api来满足基本任务(拷贝目录,编译等等),然后在Java里直接调用这些代码?这样做仍然可以保证移植性,扩展性也是毫无疑问的。而且语法也更为熟悉,看着顺眼。那为什么要用XML呢?有什么更好的理由吗?
有的。虽然我不确定James是否确实意识到了。在语义的可构造性方面,XML的弹性是Java望尘莫及的。我不想用高深莫测的名词来吓唬你,其中的道理相当简单,解释起来并不费很多功夫。好,做好预备动作,我们马上就要朝向顿悟的时刻做奋力一跃。
上面的那个copy的例子,用Java代码怎样实现呢?我们可以这样做:
这个代码看起来和XML的那个很相似,只是稍微长一点。差别在那里?差别在于XML构造了一个特殊的copy动词,如果我们硬要用Java来写的话,应该是这个样子:
看到差别了吗?以上代码(如果可以在Java中用的化),是一个特殊的copy算符,有点像for循环或者Java5中的foreach循环。如果我们有一个转换器,可以把XML转换到Java,大概就会得到上面这段事实上不可以执行的代码。因为Java的技术规范是定死的,我们没有办法在程序里改变它。我们可以增加包,增加类,增加方法,但是我们没办法增加算符,而对于XML,我们显然可以任由自己增加这样的东西。对于XML的语法树来说,只要原意,我们可以任意增加任何元素,因此等于我们可以任意增加算符。如果你还不太明白的话,看下面这个例子,加入我们要给Java引入一个unless算符:
在上面的两个例子中,我们打算给Java语法扩展两个算符,成组拷贝文件算符和条件算符unless,我们要想做到这一点,就必须修改Java编译器能够接受的抽象语法树,显然我们无法用Java标准的功能来实现它。但是在XML中我们可以轻而易举地做到。我们的解析器根据XML元素,生成抽象语法树,由此生成算符,所以,我们可以任意引入任何算符。
对于复杂的算符来说,这样做的好处显而易见。比如,用特定的算符来做检出源码,编译文件,单元测试,发送邮件等任务,想想看有多么美妙。对于特定的题目,比如说构造软件项目,这些算符的使用可以大幅减低少代码的数量。增加代码的清晰程度和可重用性。解释性的XML可以很容易的达到这个目标。XML是存储层次化数据的简单数据文件,而在Java中,由于层次结构是定死的(你很快就会看到,Lisp的情况与此截然不同),我们就没法达到上述目标。也许这正是Ant的成功之处呢。
你可以注意一下最近Java和C#的变化(尤其是C#3.0的技术规范),C#把常用的功能抽象出来,作为算符增加到C#中。C#新增加的query算符就是一个例子。它用的还是传统的作法:C#的设计者修改抽象语法树,然后增加对应的实现。如果程序员自己也能修改抽象语法树该有多好!那样我们就可以构造用于特定问题的子语言(比如说就像Ant这种用于构造项目的语言),你能想到别的例子吗?再思考一下这个概念。不过也不必思考太甚,我们待会还会回到这个题目。那时候就会更加清晰。
离Lisp越来越近
我们先把算符的事情放一放,考虑一下Ant设计局限之外的东西。我早先说过,Ant可以通过写Java类来扩展。Ant解析器会根据名字来匹配XML元素和Java类,一旦找到匹配,就执行相应任务。为什么不用Ant自己来扩展Ant呢?毕竟核心任务要包含很多传统语言的结构(例如”if”),如果Ant自身就能提供构造任务的能力(而不是依赖java类),我们就可以得到更高的移植性。我们将会依赖一组核心任务(如果你原意,也不妨把它称作标准库),而不用管有没有Java环境了。这组核心任务可以用任何方式来实现,而其他任务建筑在这组核心任务之上,那样的话,Ant就会成为通用的,可扩展的,基于XML的编程语言。考虑下面这种代码的可能性:
如果XML支持”task”的创建,上面这段代码就会输出”HelloWorld!”.实际上,我们可以用Java写个”task”任务,然后用Ant-XML来扩展它。Ant可以在简单原语的基础上写出更复杂的原语,就像其他编程语言常用的作法一样。这也就是我们一开始提到的基于XML的编程语言。这样做用处不大(你知道为甚么吗?),但是真的很酷。
再看一回我们刚才说的Task任务。祝贺你呀,你在看Lisp代码!!!我说什么?一点都不像Lisp吗?没关系,我们再给它收拾一下。
比XML更好
前面一节说过,Ant自我扩展没什么大用,原因在于XML很烦琐。对于数据来说,这个问题还不太大,但如果代码很烦琐的话,光是打字上的麻烦就足以抵消它的好处。你写过Ant的脚本吗?我写过,当脚本达到一定复杂度的时候,XML非常让人厌烦。想想看吧,为了写结束标签,每个词都得打两遍,不发疯算好的!
为了解决这个问题,我们应当简化写法。须知,XML仅仅是一种表达层次化数据的方式。我们并不是一定要使用尖括号才能得到树的序列化结果。我们完全可以采用其他的格式。其中的一种(刚好就是Lisp所采用的)格式,叫做s表达式。s表达式要做的和XML一样,但它的好处是写法更简单,简单的写法更适合代码输入。后面我会详细讲s表达式。这之前我要清理一下XML的东西。考虑一下关于拷贝文件的例子:
想想看在内存里面,这段代码的解析树在内存会是什么样子?会有一个”copy”节点,其下有一个“fileset”节点,但是属性在哪里呢?它怎样表达呢?如果你以前用过XML,并且弄不清楚该用元素还是该用属性,你不用感到孤单,别人一样糊涂着呢。没人真的搞得清楚。这个选择与其说是基于技术的理由,还不如说是闭着眼瞎摸。从概念上来讲,属性也是一种元素,任何属性能做的,元素一样做得到。XML引入属性的理由,其实就是为了让XML写法不那么冗长。比如我们看个例子:
两下比较,内容的信息量完全一样,用属性可以减少打字数量。如果XML没有属性的话,光是打字就够把人搞疯掉。
说完了属性的问题,我们再来看一看s表达式。之所以绕这么个弯,是因为s表达式没有属性的概念。因为s表达式非常简练,根本没有必要引入属性。我们在把XML转换成s表达式的时候,心里应该记住这一点。看个例子,上面的代码译成s表达式是这样的:
仔细看看这个例子,差别在哪里?尖括号改成了圆括号,每个元素原来是有一对括号标记包围的,现在取消了后一个(就是带斜杠的那个)括号标记。表示元素的结束只需要一个”)”就可以了。不错,差别就是这些。这两种表达方式的转换,非常自然,也非常简单。s表达式打起字来,也省事得多。第一次看s表达式(Lisp)时,括号很烦人是吧?现在我们明白了背后的道理,一下子就变得容易多了。至少,比XML要好的多。用s表达式写代码,不单是实用,而且也很让人愉快。s表达式具有XML的一切好处,这些好处是我们刚刚探讨过的。现在我们看看更加Lisp风格的task例子:
用Lisp的行话来讲,s表达式称为表(list)。对于上面的例子,如果我们写的时候不加换行,用逗号来代替空格,那么这个表达式看起来就非常像一个元素列表,其中又嵌套着其他标记。
XML自然也可以用这样的风格来写。当然上面这句并不是一般意义上的元素表。它实际上是一个树。这和XML的作用是一样的。称它为列表,希望你不会感到迷惑,因为嵌套表和树实际上是一码事。Lisp的字面意思就是表处理(listprocessing),其实也可以称为树处理,这和处理XML节点没有什么不同。
经受这一番折磨以后,现在我们终于相当接近Lisp了,Lisp的括号的神秘本质(就像许多Lisp狂热分子认为的)逐渐显现出来。现在我们继续研究其他内容。
重新审视C语言的宏
到了这里,对XML的讨论你大概都听累了,我都讲累了。我们先停一停,把树,s表达式,Ant这些东西先放一放,我们来说说C的预处理器。一定有人问了,我们的话题和C有什么关系?我们已经知道了很多关于元编程的事情,也探讨过专门写代码的代码。理解这问题有一定难度,因为相关讨论文章所使用的编程语言,都是你们不熟悉的。但是如果只论概念的话,就相对要简单一些。我相信,如果以C语言做例子来讨论元编程,理解起来一定会容易得多。好,我们接着看。
一个问题是,为什么要用代码来写代码呢?在实际的编程中,怎样做到这一点呢?到底元编程是什么意思?你大概已经听说过这些问题的答案,但是并不懂得其中缘由。为了揭示背后的真理,我们来看一下一个简单的数据库查询问题。这种题目我们都做过。比方说,直接在程序码里到处写SQL语句来修改表(table)里的数据,写多了就非常烦人。即便用C#3.0的LINQ,仍然不减其痛苦。写一个完整的SQL查询(尽管语法很优美)来修改某人的地址,或者查找某人的名字,绝对是件令程序员倍感乏味的事情,那么我们该怎样来解决这个问题?答案就是:使用数据访问层。
概念挺简单,其要点是把数据访问的内容(至少是那些比较琐碎的部分)抽象出来,用类来映射数据库的表,然后用访问对象属性访问器(accessor)的办法来间接实现查询。这样就极大地简化了开发工作量。我们用访问对象的方法(或者属性赋值,这要视你选用的语言而定)来代替写SQL查询语句。凡是用过这种方法的人,都知道这很节省时间。当然,如果你要亲自写这样一个抽象层,那可是要花非常多的时间的–你要写一组类来映射表,把属性访问转换为SQL查询,这个活相当耗费精力。用手工来做显然是很不明智的。但是一旦你有了方案和模板,实际上就没有多少东西需要思考的。你只需要按照同样的模板一次又一次重复编写相似代码就可以了。事实上很多人已经发现了更好的方法,有一些工具可以帮助你连接数据库,抓取数据库结构定义(schema),按照预定义的或者用户定制的模板来自动编写代码。
如果你用过这种工具,你肯定会对它的神奇效果深为折服。往往只需要鼠标点击数次,就可以连接到数据库,产生数据访问源码,然后把文件加入到你的工程里面,十几分钟的工作,按照往常手工方式来作的话,也许需要数百个小时人工(man-hours)才能完成。可是,如果你的数据库结构定义后来改变了怎么办?那样的话,你只需把这个过程重复一遍就可以了。甚至有一些工具能自动完成这项变动工作。你只要把它作为工程构造的一部分,每次编译工程的时候,数据库部分也会自动地重新构造。这真的太棒了。你要做的事情基本上减到了0。如果数据库结构定义发生了改变,并在编译时自动更新了数据访问层的代码,那么程序中任何使用过时的旧代码的地方,都会引发编译错误。
数据访问层是个很好的例子,这样的例子还有好多。从GUI样板代码,WEB代码,COM和CORBA存根,以及MFC和ATL等等。在这些地方,都是有好多相似代码多次重复。既然这些代码有可能自动编写,而程序员时间又远远比CPU时间昂贵,当然就产生了好多工具来自动生成样板代码。这些工具的本质是什么呢?它们实际上就是制造程序的程序。它们有一个神秘的名字,叫做元编程。所谓元编程的本义,就是如此。
元编程本来可以用到无数多的地方,但实际上使用的次数却没有那么多。归根结底,我们心里还是在盘算,假设重复代码用拷贝粘贴的话,大概要重复6,7次,对于这样的工作量,值得专门建立一套生成工具吗?当然不值得。数据访问层和COM存根往往需要重用数百次,甚至上千次,所以用工具生成是最好的办法。而那些仅仅是重复几次十几次的代码,是没有必要专门做工具的。不必要的时候也去开发代码生成工具,那就显然过度估计了代码生成的好处。当然,如果创建这类工具足够简单的话,还是应当尽量多用,因为这样做必然会节省时间。现在来看一下有没有合理的办法来达到这个目的。
现在,C预处理器要派上用场了。我们都用过C/C++的预处理器,我们用它执行简单的编译指令,来产生简单的代码变换(比方说,设置调试代码开关),看一个例子:
这一行的作用是什么?这是一个简单的预编译指令,它把程序中的triple(X)替换称为X+X+X。例如,把所有的triple(5)都换成5+5+5,然后再交给编译器编译。这就是一个简单的代码生成的例子。要是C的预处理器再强大一点,要是能够允许连接数据库,要是能多一些其他简单的机制,我们就可以在我们程序的内部开发自己的数据访问层。下面这个例子,是一个假想的对C宏的扩展:
我们连接数据库结构定义,遍历数据表,然后对每个表创建一个类,只消几行代码就完成了这个工作。这样每次编译工程的时候,这些类都会根据数据库的定义同步更新。显而易见,我们不费吹灰之力就在程序内部建立了一个完整的数据访问层,根本用不着任何外部工具。当然这种作法有一个缺点,那就是我们得学习一套新的”编译时语言”,另一个缺点就是根本不存在这么一个高级版的C预处理器。需要做复杂代码生成的时候,这个语言(译者注:这里指预处理指令,即作者所说的”编译时语言”)本身也一定会变得相当复杂。它必须支持足够多的库和语言结构。比如说我们想要生成的代码要依赖某些ftp服务器上的文件,预处理器就得支持ftp访问,仅仅因为这个任务而不得不创造和学习一门新的语言,真是有点让人恶心(事实上已经存在着有此能力的语言,这样做就更显荒谬)。我们不妨再灵活一点,为什么不直接用C/C++自己作为自己的预处理语言呢?这样子的话,我们可以发挥语言的强大能力,要学的新东西也只不过是几个简单的指示字,这些指示字用来区别编译时代码和运行时代码。
你明白了吗?在<%和%>标记之间的代码是在编译时运行的,标记之外的其他代码都是普通代码。编译程序时,系统会提示你输入一个数,这个数在后面的循环中会用到。而for循环的代码会被编译。假定你在编译时输入5,for循环的代码将会是:
又简单又有效率,也不需要另外的预处理语言。我们可以在编译时就充分发挥宿主语言(此处是C/C++)的强大能力,我们可以很容易地在编译时连接数据库,建立数据访问层,就像JSP或者ASP创建网页那样。我们也用不着专门的窗口工具来另外建立工程。我们可以在代码中立即加入必要的工具。我们也用不着顾虑建立这种工具是不是值得,因为这太容易了,太简单了。这样子不知可以节省多少时间啊。
你好,Lisp
到此刻为止,我们所知的关于Lisp的指示可以总结为一句话:Lisp是一个可执行的语法更优美的XML,但我们还没有说Lisp是怎样做到这一点的,现在开始补上这个话题。
Lisp有丰富的内置数据类型,其中的整数和字符串和其他语言没什么分别。像71或者”hello”这样的值,含义也和C++或者Java这样的语言大体相同。真正有意思的三种类型是符号(symbol),表和函数。这一章的剩余部分,我都会用来介绍这几种类型,还要介绍Lisp环境是怎样编译和运行源码的。这个过程用Lisp的术语来说通常叫做求值。通读这一节内容,对于透彻理解元编程的真正潜力,以及代码和数据的同一性,和面向领域语言的观念,都极其重要。万勿等闲视之。我会尽量讲得生动有趣一些,也希望你能获得一些启发。那好,我们先讲符号。
大体上,符号相当于C++或Java语言中的标志符,它的名字可以用来访问变量值(例如currentTime,arrayCount,n,等等),差别在于,Lisp中的符号更加基本。在C++或Java里面,变量名只能用字母和下划线的组合,而Lisp的符号则非常有包容性,比如,加号(+)就是一个合法的符号,其他的像-,=,hello-world,*等等都可以是符号名。符号名的命名规则可以在网上查到。你可以给这些符号任意赋值,我们这里先用伪码来说明这一点。假定函数set是给变量赋值(就像等号=在C++和Java里的作用),下面是我们的例子:
好像有什么不对的地方?假定我们对*赋给整数或者字符串值,那做乘法时怎么办?不管怎么说,*总是乘法呀?答案简单极了。Lisp中函数的角色十分特殊,函数也是一种数据类型,就像整数和字符串一样,因此可以把它赋值给符号。乘法函数Lisp的内置函数,默认赋给*,你可以把其他函数赋值给*,那样*就不代表乘法了。你也可以把这函数的值存到另外的变量里。我们再用伪码来说明一下:
再古怪一点,把减号的值赋给加号:
这只是举例子,我还没有详细讲函数。Lisp中的函数是一种数据类型,和整数,字符串,符号等等一样。一个函数并不必然有一个名字,这和C++或者Java语言的情形很不相同。在这里函数自己代表自己。事实上它是一个指向代码块的指针,附带有一些其他信息(例如一组参数变量)。只有在把函数赋予其他符号时,它才具有了名字,就像把一个数值或字符串赋予变量一样的道理。你可以用一个内置的专门用于创建函数的函数来创建函数,然后把它赋值给符号fn,用伪码来表示就是:
这段代码返回一个具有一个参数的函数,函数的功能是计算参数乘2的结果。这个函数还没有名字,你可以把此函数赋值给别的符号:
set(times-two, fn [a] {return *(a, 2)}) 我们现在可以这样调用这个函数:
time-two(5)         // 返回10 我们先跳过符号和函数,讲一讲表。什么是表?你也许已经听过好多相关的说法。表,一言以蔽之,就是把类似XML那样的数据块,用s表达式来表示。表用一对括号括住,表中元素以空格分隔,表可以嵌套。例如(这回我们用真正的Lisp语法,注意用分号表示注释):
当Lisp系统遇到这样的表时,它所做的,和Ant处理XML数据所做的,非常相似,那就是试图执行它们。其实,Lisp源码就是特定的一种表,好比Ant源码是一种特定的XML一样。Lisp执行表的顺序是这样的,表的第一个元素当作函数,其他元素当作函数的参数。如果其中某个参数也是表,那就按照同样的原则对这个表求值,结果再传递给最初的函数作为参数。这就是基本原则。我们看一下真正的代码:
上述的例子中,所有的表都是当作代码来处理的。怎样把表当作数据来处理呢?同样的,设想一下,Ant是把XML数据当作自己的参数。在Lisp中,我们给表加一个前缀’来表示数据。
我们可以用一个内置的函数head来返回表的第一个元素,tail函数来返回剩余元素组成的表。
你可以把Lisp的内置函数想像成Ant的任务。差别在于,我们不用在另外的语言中扩展Lisp(虽然完全可以做得到),我们可以用Lisp自己来扩展自己,就像上面举的times-two函数的例子。Lisp的内置函数集十分精简,只包含了十分必要的部分。剩下的函数都是作为标准库来实现的。
Lisp宏
我们已经看到,元编程在一个类似jsp的模板引擎方面的应用。我们通过简单的字符串处理来生成代码。但是我们可以做的更好。我们先提一个问题,怎样写一个工具,通过查找目录结构中的源文件来自动生成Ant脚本。
用字符串处理的方式生成Ant脚本是一种简单的方式。当然,还有一种更加抽象,表达能力更强,扩展性更好的方式,就是利用XML库在内存中直接生成XML节点,这样的话内存中的节点就可以自动序列化成为字符串。不仅如此,我们的工具还可以分析这些节点,对已有的XML文件做变换。通过直接处理XML节点。我们可以超越字符串处理,使用更高层次的概念,因此我们的工作就会做的更快更好。
我们当然可以直接用Ant自身来处理XML变换和制作代码生成工具。或者我们也可以用Lisp来做这项工作。正像我们以前所知的,表是Lisp内置的数据结构,Lisp含有大量的工具来快速有效的操作表(head和tail是最简单的两个)。而且,Lisp没有语义约束,你可以构造任何数据结构,只要你原意。
Lisp通过宏(macro)来做元编程。我们写一组宏来把任务列表(to-dolist)转换为专用领域语言。
回想一下上面to-dolist的例子,其XML的数据格式是这样的:
相应的s表达式是这样的:
假设我们要写一个任务表的管理程序,把任务表数据存到一组文件里,当程序启动时,从文件读取这些数据并显示给用户。在别的语言里(比如说Java),这个任务该怎么做?我们会解析XML文件,从中得出任务表数据,然后写代码遍历XML树,再转换为Java的数据结构(老实讲,在Java里解析XML真不是件轻松的事情),最后再把数据展示给用户。现在如果用Lisp,该怎么做?
假定要用同样思路的化,我们大概会用Lisp库来解析XML。XML对我们来说就是一个Lisp的表(s表达式),我们可以遍历这个表,然后把相关数据提交给用户。可是,既然我们用Lisp,就根本没有必要再用XML格式保存数据,直接用s表达式就好了,这样就没有必要做转换了。我们也用不着专门的解析库,Lisp可以直接在内存里处理s表达式。注意,Lisp编译器和.net编译器一样,对Lisp程序来说,在运行时总是随时可用的。
但是还有更好的办法。我们甚至不用写表达式来存储数据,我们可以写宏,把数据当作代码来处理。那该怎么做呢?真的简单。回想一下,Lisp的函数调用格式:
(function-name arg1 arg2 arg3) 其中每个参数都是s表达式,求值以后,传递给函数。如果我们用(+45)来代替arg1,那么,程序会先求出结果,就是9,然后把9传递给函数。宏的工作方式和函数类似。主要的差别是,宏的参数在代入时不求值。
(macro-name (+ 4 5)) 这里,(+45)作为一个表传递给宏,然后宏就可以任意处理这个表,当然也可以对它求值。宏的返回值是一个表,然后有程序作为代码来执行。宏所占的位置,就被替换为这个结果代码。我们可以定义一个宏把数据替换为任意代码,比方说,替换为显示数据给用户的代码。
这和元编程,以及我们要做的任务表程序有什么关系呢?实际上,编译器会替我们工作,调用相应的宏。我们所要做的,仅仅是创建一个把数据转换为适当代码的宏。
例如,上面曾经将过的C的求三次方的宏,用Lisp来写是这样子:
(译注:在CommonLisp中,此处的单引号应当是反单引号,意思是对表不求值,但可以对表中某元素求值,记号~表示对元素x求值,这个求值记号在CommonLisp中应当是逗号。反单引号和单引号的区别是,单引号标识的表,其中的元素都不求值。这里作者所用的记号是自己发明的一种Lisp方言Blaise,和commonlisp略有不同,事实上,发明方言是lisp高手独有的乐趣,很多狂热分子都热衷这样做。比如PaulGraham就发明了ARC,许多记号比传统的Lisp简洁得多,显得比较现代)
单引号的用处是禁止对表求值。每次程序中出现triple的时候
(triple 4) 都会被替换成:
(+ 4 4 4) 我们可以为任务表程序写一个宏,把任务数据转换为可执行码,然后执行。假定我们的输出是在控制台:
我们创造了一个非常小的有限的语言来管理嵌在Lisp中的任务表。这个语言只用来解决特定领域的问题,通常称之为DSLs(特定领域语言,或专用领域语言)。
特定领域语言
本文谈到了两个特定领域语言,一个是Ant,处理软件构造。一个是没起名字的,用于处理任务表。两者的差别在于,Ant是用XML,XML解析器,以及Java语言合在一起构造出来的。而我们的迷你语言则完全内嵌在Lisp中,只消几分钟就做出来了。
我们已经说过了DSL的好处,这也就是Ant用XML而不直接用Java的原因。如果使用Lisp,我们可以任意创建DSL,只要我们需要。我们可以创建用于网站程序的DSL,可以写多用户游戏,做固定收益贸易(fixedincometrade),解决蛋白质折叠问题,处理事务问题,等等。我们可以把这些叠放在一起,造出一个语言,专门解决基于网络的贸易程序,既有网络语言的优势,又有贸易语言的好处。每天我们都会收获这种方法带给我们的益处,远远超过Ant所能给予我们的。
用DSL解决问题,做出的程序精简,易于维护,富有弹性。在Java里面,我们可以用类来处理问题。这两种方法的差别在于,Lisp使我们达到了一个更高层次的抽象,我们不再受语言解析器本身的限制,比较一下用Java库直接写的构造脚本和用Ant写的构造脚本其间的差别。同样的,比较一下你以前所做的工作,你就会明白Lisp带来的好处。
接下来
学习Lisp就像战争中争夺山头。尽管在电脑科学领域,Lisp已经算是一门古老的语言,直到现在仍然很少有人真的明白该怎样给初学者讲授Lisp。尽管Lisp老手们尽了很大努力,今天新手学习Lisp仍然是困难重重。好在现在事情正在发生变化,Lisp的资源正在迅速增加,随着时间推移,Lisp将会越来越受关注。
Lisp使人超越平庸,走到前沿。学会Lisp意味着你能找到更好的工作,因为聪明的雇主会被你与众不同的洞察力所打动。学会Lisp也可能意味着明天你可能会被解雇,因为你总是强调,如果公司所有软件都用Lisp写,公司将会如何卓越,而这些话你的同事会听烦的。Lisp值得努力学习吗?那些已经学会Lisp的人都说值得,当然,这取决于你的判断。



作者: 何俊    时间: 2016-10-17 20:35
站在世界顶端的朱老师
作者: 残虹断梦    时间: 2016-10-17 20:55
C语言渣的要死,暂时只能仰望
作者: 六步上篮    时间: 2016-10-18 09:07
朱老师威武
作者: luckner    时间: 2016-10-18 10:04
是时候挑起一场战争了

PHP是最好的XXXX
作者: 永远的记忆    时间: 2016-10-18 21:50
朱大神

作者: shen1994    时间: 2016-10-19 16:16
偶像诸葛大神!!!
作者: 东方斗魂    时间: 2016-10-20 21:17
膜拜

作者: xiao_fang    时间: 2016-10-21 17:08
编程界有一本传说中的圣书,叫《计算机程序的构造与解释》(SICP)
作者: Quixote    时间: 2016-10-22 21:26
xiao_fang 发表于 2016-10-21 17:08
编程界有一本传说中的圣书,叫《计算机程序的构造与解释》(SICP)

只是入门课程

作者: 361369499    时间: 2016-10-22 23:47
用函数式语言就像是做数学题,怎么学都学不会。相比之下还是ruby可爱
作者: feisikaer12138    时间: 2016-10-23 17:23
我就喜欢看朱老师的帖子,总能开拓眼界




欢迎光临 智能车制作 (http://111.231.132.190/) Powered by Discuz! X3.2