-
-
Save emptymalei/a4b34b118c853431eeb1 to your computer and use it in GitHub Desktop.
Draft
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
好吧,本来我是想着我自己想起什么来就记上的,gist 这玩意也没法合作,所以就用评论吧。 | |
1. 在自己公司自由的做科研的感受是什么?(跟大学比?) | |
2. 完全自由的 AI 的实现最大的障碍? |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
关于你的产品
人们说 wolfram alpha 是第一个实用的ai。你觉得自己是一个ai研究者吗?你做它的目的,是帮助人思考,还是替代人思考呢?
“人工智能”是一个很模糊的概念。我和ai打交道这么多年里,ai从让人激动的概念变成了“毫无希望”的领域,现在它又东山再起,流行起来了。四十多年前,我就想做一个像Wolfram Alpha这样的东西。当时,我觉得要做一个这样的工具,必须先制造出通用ai,这很困难,所以我没有沿这个方向继续做下去。但后来,由于我所做的研究,我意识到其实不需要通用ai,也能提供计算性知识。这就是我发明wolfram alpha的原因。我们想制造出“聪明”的系统,而现在我们有了Wolfram Language作为平台,在这个基础上我们就能实现智能系统的目标。我把自己看成一个工具的制造者,而拿这些工具做什么呢?把我们这个文明的一切知识汇聚起来,形成框架,让新的知识能够自动在它的基础上生产出来。
目前有很多试图帮助人思考的工具,比如有iPython Notebook交互文献,Coq自动定理证明,Semantic Web的语义尝试,wikipedia的互联知识网,这些都在做出尝试。你觉得wolfram和它们有什么本质的差异吗?你对它有没有什么宏大计划呢?
当然有计划,毕竟我都在它上面花了三十年,怎么能没计划嘛。我们试图做的事情,是把知识转化成“计算形态”。维基百科是个好东西,我们可以在上面读文章;很多工具在搜索网络,整理网络,为人们提供知识;但我们所做的,是把知识变成可以用来计算的东西。
Wolfram Language的进展如何了?
刚开始嘛。很多人对它很感兴趣。现在我们有一个云端的版本,beta早期,但有很多创业公司开始用它构筑东西。也有很多人希望用它作为教学语言,因为它有很多自动化的成分,所以孩子们比起专业程序员的劣势也不那么大。
未来会向免费和开源方向发展吗?为什么?
开源在一些事情上是好的,另一些则不是。一般来说,当一个项目需要领导、需要整体设计的时候,开源是很难实现的;而我们过去二十年来正是这样的项目——创造从未有过的东西。另一个因素是,这种语言用到了很多很多的知识,其中有些知识属于我们,另一些知识则来自别人,我们不能就这么简单地说,“这一切都是免费的!”但是wA是免费的服务,我们提供这项服务本身是不赚一分钱的。这没问题,但这本身是无法长久维持的,所以我们在它的基础上提供很多别的服务,并从中营利。我的信念是,建立一个经济-生态系统的最好办法,就是让那些从中获得价值的人们也为之付费。这是最简单的方式。至于WL,使用它的在线版来学习和实验是免费的,事实上大部分创业公司一开始都会免费使用一段时间,一旦他们投入生产,真正有了买卖上门,那时他们才需要为此付费。但其实这个模式和常见的模式差别也不是那么的大。很多所谓的开源解决方案,其实是陷阱。最著名的陷阱就是安卓:系统本身是免费的,但你要支付专利费。还有些别的例子,东西本身是免费的,但你自己没法建立这个系统,你得求助专业人士,最后还是得付钱让他们在云端建立系统。所以我们做的,其实是在经济问题上坦诚相见,让人们可以免费地学习和试用,但当他们在此基础上盈利的时候,就要为此付钱。如果他们选择了开源的方案,那么就没人知道他们什么时候要付专利费或者云端服务费。我们所做的只是让事情简单化,让人们理解会发生什么。
你觉得你的产品受到了硬件计算能力的限制吗?
不怎么觉得。我面临的挑战是在软件上找到巧妙的方法,我不觉得底层的硬件是什么限制。当然多年前我刚开始使用计算机的时候肯定是受限制的,但是我们自动化的速度,
其实制约因素是,一个人从想法到可以运行的软件,这个过程要花多长时间。软件本身运行所花的时间很少成为瓶颈。我们有很多两极分化的软件,比如眼下,像机器学习这样的程序,要运行很多个CPU年才能得到结果,如果能快一些,这当然好,但毕竟没有那么重要。当然还有别的因素,比如现在中国网络连接的不稳定性———某种意义上这也算是硬件问题吧,不过这是另一个话题了。所以关键还是我们人类能否做出好软件。
在某些场合下,更快的硬件是有意义的——比如现在移动设备上,为了提供一个用户界面能让人类感到使用自如,硬件至少需要达到一定的水准。一部分移动设备上我们还做不到这一点。但这是相对次要的问题。
我们之前采访过侯世达。对于他的路线——遵循类比、模仿人类思维——你怎么看待?
我认识他,我无法评判他的具体研究内容,但对于他的大致方向——理解人类的智能——我的看法是:这既是错误的路线,又是唯一可行的路线。
一方面,如果说我们的目的是创造智能系统,那么这条路线与之无关,正如研究鸟类如何飞行与制造飞机无关一样。特别是在所谓“通用推理人工智能”上,人们曾经说它才是能够回答问题的系统,但没有人成功;而我们的WA却成功地回答了许多问题。我们如何做到的?通用推理人工智能,所做的是推理。面对物理问题,从一个事实推理出下一个事实,就像中世纪的哲学家那样。而我们做的,则是某种意义上“作弊”了:使用我们文明积累下来的全部知识,面对物理问题,我们用已知的全部科学和数学确立一个方程,然后把结果计算出来。在这里,我们使用的方式和人类思考问题的方式截然不同,但效率要高很多。大部分眼下的智能系统都是这样。
但另一方面,如果我们的目的是真正的“终极”智能呢?我们现在的计算能力,和大脑比起来都可以说相当不错了,但是如果要为这些计算设定一个目的,必须有人类的参与。我们的系统可以想算什么就算什么,但没有人为它指明目标,它什么也做不了。世界上没有所谓“纯粹”的智能,它必须和人类目标紧密相连。侯世达的路线对解决任何具体的智能问题都没有什么帮助,但对理解我们的目的却至关重要。
为什么人类有目的,机器就没有呢?你觉得区别在哪里呢?
这是个好问题。水有向下流的“目的”,你可以为物理世界赋予各种各样的“目的”,但所谓的目的其实有两种,一种是遵循物理机制自然会产生的结果,另一种则是努力要去实现的目标。自然界的计算能力完全可以和人脑像匹敌,但自然界的目的全都是前者,而如果我们希望得到类人智能,必须要有类人的目的。比如湍流,或者木星大气表面的漩涡,它在做各种各样繁复的计算,恐怕比我们的大脑更加复杂——至少是运算量更大,但它看起来并未获得我们所说的智能,因为我们唯一知道的智能,就是人类智能。
你相信技术奇点吗?
不相信,至少不是人们通常说的那种奇点。许多人说奇点的时候,想象的一个重要特征就是人类永生。这迟早是能实现的,可能部分来自生物学,部分来自数字世界,这些科技都会在某一天到来。这时看起来就像是抵达了奇点一样——人类和智能有了无限的时间去发现新事物。但是每年新发现的东西就会因此而指数爆炸直到无限吗?我不这么认为。也许我有偏见吧,人类智能是个连续谱,而我很幸运,我自己位于这个谱的上面那一端;但是在我看来,这些智力并没有质的区别。在一个“更高智能”的眼中,这个世界看起来会不一样吗?其实我们并不清楚。在我看来,就算你的智商有200甚至1000,恐怕也不会让你懂得一些别人不可能懂的东西。能不能把更多的知识整合起来?当然可以。假如说我们现在大脑每秒接收100兆的信息,我们当然可以想象一个智能系统每秒可以接收并处理上千兆的信息,但我不认为这谈得上是“更高的智能。”
你在书里说,决定性的元胞自动机也可以产生出足够的不可预测性,你觉得我们的世界需要随机性吗?我们能不能构建出一个决定性的有自由意志的虚拟世界?
我觉得我们不需要。很多时候人们说的“随机性”,其实是建模时用的黑箱:我不了解一个系统的全部规则,所以我假定这个系统里有某些额外的因素在提供“随机”的输入。这个意义上的“随机”,只是证明你还没为这个系统建立完整的模型而已。但我们能为宇宙建立一个完整的模型吗?我的工作假说是“能”。也许这假说是错的,也许出于什么原因我们就是无法为宇宙建立完整模型——但是我还没有见到相关的证据。所以我会朝这个目标而努力。一旦我们得到了完整模型,随机性就消失了,没有任何来自外部的不可预知的因素。我有个朋友名叫格里高利·蔡廷,他对于算法随机性这整个领域非常感兴趣,他有一个著名的发现叫做“欧米伽数”(即蔡廷常数),这个数字虽然是个确定的数,但任何图灵机都计算不出来。我和他观点的区别就是,我认为宇宙像 pi一样,虽然无穷无尽但可以计算到任意精度,而他始终认为宇宙像欧米伽,我不知道为什么。
如果我们建立了宇宙的模型,是否意味着我们就没有自由意志了呢?
我在我的书里讨论了一个概念,叫做“计算不可化约性”(Computational irreducibility)。这意味着,就算你知道了一切规则,你可能也无法提前预测这些规则将会做什么——唯一的办法是实地运行这些规则看看它们到底会做出什么来。“自由意志”这个词包括很多层面,如果我们能预测我们将会做出什么事情来,那可以说我们没有自由意志。比如说,看一只蛾子反复地撞击玻璃窗,试图飞出去,我们会说它看起来没有自由意志的样子,似乎是决定性的反射机制。但如果我们看到一个人在做一件非常复杂的行为,我们会说他看起来好像在作出选择,因为我们无法预测他将会怎么做——在这个意义上,我们拥有自由意志。我们的历史必须按顺序逐渐上演,你不能说“我已经知道结局了,快进到头吧”;历史是必不可少的。世界的底层规则是简单的、决定性的,但是这些规则生成的人类行为却极端复杂,这之间的计算鸿沟无法化约,因此我们的行为是“自由”的。
会不会有一天,我们对大脑已经有足够的了解,可以监控到足够的信息,可以说“十秒钟之后这个人会想这件事情”?这时人们还有自由意志吗?我不知道。这一点已经部分地在鸟类中实现了,我们能大致预测出鸟类下一秒会唱什么样的歌。但我还是觉得,自由意志这个概念的根源只是因为要预测未来所需的计算量太大;就算我们发现了宇宙的全部规律,要么我们得想办法进行和宇宙同样的运算,要么我们就看着宇宙自己这么算下去。
物理和数学的关系是怎样的呢?
如果我们真的建立了宇宙的模型,一切都可计算,那么全部物理问题就都还原成了数学。但什么是数学呢?数学是建筑在公理系统上的,比如欧几里得的公理系统;在此基础上我们推导出一系列的形式知识。至于选择什么样的公理,可以是人为武断选择、得到纯粹抽象的数学知识,也可以选择那些和现实世界对应的公理。欧几里得认为他选择的公理是对应现实的,但后来数学家开始做出武断的选择。数学是个抽象的领域,它不会被现实的物理限制。
你做了很多自我数据分析(比如统计自己都在啥时候打电话)的工作。你为什么要这样做?有没有从中发现一些有趣的东西呢?你们什么时候能推出一款大众也能使用的自我追踪软件呢?
我搜集这些数据是因为我对数据感兴趣。我有几套系统,负责检查我昨天锻炼了多少、完成了多少工作这样的事情。我已经搜集了二十五年的数据,时不时地我会对这些数据分析一下,会发现各种各样的结果。但这些数据的真正宝贵之处是,当我对自己有什么问题的时候,我能很容易找到答案。比如有一次我买了个新键盘,我想知道有了它打字速度是快了还是慢了,只花几分钟我就得到了答案。眼下我正打算回答一个难一些的问题,就是对我发的电子邮件进行情绪分析,来判断哪些事情会让我开心,哪些会让我不开心。我所发现的大多数结果,都是事后想来“嗯,的确如此”的那种;但如果没有看到这些数据,我是不会往那个方向上思考的。
在自己的公司做研究和在大学做研究,你觉得有什么差异?
公司的效率要高得多。对我来说,公司就像是把想法变成现实的机器,我会努力为了这个目的而优化这台机器,而在大学里你就没法做这样的优化。
你多次辍学,你觉得学历这个东西是什么意义呢?
其实我不是真的“辍学”。我在英国去的是顶尖的中学,我离开的原因是我得到了顶尖大学的奖学金,所以我只是碰巧比别人离开得早几年而已。在大学里,我得到了直接进入研究生学习的机会,所以我想既然如此,为什么要花这么多年当本科生呢。我很幸运能在二十岁就完成我的学业阶段,因为我觉得我没有耐心再学那么多年。我对解决别人解决过的问题从来都没有兴趣,所以我一直很讨厌课本上的习题。也许这是我个人的傲慢吧,我只是希望我在做独一无二的事情,而不是别人做过的事情。在某些教育系统里,有很多的内容是围绕“学习一个过程”而展开的,但我觉得发挥人们潜力最好的方式,是让他们学习自己感兴趣的东西,而不是让他们沿着确定的道路前进。
你有粒子物理学博士学位,后来为什么不做物理了呢?
我没有离开物理呀,我时不时地还会回到物理问题。我在《一种新科学》里就讨论了很多物理问题。我对各种各样的问题都感兴趣,特别是宇宙的最本质特性,这也是促使我学习粒子物理的原因,但我学了之后发现粒子物理的细节并不是宇宙的本质,而诸如复杂系统的特性这样的问题要比物理学更加基本。你可以把这些研究想象成一般性的物理原则。对于宇宙的具体物理特性我依然感兴趣,我希望有一天能把一般性的物理原则应用在上面。当希格斯玻色子得奖的时候,我在美国起了个大早看视频直播,我意识到现场有很多好多年没见的老朋友,他们一直留在物理学界。他们介绍希格斯玻色子的时候我想,“这些我都知道呀,四十年前我就是在做这些东西。”我想我完全可以留在物理学界,四十年来一直就做这样的研究,我觉得我还算挺擅长这些的。但是因为我转行做了许多其他别的内容,我所弄明白的东西,哪怕限定在物理学里,也比留在物理学界做单一领域要多得多。我的人生里有一件事情让我印象深刻,那就是研究许多不同的东西能让人学到更多,哪怕你的目标只是解决一个问题,也是如此。在这一点上我很幸运。
你说你最喜欢的发现是Rule30,为什么呢?
这是我发现的第一个元胞自动机规则,这是一个戏剧性的例子,表明一个简单的生成规则如何诞生出复杂的行为。我喜欢拿它和科学史上的案例对比:当伽利略发现木星的卫星的时候,这就是一个迹象,表明物理学的定律适用于整个宇宙。在我看来, rule30让我意识到,在计算的宇宙中凭借简单规则可以出现一些非常复杂的现象,这并不是显然的。这是第一个明确的案例。今天的科学和技术,很多都是依靠搜寻这个计算宇宙中的可能程序,寻找在行为上满足我们需求的那些。正是简单程序可以产生复杂行为这一特征使之成为可能。在我写《一种新科学》的时候,我做出了一个预测:审视一下新出现的关于自然界的模型,我们会看到,基于程序的发现,将逐渐取代基于方程的发现。我预测在五十年内,挖掘计算空间所产生的科技要比传统方式更多。那是十二年前的事情,我们还有三十八年,我们还站在这个趋势的开端。