当前位置: 首页 > news >正文

如可做网站企业公司网站开发

如可做网站,企业公司网站开发,wordpress ovz安装,优化网站性能监测来源#xff1a;集智俱乐部 作者#xff1a;东方和尚1931年#xff0c;天才数学家图灵提出了著名的图灵机模型#xff0c;它奠定了人工智能的数学基础。1943年#xff0c;麦克洛克 皮茨#xff08;McCulloch Pitts#xff09;两人提出了著名的人工神经元模型…来源集智俱乐部 作者东方和尚1931年天才数学家图灵提出了著名的图灵机模型它奠定了人工智能的数学基础。1943年麦克洛克 皮茨McCulloch Pitts两人提出了著名的人工神经元模型该模型一直沿用至今它奠定了所有深度学习模型的基础。那么这两个开山之作究竟是怎样一种相爱相杀的关系呢天才数学家冯诺依曼指出图灵机和神经元本质上虽然彼此等价我们可以用图灵机模拟神经元也可以用神经元模拟图灵机但是它们却位于复杂度王国中的不同领地。神经网络代表了一大类擅长并行计算的复杂系统它们自身的结构就构成了对自己最简洁的编码而图灵机则代表了另一类以穿行方式计算的复杂系统这些系统以通用图灵机作为复杂度的分水岭一边系统的行为可以被更短的代码描述另一边我们却无法绕过复杂度的沟壑。而先进的深度学习研究正在试图将这两类系统合成为一个神经图灵机。全书纲要冯·诺依曼的遗产寻找人工生命的理论根源探寻计算的“原力”  第二堂课控制与信息理论  第三堂课信息的统计理论  第四堂课大数之道  第五堂课复杂自动机的一些考量——关于层次与进化的问题在翻译过程中做了以下的添加和修改1、为了方便阅读为原文进行了分段并加上了段标题2、为了让读者感觉更亲切加上了若干副插图。3、为原文添加了大量的评论东方和尚的评论和张江老师的评论都会标注出来另外因为这本书是冯·诺依曼的助手 Arthur W. Burks(遗传算法之父 John Holland 的博士生导师)所以在框中的文字是编者加的注解。大家要注意分辨。概述编者Arthur W. Burks注冯·诺依曼说信息理论包括两大块严格的信息论和概率的信息论。以概率统计为基础的信息理论大概对于现代计算机设计更加重要。但是在此之前我们必须先弄清楚严格的信息论那部分它其实就是形式逻辑的另一种处理方式。他接下来解释了一些形式逻辑的基本概念简要地说明了真值函数的连接词比如“与”“非”“如果…那么”“与非”以及它们之间的相互定义性。他还解释了变量和量词包括“全称”量词和“存在”量词。他的结论是“如果你有这样的一台计算机就可以表达一切数学计算或者能够纯粹地用数学计算表达出的任何主题。”对于计算机我不打算深谈。因为存在另外一种不一样的机器同信息理论也很有关系就是 McCulloch Pitts 提出的神经网络理论你可以说图灵机和 McCulloch Pitts 的神经网络分别处于信息理论的两个极端。这两套理论都力图建立一个公理化的体系用某种假设的理想机器来建立形式逻辑系统但并不实际去制作这样的机器。他们都成功地说明了形式逻辑同他们设想的机器是完美兼容的也就是说机器能做到的一切工作都能够被形式逻辑所刻画反过来任何能够用形式逻辑描述的事物也都能够用这类机器来运行。编者Arthur W. Burks注冯·诺依曼这里假设了 McCulloch Pitts 的神经网络有着一条无限长的纸带结果表明了它同图灵机的等价性。这个结果也就是图灵可计算性、函数的 λ 可定义性、以及一般递归的概念。请参见图灵的论文“可计算性和 λ 可定义性Computability and λ-Definability”我会简单地介绍 McCulloch Pitts 的神经网络以及图灵的工作。因为它们各自代表了一种重要的研究方式组合方法和整体方法。McCulloch Pitts 描述了一套方法由非常简单的零件组成复杂结构。因此只需要对底层的零件作公理化定义就可以得到非常复杂的组合图灵则是对于整个自动机进行了公理化的定义他仅仅定义了自动机的功能并没有涉及到具体的零件。McCulloch Pitts 的神经网络McCulloch Pitts 的工作具有很明确的目的就是为了研究人类的神经系统而提出一套简单的数学逻辑模型。结果惊喜地发现这个模型跟形式逻辑等价这部分实现了 McCulloch Pitts 的研究目标但仅仅是一部分。他们的模型研究的是神经本身我之前也对这个问题很感兴趣。为了能够切入本质而不被神经系统的生理和化学的具体细节所干扰他们使用了一套公理化方法用几个简单的假设来描述神经的行为。在此我们暂时先不管这些假设具体是怎样实现的同实际又是否一致。他们接下来又对神经元作了进一步的理想处理。这一步引来了许多指责但在我看来却是完全合理的。McCulloch Pitts 并没有按照实际的情形去公理化神经元而是设计了一种完全理想化的模型它要比实际的简单许多。他们相信这一极度简化的模型包括了神经元最核心的那些特性而所有的其它性质只是无关紧要的细节在初步研究中应当忽略。我认为科学界还需要很长的时间才能完全认同他们的观点。我们并不知道在简化模型中被忽略的那些细节是否真的无关紧要但至少在理想化处理以后神经网络变得相当容易理解了。神经元的定义如下我们也许应该把它叫做形式神经元因为它并不是真正的神经细胞而是仅仅具有神经细胞的一些关键性质。我们用一个小圆圈代表一个神经元从圆圈延伸出的直线则代表神经突触。箭头表示某神经元的突触作用于另一个神经元之上也就是信号的传送方向。神经元有两个状态激发和非激发。我们无需关心激发具体是什么意思因为激发的主要性质通过实际运行来体现。这儿有一点点循环定义所谓激发态就是能够激发别的神经元的状态。大致在神经网络的末端处于激发态的神经元会激发某些非神经元的东西来实现其目的。比如肌肉会受刺激从而产生身体的运动或者刺激某种腺体产生化学变化分泌荷尔蒙之类。所以神经激发最终产生的结果是我们研究范围以外的事情我们不考虑这类现象。McCulloch-Pitts 的神经元模型译者加编者Arthur W. Burks注冯·诺依曼说明了控制神经相互作用的原理根据 McCulloch Pitts 模型他也假设神经激发之间有一段均匀的延迟虽然他们暂且不考虑“神经疲劳这一重要现象也就是说神经被激活之后有一段时间因疲劳而对刺激失去反应”这种神经疲劳对于生命功能有着重要的作用。但是就算存在疲劳因素我们还是可以用串联神经元的办法来实现连续的运动。冯·诺依曼还定义了神经阈值提出了抑制性突触的概念用小圈而不是箭头来表示[48]接下来冯·诺依曼讲解了“McCulloch Pitts 的重要结论”想象有一个具有若干输入和唯一输出的黑箱。再选择两个时间点t1 和 t2并确定从 t1 到 t2 何种输入组合会导致输出何种输入得不到输出。不论你如何选择这些条件总可以在黑箱里设计一套神经网络来实现这些条件。这意味着神经网络在一般意义上是同符号逻辑等价的。这是一个事实即任何被设计出来的系统都可以用有限长度的描述来严格表示因此他们是等价的。这里我不打算证明它因为任何形式系统的证明都是冗长且困难的。编者Arthur W. Burks注这里简单说一下证明的方法按照冯·诺依曼所说所有的开关函数真值函数、布尔函数都可以用确定延迟的神经网络来实现。利用循环的方法我们可以用神经元来实现任意容量的内存并附加到以上的开关函数上。这就相当于给一套符号逻辑加上了一根无限长的纸带也就是实现了图灵机。因此对于每一台图灵机 M总可以制造一套等价的神经网络计算得到同样的数字。抑制不能传递的神经网络编者Arthur W. Burks注冯·诺依曼展示了如何建立一些样例网络。如上图a 可以抑制 bb 可以抑制 cc 又可以抑制 a。如果输入端被激发箭头处输入且抑制端箭头处输入没有激发则神经元进入激活状态。根据此规则如果 a 和 b 都被激发那么 α 会激发而 β 不激发如果 b和 c 都被激发那么 β 会激发而 γ 不激发并且如果 a 和 c 都被激发那么 γ 会激发而 α 不激发。冯·诺依曼利用这个例子来说明人类行为的不确定特性比如 a 比 b 强b 比 c 强照理说应该 a 比 c 强。但是在上面的神经网络中间虽然 a 比 b 强b 比 c 强c 却又比 a强。下面冯·诺依曼组合基本神经元得到了几个其他的神经网络简单的存储器计数器基本的学习电路。也就是《冯·诺依曼著作选》5.342-345 中的电路。学习电路有两个输入端a和 b。如果 b 接着 a 之后受到一次刺激则该电路会记录一次当这个数字达到 256 以后无论 a 是否受到刺激一旦 b 受到刺激电路都会发出一次脉冲。请大家注意这些电路虽然看上去很复杂但是从它们的组合方式去观察却很简单。而且它们的复杂度与语法的复杂度相当。如果你能用一句话来描述它们的功能那么你就能毫不费力地把电路图画出来。其实McCulloch Pitts 得到的结论也就是图形描述和语义描述没有太大的区别。中继元件的组合描述是和严格的语义描述完全兼容的。我想阐述一下这个观点的哲学引申。根据上述观点可以推论只要能够用人类语言描述的东西都能够用神经元方法表示出来。同时神经元并不需要有超常的聪明程度及复杂程度。事实上这种理想的模型甚至不必有真实的神经元那么聪明或复杂因为简化后的神经元虽然以死板的、缺乏变化的方式运行却已经能够做到一切你想得到的事情了。另一方面McCulloch Pitts 没有说的事情当然也同样重要。首先不是说我们这样设计出来的电路一定存在于自然界中。其次不是说在这个简化处理中神经元被忽略的那些功能是无关紧要的。最后虽然理论上我们可以用神经元电路描述任何事情但这并不是说实际上得到这样的描述就会很简单。换个角度讲就像人类神经活动一样也许你能够理解所有单个神经元的运作原理但是你仍然解释不了这些神经元的整体涌现结果。没有轮廓的三角形但是你的眼睛却可以帮你勾勒出它的轮廓译者加当你看到一个三角形的时候你认识到“这是一个三角形”知道它的大小。怎么解释这个事实呢三角形的几何定义是很简单的就是三根直线的组合。但是实际上三角形的辨认是非常任意的。比如三条边是弯曲的、只能看到三角形的顶点插入一张三角形的视觉补偿图片、三角形用阴影表达等等在这些情况下你都可以认出其中的三角形来。但是如果你要把所有的这些情况都放到三角形的程序描述中那么这个描述就会变得无限的冗长。不仅如此辨认三角形的能力仅仅是你辨认几何图形的能力中间的极小一部分几何图形的辨认能力又只不过是视觉认知能力的极小一部分。理论上你都可以给这些能力写出具体的描述出来。但是这并不是解读一张图片真正的视觉机制因为要“进入”一张图片之后你才能把意义赋予它。这是超越图形范围以外的事情因此不能够用以上的几何图形方式来描述。比如给你看一张墨水染成的抽象图案每个人都会把自己的理解放进图片中但是这些放进去的东西取决于这个人过去的经历和他的人格而不能在图片本身中找到。所以心理医生可以利用此类方法来对人进行心理测试。这些看上去好像是一些零碎的事情但基本的事实是人的大脑超乎想象的复杂其中有五分之一都是用于视觉处理的。所以按照我们之前的估算大约有 20 亿个神经元是专门用于建立视觉图形的。除了直接描述视觉大脑以外现在我们还没有别的更简单的办法去描述什么成分构成了视觉类比visual analogy。不同层次的复杂性一般地说自动机的文字描述应该比给出自动机的全部设计图纸要简单。但是这个结论也不是在所有情况下都成立。在形式逻辑中只要自动机的结构不是非常复杂那么它的文字描述的确要比自动机本身简单。但在复杂度很高的情形下实际的自动机结构反而要比它的描述更简单一些。我实际上正在用自己的方式解释一条非常漂亮的逻辑定理这是由哥德尔曾经提出的一条定理从逻辑上说对于一个对象的描述要比这个对象本身高一个级别。因此渐进地说前者总是比后者要长。我觉得为了理解这种性质必须运用上述定理因为在你去深入研究这件事情的时候你已经触及到复杂度这个概念的本质。有理由怀疑在一切模糊的、难以定义的事物背后都存在着复杂度渐近的性质比如“看上去相似是什么意思”给人的感觉是不管你用多少文字都没有办法把问题彻底描述清楚。这类事物就属于高复杂度的情况也就是实际去做让机器实际去运行反而比直接描述它要更快。因此在这种情况下电路本身的执行要比描述出电路所有的功能和可能的条件更快。形式神经网络能够做任何你能用文字描述出来的事情这个理念非常重要在复杂度不太高的时候这种处理方法能够非常大程度地简化问题。但是在复杂度很高的情形下定理所描述的情况则完全有可能相反也就是逻辑电路反而比文字形容更加简单。编者Arthur W. Burks注冯纽曼在讨论完图灵机之后再次提到了这个问题。冯纽曼接着举了两个例子说明理想化的神经元并不能解释实际的神经细胞是如何实现某一个具体功能的。在第一个例子中一束神经元被用于传送某一个连续的数字用来代表血压之类的身体指标。神经元并不是用二进制的方法来表示这个数字而是以发射的频率来代表血压的高低血压越高则发射越频繁。可以用神经疲劳来解释这个现象一旦神经发射之后会有一段时间的疲劳期在其中神经细胞不应激而之后的刺激越强则神经细胞离开疲劳期应激的速度就越快。接下来的问题是“为什么自然界从未使用二进制而是使用脉冲频率的方法来表示大小呢”冯纽曼说他对这类问题很感兴趣。他提出了一个猜测频率调制的表示方法比二进制要更加可靠请参见下面的1.1.2.3节以及《计算机与人脑》的77-79页还有冯纽曼的著作选集5.306-308以及5.375-376。有关记忆编者Arthur W. Burks注第二个理想神经元同实际不符的例子是关于记忆的实现。冯纽曼之前用理想神经元建立过存储器电路。他说这样的内存电路可以做到任意大。但他觉得实际上自然并不是用这样的机制来实现记忆的。这不是自然界实现记忆的机制原因很简单像神经元这样的开关元件很容易疲劳因此要实现1bit的信息储存一个神经元是远远不够的可能要十几个以上这是一种严重的浪费因为开关元件并不适合用作储存信息。对于人工制造的计算机器如世界第一台计算机ENIAC中内存不足一直是一个制约效率的严重问题。虽然ENIAC由庞大的2万个电子真空管组成它的内存容量却只有可怜的20位数字。这个尴尬局面就是因为把真空管或者说开关元件用来干它不适合干的工作所导致的。只要把内存实现的机制加以修改计算机器的效率就可以大大提升[49]。神经元结构人类神经系统的内存需求可能是非常巨大的估计其数量级为10的16次方。关于这个估计本身是否合理我不想多讨论因为说不清楚。但是我相信因为人脑神经元的数量仅为 10 的 10 次方远不足以储存这样巨大的记忆容量我们最好老老实实地承认对于记忆究竟是什么我们还一无所知。当然我们可以做各种各样的猜测比如认为记忆是神经突触的某种细微变化因此不受上述数量级的限制等等。我不知道有没有什么证据证明这种猜测但是我想应该没有。你可能怀疑神经细胞远不仅仅是开关电路那么简单多余的功能就包括记忆的实现但是事实上我们什么也不知道。很可能记忆的实现是同神经元是完全不同性质的机制[50]。寻找记忆元件的主要困难是因为记忆似乎无处不在。很难在大脑中间简单地定位任何东西因为大脑具有强大的自组织能力。即便是你找到某一个特定部位所对应的功能在手术切除大脑的相关部位之后很可能大脑会进行重新组织重新分配各部分的职责从而使得这种功能因此又得到了恢复。大脑具有相当强大的灵活适应能力因此难以给不同部位确定具体的功能我怀疑在所有的大脑功能中间记忆是分布得最广泛的。[参见《计算机与人脑》63-68 页[51]五、图灵机我这里想要提两件事[疲劳和内存]在 McCulloch Pitts 对神经系统的分析中间明显没有提到它们之后再说一说图灵机。McCulloch Pitts 最后得出结论认为公理化的神经元体系同形式逻辑是等价的。图灵则得到了反向的结果图灵感兴趣的是形式逻辑而不是自动机。他想要证明形式逻辑中的一个重要猜想也就是所谓的可计算判定问题。这个问题是问对于一类逻辑表达是否存在着一套固定方法来判定这个表达式的真假。图灵之所以讨论自动机其实是为了给他的可计算性证明提供一个铺垫让这个形式系统中的理论显得更加清楚和前后一致。编者Arthur W. Burks注接下来冯·诺依曼简述了图灵自动机的定义。McCulloch Pitts 自动机的基本结构是神经元图灵机则是由不同状态组成的任何时候图灵机都处在有限的状态组合中的某一状态中“外部世界”则是由纸带所代表。每个运行周期中自动机读入一格纸带可能修改这一格的内容然后把纸带向左或者向右移动一格。图灵机按照预定的规则字典运行其中规定了对于不同的状态读入不同的符号时候下一个状态为何并且在这一格写入何种符号。纸带有特殊的一格表明了开始位置有限长度的程序可以预先写在纸带上计算所得的二进制结果则写在开始位置之后。接着冯·诺依曼说到了图灵关于有限自动机的结论存在通用图灵机AU具有以下性质对于任何图灵机 A 和程序 I存在模拟程序 IA只要提供 IA 和 I 给AUAU 就可以模拟 A 的运算输出和A 执行 I 得到的相同结果。AU 具有模拟任何图灵机去执行任何指令的能力哪怕这个图灵机比 AU 本身要复杂得多也没关系。因为通用图灵机本身的复杂性不足可以由模拟器程序包含的内容来填补。这项研究的深刻之处在于只要把通用图灵机恰当地制作出来它就能够完成任意复杂的工作因为其他的各种需求可以通过编写程序来满足。但是只有当任意的图灵机 A 具有最起码的复杂度从而能够实现通用图灵机的时候它才能有这样的能力。换句话说没有达到通用图灵机复杂度的系统不管你给它写什么程序都是不可能完成某些工作的。但是一旦复杂性超越了某一个确定的阈值只要给予适当的程序所有的自动机都能够相互模拟了[52]。图灵机模型译者加编者Arthur W. Burks注冯·诺依曼跟着解释通用图灵机 AU 是怎么模拟任意一个图灵机 A 的。模拟程序 IA 就像一本对照词典一样包括了所有 A 的状态和每一个符号的组合说明在这个情形下A 的下 一个状态是什么在纸带上应该写入什么符号。AU 按照这本词典运行就可以得到跟 A 一 模一样的输出了。到此我想指出人类第一次具有了某种通用的工具理论上说只要任何人能够做到的事这种工具也能复现此过程。这里并没有无中生有凭空制造复杂度 因为程序还是得具体的写出来。而且实现通用计算的这一过程也是基于严格的计算理论的 亦即关于怎样描述对象以及如何在字典中间查阅条目并执行的过程。不仅如此图灵还发现了自动机的极限。也就是说无法制造这样一种自动机这台自动机能够预测其他自动机在有限时间内是否能解决某个问题完成停机。换句话说虽然你可以制造能够模拟任何图灵机的通用图灵机你却无法制造可以预测任何图灵机运行结果的“预测机”。做过的事情可以重复但是没有做过的事情却没有办法预测[53]。以上结论同形式逻辑的结构本身具有深刻的联系。虽然在这堂课上不能深谈我想说一下大概的意思以便熟悉形式逻辑的人去研究。这一点跟类型论theory of types和哥德尔定理有关你可以在一个逻辑类型中间做任何可行的事情。但是一件事情是否可行这个问题本身却属于高一个层次的逻辑类型。我之前提过低复杂度的东西很容易预先判断它的行为。但是对于高复杂度的形式逻辑对象却很难提前预测它的行为最好的办法就是把它实际制造出来运行。在此情形下一个问题的有效范围要比问题本身处在高一个层次的类型。通用图灵机工作原理示意图译者加通用图灵机可以被看作是一个可以变身为其它任意一台图灵机甚至包括通用图灵机它自己的机器。只要给它输入适当的指令它就可以原封不动地模拟其它图灵机M,M’,M’’的工作。我们通常用的通用可编程计算机实际上就是通用图灵机程序员给机器输入的程序就相当于是任意一台特定的图灵机例如求解 11 的值得图灵机的描述。补充材料Arthur Burks 与 Kurt Godel 的通信补充材料内容均来自编者编者Arthur W. Burks注。冯·诺依曼的第二堂课到此结束关于最后两段编者想做一点补充[54]。在课程最后一段中冯·诺依曼提到了哥德尔的一条定理“你可以在一个逻辑类型中间做任何可行的事情。但是一件事情是否可行这个问题本身却属于高一个层次的类型。”因为编者不知道哥德尔曾得到过这样的定理这段话显得十分费解。另外他在之前引用的有关哥德尔的讨论47 页还包括冯·诺依曼的希克森研讨会上的文章“自动机的一般和逻辑的理论”参见冯·诺依曼文集的5.310-311。所以我给哥德尔教授写信询问此事不过我认为他给出的答案是关于参考文献最模糊的解释。因此编者把与哥德尔的通信稍作编辑附在下面我的信件如下鄙人正在编注已故冯·诺依曼教授关于自动机原理的未完成手稿在 1949年伊利诺伊大学的以及此前的希克森会议上他都引用了您的著作但我却查不到出处因为有可能冯·诺依曼生前曾同您谈及过相关问题我冒昧给您致函请求指点。手稿的背景如下冯·诺依曼当时在讨论视觉识别他说可以把人的眼睛和神经系统看成一部确定的有限自动机。他提出如下的可能即描述这类自动机的行为的最简方式是把自动机的结构依样画葫芦地描述出来。这是令人信服的。但是我不能明白他接下来说的话“在这个范围内有可能实际对象本身就是它自己的最简单描述。这是说任何用文字或者形式逻辑来描述一个对象的尝试都可能导致比对象本身更加复杂牵涉到更多关系的结果也就是越说越复杂。现代逻辑研究中的某些结论暗示了在遇到高度复杂的对象的时候这样的奇特性质反而是正常的。”这里似乎提到了您的工作鄙人随信附上全文敬请参阅。在伊利诺伊大学的课上冯·诺依曼也提出了类似的观点视觉产生过程最简单的精确描述方法就是把大脑的视觉部分神经元连接罗列出来。他接下来说对于形式逻辑的研究表明当自动机不太复杂的时候对于自动机功能的描述要比自动机本身简单。但对于复杂自动机情况却相反。他这里指名道姓提到了您的定理‚我实际上正在曲解一条逻辑定理但是这个定理本身是非常漂亮的。这是由哥德尔曾经提出的一条定理从逻辑上说对于一个对象的描述要比这个对象本身高一个级别。因此渐进地说前者总是比后者要长。我觉得为了理解这种性质必须运用上述定理因为在你去深入研究这件事情的时候你已经触及到复杂度这个概念的本质。此后在叙述了图灵机以及图灵对于停机问题不可判定性的论述之后他再次回到这个问题上面。他说这些问题跟类型论和您的研究结果有着深刻联系。此处的录音记录有些乱我尽量保留了原文这一点跟类型论和哥德尔定理有关你可以在一个逻辑类型中间做任何可行的事情。但是一件事情是否可行这个问题本身却属于高一个层次的类型。我之前提过低复杂度的东西很容易预先判断它的行为。但是高复杂度的形式逻辑对象却很难提前预测它的行为最好的办法就是把它实际制造出来运行。在此情形下一个问题的有效范围要比问题本身处在高一个层次的类型。鄙人能够理解一个对象的描述要比对象本身高一个类型层次。但是除此以外我不明白冯·诺依曼的意图何在。我有两个想法但是似乎都不能够自圆其说。一是把哥德尔配数当作一个公式的描述来对待。但是至少在某些情况下哥德尔配数的长度是可以小于公式的长度的否则自指的不可判定的公式就是不可能的了。另外一种可能的理解是同您 1936年的论文《关于证明的长度》中间提出的证明长度定理有关。有两个系统S和较大的系统 S1您的定理说对于每一个递归函数 F在两个系统下都存在一个可证明的陈述使得在这两个系统下的最短的证明满足一个不等式也就是在小系统 S下的证明的哥德尔配数要比 F作用在大系统 S1 中间证明的哥德尔配数大。这符合冯·诺依曼说的结论问题是结论正好相反类型越高证明越短而不是越长。冯·诺依曼教授的这段叙述令我十分迷惑不解如您能不吝赐教鄙人不胜感激。哥德尔的复信如下我对于冯·诺依曼当时的意图大致有了一些概念但是因为我从未和他谈及这些问题这仅仅是我个人的猜测。我认为冯·诺依曼提到在下的定理的时候并非是指存在不可判定的断言或者证明长度的问题。而是一个认识论上的事实即语言 A的完全描述是无法用语言 A本身来给出的这是因为在 A里面没有办法定义句子的真假。这条定理才是包含算术的形式系统不可判定性的真正原因。但在我 1931年的论文55中间没有提出这条定理直到 1934年我在普林斯顿的讲课上才正式提出。同样性质的定理也由塔斯基于 1933年提出[56]上述定理清楚地表明在某些情况下相比对于机制本身对机制会做什么描述要牵涉更多的东西[57]。在这个意义上它需要用更加抽象的术语来表达也就是更高的层次。但这仅仅是抽象的程度同需要用到的符号数量没有关系。正如您所说的符号数量和层次高低可能是成反比的。但是如果从通用图灵机角度来看冯·诺依曼的想法会变得更加清楚。对于图灵机我们可以说其行为的完全描述是无穷大的。因为既然不存在通用的停机判定方法那么要描述一台具体图灵机的行为只有把其所有的状态枚举出来才行。当然为了不陷入无限大带来的困难我们这里做了一个假定即只有可判定的描述才是完全的描述。通用图灵机的两种复杂度之比为无穷大同时它又可以被当作其他各种有限机制的一种极限这立即就导出了冯·诺依曼的结论[58]。”Jake 点评冯·诺依曼在这一章花了大量的篇幅介绍了 McCulloch Pitts 的人工神经元模型以及图灵的图灵机模型。在今天看来这两套模型都已经成为了教科书中的经典甚至已经略显过时。但是jake 认为这一章最精彩的部分并不在这里而在于冯·诺依曼提出来的描述层次以及不同层次的描述复杂性的问题。包括编者 Arthur Burks 就此问题请教著名的数理逻辑学家库特.哥德尔和哥德尔给出的回信与评论。实际上仅仅从字面意思上冯·诺依曼在一堂课上同时介绍了 McCulloch Pitts 的人工神经元模型以及图灵机模型就已经为此问题埋下了伏笔。我们不妨思考这样一个问题对于一个复杂的人工神经网络我们如何造出一台图灵机来精确地模拟这个神经网络的行为首先根据正文的叙述McCulloch Pitts 已经证明了人工神经网络等价于通用计算机所以必然可以用图灵机来模拟。但是这里的关键问题是如果我们造出了这台模拟神经网络的图灵机它的复杂度简单地可以理解为描述机器行为的代码长度与原神经网络相比谁大谁小呢我们知道图灵机的运作是一种串行的方式每一个时刻都由那个笨重的机器头——这个中心集权者进行精细的控制操作而人工神经网络则是一种并行运作的机器每一个时刻决策的权力都下放到整个系统中所有的神经元网络整体所完成的运算是所有神经元的集体行为决定的。因此如果要把这种复杂的集体行为“压缩到”一台串行运作的图灵机的行为上面势必会大大增加图灵机运算的复杂度。因而冯·诺依曼倾向于认为在这种情况下对人工神经网络行为最好的模拟无非是运行这个网络本身。换句话说神经网络行为的最短描述长度就是它自身的代码长度。这样我们实际上可以画出一张有关自动机复杂度的示意图行为复杂度如图所示我们可以用一台自动机的结构复杂度用多少代码来实现这个自动机和它运行之后所表现出的行为复杂度两个数轴来表示自动机。对于一般的自动机来说它的行为复杂度会随着它的结构复杂度增加而增加不过这个结论似乎存在着反例例如一维的元胞自动机结构复杂度很小但是其行为复杂度很大。但是这种变化曲线并不是简单线性的而是存在着某个阈值点C 点这就是冯·诺依曼在书中反复提到的复杂度阈值。当自动机的结构复杂度超过一定的阈值之后自动机的行为会变得异常复杂而难以预测。下面的条状区域就是对所有自动机根据复杂度而完成的分类。在复杂度阈值 C 左侧的自动机为普通的简单图灵机例如计算 2100 的图灵机C 右侧的自动机为诸如 McCulloch Pitts 神经网络的复杂自动机。而这个阈值 C 对应什么样的自动机呢在本章中冯·诺依曼怀疑通用图灵机有可能位于这个 C 附近因为当一个自动机的结构复杂度超过了实现通用图灵机的复杂度的时候它就可以通过吸收不同的输入代码而“变身”成任意特定的图灵机。而在后续的章节中冯·诺依曼怀疑这个 C 对应的恰恰是自复制自动机。在编者与哥德尔的通信中以及关于冯·诺依曼所说的不同层次的复杂度的讨论中我们可以明显看出冯·诺依曼暗含了如下的一种猜想尽管我们还不知道这个复杂度阈值 C 是什么但是似乎我们可以比较有把握地断定这个 C 值点恰恰与自指——这个构成了图灵停机问题、哥德尔定理以及程序自复制问题的核心概念有关。总之我认为这个不同层次的复杂性的问题是冯·诺依曼在本章给我们留下的一个非常宝贵的遗产也是理解复杂性问题的核心的地带。但是由于我能力有限还不足以回答冯·诺依曼这里的问题不过我这几年来一直围绕着这个问题展开探索在此我愿意把了解到的相关的概念更重要的是参考文献列举出来希望能够起到抛砖引玉的作用。1、Kolmogorov 复杂性冯·诺依曼的这本书的出版是 1966 年就在几乎同一年Kolmogorov 在 1965 年和 Chaitin在 1966 年提出了“Kolmogorov Complexity”或者也叫“算法复杂性Algorithmic Complexity”的概念。我不知道 Kolmogorov 等人是不是了解冯·诺依曼关于自动机复杂度特别是复杂度阈值的讨论但是它们要解决的问题似乎是同样的。Kolmogorov 复杂度定义在所有的 01 序列上。一个序列的复杂度定义为能够生成这个序列的所有图灵机递归函数程序中最短的图灵机的代码长度。这样序列的复杂度就对应为它的可压缩性。对于一个随机序列来说我们找不到一段程序来生成它于是我们只能用最笨的方法把这个序列逐字的打印出来。因此它的Kolmogorov 复杂性就是序列自己的长度。而对于一个有规则的序列例如010101„„重复200 遍我们可以写出一个程序为“Print(‘01’ 200 times)”这个程序的代码长度是 21于是该序列的 Kolmogorov 复杂度就是在 log(200)数量级上。关于 Kolmogorov 复杂性我推荐这本书Li, Ming and Vitányi, Paul, An Introduction toKolmogorov Complexity and Its Applications, Springer, 1997。我们看到Kolmogorov 复杂性已经非常接近冯·诺依曼要探索的自动机的复杂度的概念了。2、自指与跨层次在正文中冯·诺依曼以及哥德尔曾多次提到了有关“逻辑类型”、“命题的真伪在形式系统内部无法判定”等问题。这其实都已经牵扯到了自指以及跨层次的缠结等问题参见侯世达《哥德尔、埃舍尔、巴赫——一集异璧之大成》1994 商务印书馆。而对这些问题jake已经做过一定的探索并总结在了《系统中的观察者 7自指——连接图形和衬底的金带》这篇文章中在此不再赘述点击阅读原文查看。自噬的蛇在这里我想进一步指出的是传统的有关自指与跨层次缠结的问题多针对的是逻辑结论例如一个命题是否可以被证明一个图灵机是否能停机等等这些问题都仅仅有“是或否”两种答案。就我所知我们还没有看到有关这种自指与缠结层次的定量研究例如产生悖论的概率、停机的概率有多大也没有将复杂度与自指联系起来的研究例如如果要真正实现一个自指句子或者自指的图灵机它在不同层次的复杂度程序长度上有何关系我想冯·诺依曼在此呼唤的有关自动机的新理论恰恰就是这类自指或者跨层次缠结的定量理论。例如冯·诺依曼怀疑复杂度阈值恰恰就在自指的自动机中产生而对于这类自动机来说从高层次来描述它的复杂性预测它的行为比从低层次来描述它的复杂性对自动机直接描述更大。就我所知数学家、计算机科学家 Chaitin 的确考虑过类似的问题参见Chaitin: Information, Randomness Incompleteness, World Scientific 1987; Chaitin: Information-Theoretic Incompleteness, World Scientific 1992。读者不妨参考。3、不确定性原理此处纯粹是我对冯·诺依曼问题的一种猜测没有太多的根据请读者斟酌其中的结论。我们都知道在量子力学中有一个著名的“不确定性原理”Uncertainty Principle它指出动量的波动与位置的波动满足不等式虽然这个不确定性原理是量子物理学家海森堡提出来的但是它实际上深深植根于数学之中。从一般意义上来说任何一个时间域上的函数 f(t)和它的傅立叶变换即频率域上的函数 g(w)都存在着不确定性关系而位置和动量上的概率波恰恰构成了傅立叶变换对所以它们才存在着不确定性原理请读者参考 R. N. Bracewell 殷勤业(译)《傅立叶变换及其应用》西安交通大学出版社。实际上从时间域和频率域上对同一个信号的描述无非是从两种不同的视角来对信号进行描述而不确定性原理则告诉我们我们从原则上不可能对未知的信号同时在时间域和频率域上都给出精确的测量。在这里如果我们描述的对象是一个未知的序列我们可以从序列展开本身的数值来描述也可以从能够生成该序列的图灵机程序这个角度来描述它。我们猜想在这种对未知序列的不同角度的描述中也存在着不确定性原理也就是我们不能同时提高对序列的直接描述和程序生成描述的精度。联系到描述的长度我们知道对序列的描述精度一般与程序的长度正相关程序越长说明描述的越详细精度越高。这样我们也许可以得到类似不确定性原理的不等式即近似描述未知序列的图灵机程序的代码长度 Lp 加上从序列本身的角度进行描述的代码长度 Lt 的和有一个下限值我们不能同时提高这两种代码长度值。之所以中间变成了加 号而不是乘号是因为熵与对应概率之间的对数关系。也许这种不确定性原理就是冯·诺依曼 在这里讨论的不同层次复杂度之间的关系的定量刻画。也是自指性的一种定量的反映4、神经图灵机近些年来基于人工神经网络的深度学习有了突飞猛进的发展人们逐渐发现在McCulloch-Pitts模型基础上引入更复杂的结构会大大提升人工神经网络解决问题的能力。例如2014年Google的科学家们就提出了神经图灵机模型这种模型巧妙地将神经网络和图灵机结合到了一起。神经图灵机示意图融合方法的关键是利用了某种类似于“注意力”的机制它能够利用一种连续化的操作来对外部存储单元进行“软化”的读或写。注意力机制就是指一种动态地将权重分配在外部存储单元上的方法。当某一项的权重为1其它退化成0的时候这就回归到了经典的图灵机模型。实验表明这种装置在问题求解、问答、阅读理解等任务上的能力表现要远超其它的神经网络模型。参考文献以下译者按均指东方和尚的注解[48] 译者注神经在激发后会疲劳在一段时间中间不能再次被激发这一实际生理规律在理想模型中也是应该被考虑加入的。这样可以解决神经网络因为正反馈而陷入简单同步的死循环等问题。在 Hebb 定律提出之后不久Milner  就提出了可变阈值、抑制和疲劳的概念补充了神经网络的特性。只有考虑了这些因素之后神经网络才能产生比较高级的涌现现象如同步、预测、和层级等等才能较好地对于外界进 行识别。可参见霍兰著《涌现》的相关章节。[49]译者按现代计算机内存有两种高速内存还是由集成电路中的微型晶体管实现称为SRAM低速内存则由电容等机制实现称为DRAM。[50]译者按现代神经科学研究证明记忆并不局限于大脑某一部位大脑的微观工作机制即细胞突触形成、神经环路的建立本质上就是一种学习和记忆过程此外由于一个神经元可以具有成千上万个突触而记忆则包含于大量神经元组合之中所以可以轻易突破正文中提到的 10 的 16 次方的内存容量限制。当然 要把某一记忆和具体神经元建立确切联系尚有大量工作要做。[51]译者按现代神经医学和诊断科学的发展已经可以把大脑的单个神经元活动和认知过程进行实时的比对证明大脑的不同部位的确有特定的功能这种功能常常可以定位到具体的神经元上。同时大脑恢复能力并没有冯·诺依曼所说的那么强大功能丧失常常是永久性的。另一方面记忆很可能的确是一种分布式 计算。[52]译者按以上通用图灵机的概念非常深刻是现代计算机的理论依据因为只有明白了这点才能制造可编程的计算机而不是仅仅具有特定功能的计算器从计算器到计算机是对自然认识的一次飞跃。[53] 译者注这里提到的“预测机”无法实现的问题实际上牵扯到了可计算理论的不可判定问题类对图灵机行为的预测就是一种不可判定问题。关于更多的不可判定问题的讨论请参考这里。[54]译者按当时计算机还是“尖端科技”其原理还显得十分神秘故须作此介绍。而今天图灵机早己家喻户晓我们集智也进行过多次科普请读者参见《图灵机遇计算理论》以及《系统中的观察者 7自指——连接图形和衬底的金带》图灵机介绍部分兹省略不译。下面有一段编者 Burks 教授同哥德尔本人的通讯来往很有史料及科学价值全文照译请读者留意。[55]译者按即哥德尔最著名的论文《〈数学原理〉及有关系统中的形式不可判定命题》其中提出了哥德尔定理。[56]译者按即塔斯基定理说在任何形式系统中间真值的概念不能够在这个系统内部定义。关于这段讨论读者也可参看《系统中的观察者 7自指——连接图形和衬底的金带》一文。[57]译者按比如可以十分简洁地写出某个算术表达式但是这个断言是否为真可能会牵涉到比这个算术表达本身多得多的内容例如哥德巴赫猜想就远不仅仅是两个数加起来那么简单[58] 译者按通用图灵机可以模拟一切图灵机它的行为描述是无限复杂的但是它本身的描述却是具体的是有限长度的故对于图灵机行为复杂度/机制复杂度∞所有具体产生复杂度的机制随着其复杂度 的提高最后都无限接近于图灵机。这个问题非常值得深思作者John von Neumann 20世纪最重要的数学家之一在现代计算机、博弈论、核武器和生化武器等诸多领域内有杰出建树的最伟大的科学全才之一被后人称为“计算机之父”和“博弈论之父”。编者Arthur W. Burks  冯·诺依曼的助手遗传算法之父 John Holland 的博士生导师译者东方和尚 集智俱乐部神秘粉丝 曾与张江在集智俱乐部的网站上互相过hu招dui注者Jake张江 集智俱乐部创始人集智AI学园创始人北师大教授未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市大脑研究计划构建互联网城市大脑技术和企业图谱为提升企业行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。  如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”
http://wiki.neutronadmin.com/news/426128/

相关文章:

  • 郑州网站开发hndlwxf006网站建设
  • 金融公司网站模板WordPress优惠券主题
  • python 网站开发实例大型集团网站建设
  • 网站开发 语音wordpress安装语言
  • 泰安中商网络做的网站怎么进入内网建站教程
  • 东莞seo网站排名怎么利用360域名做网站
  • 免费html5中文网站素材飞机订票系统网页设计总结
  • 移动端网站开发语言阿里云手机网站建设多少钱
  • 怎样营销网站建设制作网页的代码实例
  • 外面网站怎么做的宁夏建设工程质量安全监督总网站
  • 成都做营销型网站建设人际网络网络营销是什么
  • 西安道桥建设有限公司网站自己做网站要学什么软件
  • 响应式环保网站模板10种网络营销方式
  • 上海做网站建设公司做专题页的网站
  • 设计网站排行榜前十名站长网站素材
  • 徐州万网网站建设网站设计的介绍模板
  • 如何建设一个国外网站人力资源公司怎么找客户
  • 简要说明网站建设的基本流程本地wordpress如何同步
  • 永久免费网站推荐帮人做彩票网站
  • 中山企业集团网站建设成都网站建设思乐科技
  • 网站建设详细步骤国内网站域名
  • 备案查询站长之家做模板网站的公司
  • 重庆快速网站推广在线考试网站模板
  • 公司网站建设怎么规划比较好用网站建设与管理创业
  • 苏州住建网站企石仿做网站
  • 广安发展建设集团公司网站注册一个公司
  • 产品外包装设计网站建设证书查询官方网站
  • 安徽省经工建设集团网站网站模板库软件
  • 网站站点创建成功是什么意思如何免费创建网站
  • 厦门网络公司网站开发美食网页设计论文