1. 语言游戏

1.1. 如果你想成为一名作家，理解语言是很重要的，或者至少要有理解语言的愿望

1.2. 若要通过图灵测试，算法需要能够接受千变万化的“自然语言”作为输入，并对其进行处理，然后生成与人类可能做出的反应相对应的输出

1.3. “自然语言”一般指人类在自然进化过程中不断被重复、被使用的，没有经过有意识的预先设想和计划的语言

1.3.1. 其与计算机代码有着鲜明的区别

1.4. 第一个成功通过图灵测试的算法，是计算机科学家约瑟夫·魏泽鲍姆（Joseph

Weizenbaum）在1966年开发的名为“ELIZA”的程序

1.4.1. 如果你曾经看过心理医生，而这名心理医生刚好接受过卡尔·罗杰斯（Carl

Rogers）的以当事人为中心的治疗培训，你就会了解，心理医生会问一些问题，但不会把谈话导向一个新的方向

1.4.2. 他问的这些话仅仅是继续了前面的话题，而这为患者提供了进一步阐述其精神状态的空间

1.4.3. 关键是要编写很多的规则来让对话令人信服

1.4.4. 应答的范围有限也不灵活，并且对以往的对话没有记忆、联想

1.4.5. 之所以其在治疗情景中应用效果良好，是因为治疗通常取决于患者是否能解决他们自己的问题

1.4.6. 作为医生的算法应能诊断病情，所以ELIZA并不擅长进行疾病诊断，但另一些算法可能会比你的全科医生更擅长疾病诊断

2. 勒布纳人工智能奖

2.1. Loebner Prize

2.1.1. 20世纪90年代初，发明家休·勒布纳（Hugh Loebner）赞助设立

2.2. 勒布纳人工智能奖分设金、银、铜奖。金奖、银奖的奖金分别为10万美元、2.5万美元

2.3. 铜奖又分为四个等级，奖金分别为4000美元、1000美元、500美元、200美元

2.4. 该奖项旨在遴选在人机交互方面更具灵活性和说服力的程序

2.4.1. 这个测试的内容包括破译和理解文本、视听组件等内容，通过标准是评委们无法将其与真正的人类区分开来

2.4.2. 第一个通过扩展版图灵测试的程序将获得一枚金质奖牌和10万美元奖金

2.4.2.1. 如果程序不仅能以文本方式通过交谈测试，在音频和视频方式的测试中也能过关，则获金奖，赢得10万美元和一枚18K金质金牌

2.4.3. 如果一个程序能够获得半数评委的确认票，那么它的创建者将会获得一枚银质奖牌和2.5万美元的奖金

2.4.3.1. 如果它能在比较长的时间内以文本谈话的方式迷惑至少半数评委，则获银奖

2.4.3.2. 在2013年获得第23届勒布纳人工智能奖银奖的“三井”，在与人们对话的时候，会对人们提出的问题给出一些非常有见地的回答

2.4.4. 在未达到以上标准的程序中，迷惑住最多评委的将获铜

2.5. 如果你曾经和聊天机器人聊过天，那么你就用你跟它的对话有效地训练过它

2.6. 如果聊天机器人在未来遇到类似的情况，它可以逆转角色，使自己应对起来更像是人类。但大多数算法都是基于ELIZA“如果……那么……”的规则和更为复杂的规则，因而，这些算法永远无法真正处理语言的多样性

2.6.1. 我们需要理解语言是如何组合在一起的

3. 威诺格拉德的测试

3.1. “威诺格拉德”的测试由斯坦福大学教授威诺格拉德提出

3.2. 在这个测试中那些不能很好理解语言模糊性和语言情境方面问题的人工智能很快就会原形毕露

3.2.1. 人工智能系统在尝试处理“自然语言”时，会在语言模糊性和语言情境方面存在一些问题

3.3. 基于对语境和过往经验的认知，人类知晓如何理解这个谜语似的句子，但是对于机器真的很难

3.3.1. “威诺格拉德”测试正是利用了“自然语言”的复杂性、丰富性和模糊性等特征

3.4. 人类所使用的代码是长久以来在与他人的语言交流中逐步形成的

3.4.1. 从幼年开始，人类就在语言环境中浸染，在这个过程中我们不断地学习，不断地犯错，不断地再学习

3.5. 互联网上有大量的可作为数据库使用的实例

3.5.1. 我们为什么不能将算法投入互联网任其自由发展，去学习驾驭语言的复杂性、模糊性呢？

3.6. 诺姆·乔姆斯基（Noam Chomsky）认为语言天赋是我们与生俱来的，就好像我们是按照老式的自上而下的模型进行编程的，而不是从零开始学习

3.6.1. 语言学家们惊奇地发现，一个孩子想要理解其他人并与之互动，所需要的语言真的不用很多

3.6.2. 对机器学习来说，仅通对一个庞大的语言使用数据库来学习语言将会是非常困难的

4. 危险边缘

4.1. 哥伦比亚广播公司的益智问答游戏节目，已有数十年历史

4.1.1. 《危险边缘》以答案的形式提问、提问的形式作答

4.1.1.1. 开局阶段，人类选手发挥得不错，并在一段时间内保持了领先，但最终还是不敌IBM算法的威力

4.1.2. 更多的困难来自问答的方式

4.1.2.1. 节目以一种问答倒置的方式进行，以答案的形式提问、提问的形式作答

4.2. 2011年，IBM将注意力转向了与国际象棋或围棋截然不同的一个方向：挑战变幻莫测的“自然语言”

4.2.1. 参加益智问答节目《危险边缘》

4.3. 常常利用双关语、文字游戏、转移注意力等方法来迷惑参与者，即使是人有时也很难理解其问题的意思

4.3.1. 由这些因素带来的模糊性使得算法几乎不可能100%准确

4.3.2. 赢得比赛将标志着机器在解析语言语义方面的能力有了重大提升

4.4. 肯·詹宁斯（Ken Jennings）

4.4.1. 已经连胜74场

4.5. 布拉德·拉特（Brad Rutter）

4.5.1. 直被认为是一个“学痞”

4.6. 《危险边缘》之王

4.6.1. 两人在学校的智力测验小组中都曾崭露头角

4.7. IBM的算法“华生（Watson）”

4.7.1. 为了纪念IBM公司的第一任首席执行官托马斯·J.沃森（Thomas J.Watson）

4.8. 节目在全美电视网上播出，让所有人看到了人类被机器超越

4.9. 要赢得比赛不仅仅要擅长回答问题，有时也需要一定的策略

4.9.1. 参赛者可以在最后一个题目上下赌注，这使得落后的选手有可能在最后一题时将手里的钱数翻倍，从而赢得比赛

4.9.2. 华生”也分出了一部分算力，来确保它能有效地运用所有数学技能进行下注

4.10. 一定程度的运气因素

4.10.1. 答题的过程中在题板上会给出所谓的“双赌法”，“华生”很幸运地在比赛中选到了

4.10.2. 双赌法通常指在赛马博彩中，选择两场次指定的比赛都胜出即为赢的押注法

4.11. 有一个不公平的优势：抢答器

4.11.1. 一开始“华生”被允许使用电子信号的方式按抢答器，而不是像人类那样按下实物按钮

4.11.2. 人们很快意识到，这将给“华生”带来巨大的优势

4.11.3. “华生”每次都能在微秒级精确地按下抢答器

4.11.3.1. 人类的反应能力和计算机电路相比差远了

4.12. 需要下注的，在下注的环节，“华生”依然对自己的答案表示不那么确定，所以它下了很小的赌注