如果计算机如此聪明,他们怎么会读不懂? |有线



我们怎么样 钻进这个烂摊子?

当前的AI系统主要由称为深度学习的统计技术提供动力,并且深度学习在学习相关性(例如图像或声音与标签之间的相关性)方面非常有效。但是,在理解句子之类的对象如何与其部分(如单词和短语)相关时,深度学习会遇到困难。

为什么?它缺少语言学家所谓的组合性:一种从其各部分的含义构建复杂句子意义的方法。例如,在句子“月亮距离地球240,000英里”这个词中 月亮 是指一个特定的天文物体, 地球 意思是另一个 英里 表示一个距离单位,240,000表示一个数字,然后,根据短语和句子在英语中的组成方式,240,000英里表示特定长度,并且句子“月亮距离地球240,000英里”断言两个天体之间的距离是特定的长度。

继续阅读



最新的人工智能,从机器学习到计算机视觉等等

令人惊讶的是,深度学习并没有任何直接的处理组合的方法;它只是有很多很复杂的相关信息,没有任何结构。它可以知道狗有尾巴和腿,但它不知道它们与狗的生命周期有什么关系。深度学习并不认为狗是由头部,尾部和四条腿组成的动物,甚至是动物的动物,更不用说头部是什么,以及头部的概念如何因青蛙,狗而异和人,在细节上有所不同,但与身体有着共同的关系。深度学习也没有认识到像“月球离地球240,000英里”这样的句子包含的短语指的是两个天体和一个长度。

与此同时,深度学习并没有很好的方法来融入背景知识。系统可以学习预测单词 钱包安全地方 发生在类似的句子中(“他把钱放在钱包里”,“他把钱存放在一个安全的地方”),但它无法将这与人们喜欢保护他们的财产这一事实联系起来。

在认知心理学的语言中,当你阅读任何文本时你所做的是建立一个关于文本所说内容的意义的认知模型。当你读到这段经文时 农民男孩例如,你逐渐建立一个心灵表征 – 你的大脑内部 – 故事中的所有人,物体和事件以及它们之间的关系:Almanzo,钱包和汤普森先生,以及Almanzo对Thompson先生说话,Thompson先生大喊大叫口袋,Thompson先生从Almanzo手中抢走钱包,等等。只有在你阅读了文本并构建了认知模型之后,你才能用你所做的任何关于它的叙述 – 回答问题,将它翻译成俄语,说明它,或者只是记住它以供日后使用。

从2013年开始,当DeepMind构建了一个播放Atari游戏的系统 – 通常比人类更好 – 没有认知模型,并以超过5亿美元的价格卖给谷歌时,认知模型已经过时了。但是对于具有固定规则和有限选项的游戏而言,适用于阅读的功能并不适用。无认知模型GPT-2的模拟散文很有趣,但它与真正的阅读理解相差甚远。

这是因为,归根结底,统计数据无法替代现实世界的理解。相反,在为当前AI程序提供动力的统计计算类型与系统实际理解他们试图阅读的内容所需的认知模型构造之间存在根本的不匹配。

我们认为机器不可能做得更好。但仅仅是数量的改进 – 更多的数据,我们的神经网络中的更多层,以及运行这些网络的强大机器的网络集群中的更多计算机 – 不会削减它。