清华大学计算机系教授、博士生导师邓志
大数据AI的先天不足
邓志东坦言,以大数据为燃料,喂食越多,人工智能越能获得更好的感知直觉。但问题随之而来,首先是对大数据的清洗和标签需要付出很高代价。
其次,在落地应用中,在开放环境下,实际是不存在完备的大数据的。对于各种应用场景,大数据人工智能均只能获得较接近于人类水平的视听觉等感知能力,这与各种基于公开测评数据集得到的性能指标是完全不同的。简言之,人工智能或许在测试状态下表现良好,但在实际落地应用中的表现却可能差强人意。
此外,基于深度学习的计算机视听觉感知方法不仅依赖大数据的驱动,也缺乏人类举一反三的,基于小样本的学习能力和对目标的认知水平的理解能力,并且缺乏记忆、没有常识、不能运用经验,缺乏技巧和知识学习能力。
比如,人们开车转弯或掉头就是过程性经验。大脑记住后,每当转弯就不需要再思考,而是可以条件反射地做出动作。
人类的思维方式并不完全依靠特征提取,很多时候是靠理解和推理,但目前人工智能并不具备这样的能力,也就不具有规划决策和思考能力。
邓志东把大数据人工智能面临的挑战归结为:人工智能缺乏自己的语言。相比之下,语言却是人类的“制胜法宝”。他表示,人类高层认知能力其实是通过记忆语言去思考和推理的。记忆以及知识的运用,都是基于语言的。
另外,大数据人工智能的发展,还会带来法律、伦理、隐私安全和失业等方面的挑战。
尽管当下的人工智能还非常弱,“落地”也只能在特定应用领域发挥作用,还极度依赖大数据。但随着人工智能的进一步发展,也就是认知智能和通用人工智能的发展,或许会对技术与产业带来变革,甚至威胁到人类的安全。
“但总体来说,现在的弱人工智能对于人类是赋能和有益的”,邓志东表示。
拥有自己语言的下一代人工智能
对于人工智能的未来突破点,邓志东认为,关键就在于从感知智能向认知智能的进化。目前人工智能主要追求看清、听清,能够识别但没有理解,属于感知智能范畴。未来人工智能的发展目标将是如何看懂、听懂和读懂,从而具备基本的认知智能,这也是从弱人工智能向通用或强人工智能进化的方向。
所谓认知智能,就是指对目标或实体具有理解能力,理解事物的内涵和外延。其发展趋势就是要探索举一反三的认知智能,即以大数据感知智能+图模型/知识图谱为基础,利用图卷积神经网络从特征学习拓展到知识学习。
而通用人工智能则包含了多任务的自主学习、自适应与自组织能力。其发展趋势是基于连接主义的深度神经网络,通过与行为主义的强化学习,特别是与具有学习能力的符号主义的有机结合,从AlphaZero这样的新起点出发,发展出具有更宽垂直领域的通用人工智能。
总之,通过深度学习与无监督学习、概率或模糊图模型知识图谱进行深度融合,让下一代人工智能拥有自己的语言,并能根据数据和常识自主学习,是探索认知能力与通用人工智能的关键路径之一。
(敬请关注微信订阅号:dzbyqzx)