近日,AI2000人工智能全球2000位最具影响力学者榜单在清华大学发布,中国学者规模位列世界第二,但高水平学者集中的研究机构匮乏,人工智能领域的人才队伍亟待加强。
AI2000榜单由清华-中国工程院知识智能联合研究中心和清华大学人工智能研究院发布。AI2000人工智能全球最具影响力学者(200名)和提名学者(1800名)分布于全球不同高校和学术机构,美国有1128人次,中国171人次,欧盟有307人次上榜。
发布会上,清华大学人工智能研究院院长、中国科学院张钹院士做了热情洋溢的报告和精彩点评发言。
人工智能研究必须国际化
基础研究,尤其是人工智能领域的基础研究必须国际化,因为只有把全世界的研究人员共同团结起来、利用起来,才能够引领基础研究的发展。为什么目前人工智能领域大多由美国来引领,就是因为美国把全世界最优秀的人才利用了起来。
中国要想在基础研究上引领世界,必须走国际化道路。今天有很多外国留学生来华求学,这是一个好事儿,但我们还可以做一定平衡调整,吸引更广泛国家地区的优秀学生来华学习。
把数据驱动和知识驱动结合起来
人工智能的四大基础是:知识、数据、算法和算力,回顾历史,这四个因素都在不断地发挥作用。第一代人工智能也叫符号人工智能,比较强调知识对智能的作用,因为那时算法和算力都还没有跟上。
进入新世纪后,深度学习把大家的目标凝聚到了数据上,这时大数据的出现,再加上很好的算法,就形成了基于概念的深度学习,再加上云计算等手段,使以数据为基础的连接主义模型得到了极大推广和应用。
数据主义喊了许多口号,导致了我们今天遇到一些困难,按照大数据建起来人工智能系统似乎不可信、不可靠、不安全、不易推广,这都是目前用深度学习进行人工智能研究带来的问题,也可以说是大数据遇到的挑战。怎么来解决这个挑战呢?唯一的办法,就是重新引入知识,把数据驱动和知识驱动结合起来,达成可信安全的第三代人工智能。
常识往往不在数据里
自然语言理解是人工智能领域最核心的问题。不管做机器翻译也好,做自然语言应用也好,都试图通过分析符号序列来理解相关内容,这是第一代人工智能所谓符号主义的核心做法。到了第二代人工智能,又走上深度学习的道路,这条路充满希望,但又非常危险,因为解决不了可信安全的问题。
机器翻译现在只能翻译不重要的东西,因为翻错了也没有关系,真正重要的场合还需要人力同声翻译。机器最大的问题,就在于它缺乏常识,根本不知道自己不知道,这是一个很大的问题。知识包含两方面,一是我知道什么,二是我不知道什么。一个有学问的人,不仅仅表现在他知道的多,更表现在他清楚自己不知道的更多。那些狂妄自大的人,都是没有学问的人,不知道自己能吃几碗干饭,机器翻译也是这个问题。给机器任何句子,它都能翻,根本不懂也能瞎翻。
所以常识是必要的,简单翻译几句话也需要大量尝试积淀,“说你行,不行也行”,机器没有常识,就很难理解这句话,人反而觉得很简单,这就是常识的重要性。但常识库的建立非常之难,现在没法从数据中去建立常识库,因为常识往往不表示在数据之中。
建立常识,必须下功夫去做,只有这个问题解决了,自然语言的理解才能达到目标。而自然语言理解,则是第三代人工智能的终极目标,这是一个艰巨的任务。如果这个问题解决了,人工智能的其他问题将会迎刃而解。
① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。
② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。