科学家王海峰:从百度十篇论文入选ACL 2019说起
中新网5月29日电 近日,国际自然语言处理(NLP)领域的权威学术会议“国际计算语言学协会年会”(ACL 2019)公布了今年大会论文录用结果,其中,百度共有10篇论文被收录。对于国内企业来说,这可谓一次前所未有的突破。
在国际自然语言处理领域,百度一直处于第一梯队。自然语言处理技术不仅在诸如搜索、地图、输入法、翻译、小度助手等自家产品中被广泛应用,相关研究论文此前也在各类国际AI顶会中频频露脸,代表中文NLP研究“秀实力”。因此,ACL 2019的这个录取结果,对于百度而言,就如同学霸考试又拿了高分一样,并不意外。
只是,提到ACL,不由让人想到百度高级副总裁、AI技术平台体系(AIG)和基础技术体系(TG)总负责人王海峰——他本人也曾于2013年出任ACL主席,是ACL历史上的首位华人主席。去年7月,ACL宣布成立亚太分会AACL,他又担任了创始主席。这两次出任国际顶级学术会议主席,在当时都被认为是中国AI领域的大事件。
在国家大力推动科技创新发展、人工智能技术快速推进、应用成果遍地开花的当下,王海峰和他的团队无疑已是中国乃至国际AI界的一张宝贵“名片“。而究其背后,我们不难看到王海峰兼具科学家、技术实践者、AI布道师三重身份,在人工智能行业发展的道路上映射出的那道亮光。
第一重身份:科学家
百度百科中对于“科学家“有一段描述:对真实自然及未知生命、环境、现象及其相关现象统一性的客观数字化重现与认识、探索、实践的人。简而言之,“科学家“三个字意味着“探索未知”。王海峰就是一位在人工智能领域探索前行且成果丰硕的科学家。
他的创新研究成果,最早可以追溯到在哈尔滨工业大学读书期间。硕士时,他主导开发的汉英机器翻译系统,获得了国家“863”评测第一名及部级科技进步奖。而1999年的博士论文中,他已经开创性地探索了神经网络机器翻译的可能性。
而走出校园以后,王海峰依然坚持科学研究。截至目前,他已经在国内外知名会议或期刊发表学术论文120余篇,已授权或公开的发明专利200余项,主持国家级重大科研项目3项,并获得国家科技进步二等奖一项、中国电子学会科技进步一等奖四项,均为第一获奖人。
关于收获这些成果的经验,他总结为“坚持走在正确的道路上“。2018年,他获得了中国人工智能领域的最高荣誉——吴文俊人工智能杰出贡献奖。彼时,在谈及自己近30年的科学研究之路时,王海峰总结说,这期间有停滞不前的沮丧,有曲高和寡的无奈,但更多的是研究成果为大众所用的喜悦,以及随之而来的认可。
而这种认可,也体现在他在国际学界的地位上。2013年,他成为了全球影响力最大、最具活力的国际学术组织之一ACL历史上首任华人主席。2018年,当ACL宣布成立亚太区域分会AACL时,他又顺理成章地成为AACL首任主席。此外,他还在IEEE工业顾问委员会委员等权威学术组织、会议担任职务。
学术成就带来的外界认可,以及在权威组织担任职务的履历,也成就了王海峰的另一个特质:人才吸引力。如同一句老话所说:“物以类聚,人以群分。”他所带领得百度研究院,汇聚了众多海内外顶级科学家。仅在2018年,就引入了十几位人工智能领域的资深科学家。这些专家,都在学术圈闻名遐迩,有的本在国际顶尖高校任职,却最终都被百度和王海峰所吸引,加入了这支强大的团队。他们的研究领域覆盖信息挖掘、计算机视觉、语音技术、机器人、大数据挖掘、商业智能等,几乎囊括了AI领域从底层基础到认知、感知技术的全领域范畴,多次取得对学界和工业界都具备重要意义的突破性成果。
比如在NLP领域,本次ACL 2019录取的10篇论文,就覆盖了信息抽取、机器阅读理解、对话系统、视频语义理解、机器翻译等诸多NLP领域的热点和前沿研究方向,提出了包括基于注意力正则化的ARNOR框架、语言表示与知识表示深度融合的KT-NET模型、多粒度跨模态注意力机制、基于端到端深度强化学习的共指解析方法等,在人机交互、智能客服、视频理解、机器翻译等场景中具有很大的应用价值。带领团队取得成就,王海峰的科学家身份也又了多一层的含义。
第二重身份:AI技术的实践者
“AI的发展最终是要‘服务人’。 “秉持这一观点的王海峰,没有把科学研究的成果仅仅存放在实验室中,让众人膜拜,却又高不可攀,而是积极地推动AI技术走出实验室、走向实践,服务于人。
简单举几个例子就足以说明这一点。在机器翻译领域,王海峰深耕近30年,2010年加入百度后,他带领团队融合统计与规则、实例和神经网络等方法,实现了多方面的技术创新,并在2015年率先发布互联网神经网络翻译系统。目前,百度翻译可支持全球28种语言互译,覆盖756个翻译方向,超过15万家第三方应用接入百度翻译API,每日翻译字符数超过千亿,免费服务全球数亿用户;他和他的团队,在百度地图中采用基于深度学习技术进行时间预估,可准确预测从出发地到目的地真正需要花费的路线和时间,每天为用户提供约5亿次时间预估服务,我们每天使用百度地图规划自己的出行路线,背后就是深他们的功劳。
“技术不是说要做到 100% 准确才能用,效果达到一定程度,就好用了。”作为实践AI、用AI服务于人的先行者,王海峰带领团队,开创了一条让AI在应用中进化的道路。在技术研究和产业发展两条线的轨迹中,他找到了交叉点。他带领团队搭建起了完备的AI技术架构,推动百度AI技术多年积累和业务实践集大成——百度大脑,在取得一个又一个的突破性成果的同时,也在不断对外释放势能。目前,百度大脑已经对外开放了170多项领先的AI能力,并有超过110万开放者汇聚于此,通过他们,这些AI能力也逐渐深入到工业、农业、医疗、零售、金融等各个领域,为当下中国的产业智能化注入能量。
第三重身份:AI现实和远景的布道师
如果说,科学家和实践家这两种不同身份,已经在王海峰的身上已经实现了融合了的话,那“布道师”三个字几乎也是顺理成章。如何正确的看待AI? AI如何影响我们的生活的?AI的未来是什么?在AI这种新的生产力改变时代的同时,让社会、让人们具备“AI素养”至关重要。
“全社会和我们每一个人对于AI抱有正确的认识和预期,不能过高,也不能畏惧,才能更好地拥抱AI。我们一起努力,用AI技术让我们的未来变得更加美好。”王海峰是这么说的,也是这么做的。
2018年的百度AI开发者大会上,他用RAP的方式给百度地图下了一道指令:“我要从三里屯的团结湖地铁站出发路过望京的家乐福然后再去南锣鼓巷最后到我家,我要红绿灯少的不堵车的最快的路线,你帮我路线规划一下吧。”百度地图语音助手精准识别、理解了这段长达60多字的服务请求,并自然流畅地提供了导航服务,引起现场观众惊呼。原本晦涩的技术,也因为这种生动诙谐的展示方式而被理解和接受。而他的这段“科学家的神级Rap‘调戏‘”也成为口口相传的经典桥段。
面对人工智能行业的火热,有关“行业泡沫”的质疑声不绝于耳。他说:“人工智能这杯酒,虽然有泡沫,但撇去泡沫之后,仍是醇香的美酒。”一个形象的比喻,足以让真正愿在行业中踏实进取的人安心。
在不久前刚刚举行的首届深度学习开发者峰会上,王海峰对深度学习的未来发展做出了论断:“深度学习正在推动人工智能进入工业大生产阶段。深度学习框架是智能时代的操作系统。”看似简单的两句话,背后是他近三十年深耕实践和对人工智能未来发展深度思考的凝练。
实际上,早在2012 年前后,在很多人还不知道深度学习为何物时,他就已经意识到其价值,并带领团队开始将深度学习技术应用逐步应用到百度的语音识别、图像识别、搜索等产品中,成为中国产业界深度学习的尝鲜者和开路人。
成功实践后,他又开始为我国自主研发的深度学习框架奔走呼号。2018年4月首届数字中国建设峰会上,面对当时市场上对于自主芯片技术的热烈讨论,他即指出:“芯片领域的下一步发展,会越来越多和人工智能技术结合,基于人工智能技术转化应用。这就要用到深度学习框架,所以,百度PaddlePaddle等深度学习框架一定意义上相当于人工智能芯片的指令集。”同时,他也进一步呼吁:“我们正处在人工智能芯片开始发展的时期,这是一个难得的历史机遇。我们要抓住机遇,做出领先的深度学习技术和人工智能芯片,继续推动人工智能算法、芯片、行业标准、人才培养、应用落地等产业层面的发展,保障产业和数据安全。在当下中国的语境中,核心科技自主创新已被提高到前所未有的高度,现在回看他那时发出的声音,振聋发聩。
免责声明:
刊登本文仅为传播信息之用,绝不代表赞同其观点或担保其真实性.如认为转载内容已侵权,请联系删除.