TOM首页 > 新闻 > 国内 > 最新 > 正文TOM新闻news.tom.com

百度王海峰:继续人工智能的突破创新

来源:
  
时间:2017-07-14 10:52

端午小长假的前一天,静谧的京西宾馆里,首届全国科技工作者日暨创新争先奖励大会正在举行,表彰在创新争先行动中做出突出成绩的优秀科技工作者。获奖者包括近百位两院院士及各行业领军人才,百度王海峰博士成为互联网领域唯一获奖人。


百度王海峰:继续人工智能的突破创新

(百度副总裁王海峰获全国创新争先奖)

王海峰的获奖,代表了政府及同行认可其在人工智能领域做出的重大贡献,也体现了国家对互联网科技人才的殷切期盼。

“全国创新争先奖“是继“国家自然科学奖”、“国家技术发明奖”、“国家科学技术进步奖”之后,国家批准设立的又一重要科技奖项,是仅次于国家最高科技奖的一个科技人才大奖。今年是第一届评选,以后每三年评选一次。这个重量级奖项体现了党和国家“团结引领广大科技工作者积极进军科技创新”的决心,赋予科技工作者更加光荣伟大的使命。

时间倒推回一年前,习近平总书记在2016年中国科协第九次全国代表大会上发表讲话,明确提出“为建设世界科技强国而奋斗”。在对整个国家的科研体系提出希望和目标的同时,习近平特别指出,今后国家将“支持依托企业建设国家技术创新中心,培育有国际影响力的行业领军企业”。

行业领军人才+行业领军企业—日益强大的中国及其领导者比任何时候都更希望这样的强强组合参与到国家科技强国战略中。

王海峰和百度此刻正站在这样的重要位置上。

最年轻的ACL会士

王海峰是自然语言处理领域世界上最具影响力的国际学术组织ACL(Association for Computational Linguistics)五十多年历史上首位华人主席,同时也是截止目前最年轻的ACL会士(Fellow)。

在王海峰的大力推动下,ACL于2015年登陆北京,首次在中国大陆召开年度会议。百度人工智能在国际上的知名度也与日俱增,吸引了大批优秀人才加盟。首位来自中国大陆的ACL程序委员会主席吴华以及首位来自亚洲的ACL秘书长赵世奇都出自王海峰团队。

回想从本科毕业至今的二十四年,王海峰说,1993年还在读大四的他进入著名机器翻译专家李生教授的实验室,从此投身到机器翻译研究中。

机器翻译是自然语言处理的一个重要研究方向,王海峰说,他认识的世界上大多数顶级自然语言处理专家,都或多或少研究过机器翻译。而语言是人类知识和思维的载体,因此自然语言处理是人工智能非常重要的研究内容。

从机器翻译开始进入人工智能领域,王海峰先后研究了人工智能的很多方向,从未离开这个领域。

王海峰的博士论文,就已将循环神经网络模型用于解决自然语言处理问题。但是在九十年代末期,可采集分析的数据量很小,电脑的计算能力甚至跟现在的手机都没法比。那时只能用很少的数据去跑模型,也有一定的效果,但远远达不到今天的程度。

毕业后,无论是在微软、东芝这样的大公司,还是在创业公司,王海峰一直都在机器翻译、自然语言处理、语音等人工智能领域工作,并始终坚持自己的技术成果能为最多人所使用的目标。

奠定AI基础

2009年8月,李彦宏在百度世界大会上提出 “框计算”。时刻关注行业动态的王海峰敏锐捕捉到这一信息。在他看来,框计算应用的背后需要大量自然语言处理技术,自己多年的研究成果和技术积累有了用武之地。

经过一段时间的沟通了解,王海峰于2010年初加入百度。他的重要职责之一就是组建百度的第一个人工智能核心技术部门—自然语言处理部。

作为技术特征极其鲜明的新部门,王海峰在带领团队满足搜索等业务需求的同时还拟定了一份完整的技术布局及长期发展路线图。

这份路线图中既包括技术发展路线,也包括团队成员的成长路线。藉此,自然语言处理部的团队规模在第一年就翻了好几倍,为百度在人工智能上的发力播下了种子。

2012年初,王海峰带领百度语音技术团队尝试使用深度学习提升识别效果,并于当年下半年成功上线。这不仅是百度,也很可能是中国最早将深度学习技术成功应用于线上产品的时间节点。

在语音识别上取得明显效果后,百度内部又将深度学习运用于图像识别,其效果“足以验证深度学习的价值”。

王海峰回忆说,当时业界一些人对深度学习技术在其它领域,尤其是自然语言处理中可能发挥多大作用还存有疑虑,但在百度内部,了解深度学习算法应用的人已经预判到深度学习一定会在各个领域产生巨大价值。

锻造IDL

深度学习是人工智能的关键技术之一,而百度是世界上最早将其应用到搜索引擎中的公司。王海峰回忆,2012年初,国内听说过这个名词的人并不多,但当时他已经召集百度相关同事一起攻关深度学习的应用。

他的这段回忆与李彦宏在新书《智能革命》中的描述相互印证。

李彦宏在书中写道,2012年他在美国与好友、时任微软高管的陆奇交流。陆奇提醒他美国公司已经展开大规模的深度学习应用研究,中国在这一领域不应该落于人后。

回国后,李彦宏召集技术专家和工程师讨论深度学习,确认百度已经在多个技术方向上开始研究和应用。深度学习在百度业务中的显著应用效果,成为李彦宏决心加快进军人工智能的催化剂。

2013年初,百度深度学习研究院(IDL)成立。王海峰在IDL的筹建过程中承担了主要工作,并为其吸引到诸多骨干科学家。

他说,“在百度,我们具备算法能力、海量大数据以及强大的计算平台,这也是深度学习可以成长为参天大树的肥沃土壤。”

也正是在同一年,美国《麻省理工学院技术评论》杂志将深度学习列为2013年十大突破性技术之首。此时百度已经完成IDL的组建—百度深度学习研究院,成为全球工业界首个直接以 “深度学习”命名的研究机构。朴素直白的名称隐含着百度对人工智能前景的坚定信心。

与AI一起成长

翻开王海峰的简历就会发现,在七年多的百度生涯中,王海峰既是技术专家,又是管理者,还是开拓者。他创建了多个新业务部门,在百度内部完成了一次又一次的“创业”。

2010年起的三年间,王海峰先后创建了百度自然语言处理部、互联网数据研发部、推荐引擎和个性化部、多媒体部、图片搜索部、语音技术部等。其业务方向不仅涉及技术研发,也包括产品应用。

王海峰爱穿部门自制的运动帽衫,儒雅温和。他每天早晨七点多就来到办公室开始工作,八点召开全天第一个会议。

“今天早上八点的那个会议,我在讨论技术问题”他说。

正是这种务实、自驱、负责到底的精神,使得王海峰在管理如此多的重要部门的同时,还能不断孵化新的业务,孕育新的产品。这种精神也体现在百度的每位员工身上。百度搜索引擎每天为数亿人提供服务,正是这些务实自驱的员工们在支撑。每天他们都在为了能更好满足用户需求,不断地完善技术、迭代产品。

2013年王海峰晋升为公司副总裁。几个月后他转岗至搜索业务群组任副总经理,接手大搜索等业务。这种岗位转变使得王海峰看起来在逐渐远离基础技术,成为业务管理者。

王海峰否认了这种说法。他认为,虽然他成为了业务负责人,但是这并不意味着他从此与基础技术绝缘。百度和他本人一直强调技术一定要与业务相结合,应用于业务,百度的各种技术都是为业务服务的。

以百度搜索引擎为例,百度是最早将深度学习技术应用于搜索引擎的,其在搜索结果相关性上的效果十分明显,用户可以更快找到自己所需信息。深度问答、情感分析、语义理解等自然语言处理技术也同样应用在百度搜索引擎中,为用户提供更精准更丰富的搜索结果。而语音技术、图像技术同搜索相结合便有了百度的语音搜索和图像搜索,为用户提供了多样性的交互方式和更便捷的搜索体验。在百度信息流(Feed)产品中,内容理解、用户建模、个性化推荐等是信息流必不可少的关键技术,可以让用户浏览到符合自己个性化需求的资讯。

2015年,王海峰带领百度大搜团队完成了PC和移动搜索的整合,在夯实百度搜索引擎技术基础的同时,也进一步巩固了百度搜索龙头老大的市场地位。同样在2015年,王海峰带队极具前瞻性地设计研发了度秘。一年多之后,最初作为手机百度的一个小功能的度秘,已经成长为百度的主航道业务之一。

2016年,王海峰进一步整合搜索、手机百度、Hao123、新闻、手机浏览器等业务,发力手百及wise首页等多端Feed流,造就了百度Feed流的高速增长,为百度打造了搜索和信息流双引擎,开拓了百度在内容分发领域的新模式。如今,内容分发是百度最关键的主航道业务。

在各种舞台屡屡秀出实力的“小度机器人”也是由王海峰领导下的团队研发出来的。他曾表示对儿时看过的动画片《铁臂阿童木》记忆深刻,小度机器人的诞生圆了王海峰儿时的梦想。这个“萌萌哒”机器人也成为百度人工智能的拟人化形象。

在完成这一长串场景多变、定位复杂和要求颇高的履职后,王海峰已经成长为具有前瞻视野和战略意识的技术领袖和行业资深管理者。他重视基础技术建设和积累,强调技术与业务相结合,在带领业务不断发展的同时,也促进了人工智能技术从实际应用中吸取营养持续进化。所以百度成立AIG并将其帅印交授与他,毫无悬念。

AI人才建设

2017年3月,百度整合自然语言处理、知识图谱、深度学习、语音、图像、大数据等人工智能核心技术,组建百度AI技术平台体系(AIG)并任命王海峰为总负责人。

这个全新的人工智能团队人数超过一千七百人,既有来自海外的顶尖优秀人才,也有百度自己培养的优秀技术专家。

百度一方面在不断吸引和培养AI人才,另一方面也为这些优秀人才提供了发挥其技术能力和价值的平台。在百度这个平台上,丰富的大数据资源为AI技术的研发提供了充分的保障,各种产品和应用使得新技术有机会直面用户真实需求,收获用户反馈并快速迭代。优秀的人才在这里有各种渠道和机会展示自己的才华并实现快速成长。

“我们希望不仅要有很多的优秀产品和技术‘made in Baidu’,也要有很多牛人‘made in Baidu’,这对于整个中国的互联网、中国的人工智能发展都是一笔巨大的财富。总之,我们的人才战略是既面向全球招揽最优秀的人才,也积极培养自有人才。”王海峰说。

比肩AI巨头

从王海峰加入百度组建自然语言处理部算起,百度人工智能已经走过了七个年头。当年他布局的很多核心技术,如NLP、语音识别、图像识别、深度学习等,应用于百度的各项业务,近年来取得了长足进步。

具体来说,百度最先研发了端到端的语音识别技术,其在安静环境下的准确率达到了97%,已经超过人类对语音的识别能力。很多看了《最强大脑》节目的人可能知道,百度人脸识别甚至可以识别出一个人很多年前的照片。

再比如机器翻译技术,百度在业界率先将神经网络翻译(Neural Machine Translation)模型应用于大规模互联网机器翻译系统,并发表了被《纽约时报》称为“path breaking”的相关论文。

同时百度建设了中国最大的GPU集群,为AI研发提供了超强的计算能力。在数据方面,百度拥有全网的网页数据、多年来积累的用户数据,以及百亿级图像、视频等数据,能满足人工智能研究对海量大数据的需求。“海量的真实活数据为人工智能技术进步提供了燃料,促使技术不断提升,并会越来越多应用于产品中。这个过程,正是人工智能的进化。”王海峰补充道,“海量真实数据使得百度AI这部庞大而精密的机器运转得越来越精准。”

2017年开年,原属百度搜索业务的度秘产品线升级为独立的度秘事业部,成为百度人工智能布局中的重要一环。该事业部一项重要业务—DuerOS对话式操作系统作为深耕应用场景的人工智能产品,推出了智能芯片,与国内厂商如海尔等达成合作,逐步进入智能硬件市场。

此外,百度还通过投资并购的方式,先后投资或收购了ZestFinance、渡鸦科技、蔚来汽车、xPerception等科技公司,布局人工智能生态。百度打造了包含底层智能技术、智能机器平台、行业智能化在内的三层人工智能生态。

“今年以来,人脸识别打拐成为两会提案,DuerOS与国内厂商达成合作,百度的新书《智能革命》发售和无人车‘阿波罗计划’公开……百度人工智能的重要消息一直没有间断过。我们对自己的技术,对未来都充满信心。”

得益于领先的人工智能技术和人才优势,百度曾被美国《财富》(Fortune)杂志称为可以比肩Google、Facebook和Microsoft的世界人工智能技术巨头之一。《纽约时报》对百度的报道吸引了整个世界的目光,也让全球科技界注意到这家中国顶尖科技公司在人工智能方面的进展。2016年,美国《麻省理工学院技术评论》杂志评选出的全球最聪明的五十家公司,百度排名第二,这也从一个侧面体现了百度技术实力在国际上的影响力。在今年的IT领袖峰会上,马化腾在与李彦宏的同场对话中承认“我们在人工智能上还是比百度落后不少”。

在《智能革命》中,李彦宏认为人工智能将是未来智能社会中的“水和电”,“平静地环绕、支持着我们”,不可或缺。

正如王海峰所说:“今天人工智能之所以这么热,一方面是由于它为人类描绘了一幅美好的未来画卷,打开了技术改变生活的无限可能;但另一方面更是因为它已经进入了很多实际应用领域并发挥着日益重要的作用。我们将继续人工智能领域的突破创新。人工智能未来不是用来取代人的,而是用来帮助人的。”

责任编辑:那春月 TK001