当前位置:主页 > 新闻中心 > 公司新闻 > 正文

​知者见于未萌:百度CTO王海峰与中国 AI 三十年

2020-06-22 13:30 栏目:公司新闻 阅读() 标签:百度AI人工智能

知者见于未萌。在所有的竞争之中,有远见者都会被厚待。

自然语言处理顶会 ACL 2020 下个月就要召开了。本次大会共收到有效论文 3429 篇。中国大陆提交数量最多,达 1084 篇,其中 185 篇被接收,仅次于美国。

在中国 AI 实力跻身世界前列的今天,我们或许已经习惯了这样的数字。

但大多数人不知道的是:2000 年 ACL 在中国香港举办时,只有微软中国研究院的论文来自内地;到了 2005 年,来自内地的论文也只有三篇。

这十几年的时间究竟发生了什么?我们或许可以从 ACL 首位华人主席王海峰身上找到答案。

王海峰如今在百度担任 CTO。从 2004 年在 ACL 上发表论文并参会后,他就再也没缺席过这一会议。2010 年,他被选为 ACL 主席,这也是 ACL 创办 50 多年来首次有华人当选。2016 年,王海峰又当选了 ACL 会士,成为首位获此荣誉的中国大陆科学家,也是 ACL 目前最年轻的会士。

而王海峰从未缺席的,还有中国 AI 近三十年来的高速发展。

王海峰本、硕、博都毕业于哈尔滨工业大学。在百年校庆之际,哈工大以成书的形式记录了优秀学子们在哈工大求学以及阔别母校之后的人生旅程,王海峰便是其中一位。

这本书最大的价值在于,它不仅仅是一部王海峰的个人成长史,还记录了一段中国人工智能的学术史、教育史与应用史,而王海峰既是其中的亲历者,也是推动者。

AI 是一场残酷的战争,当很多人尚未意识到起跑线的存在时,比赛就已经开始了。幸运的是,以王海峰为代表的中国研究者很早就看到了这条起跑线。

王海峰对 AI 的洞察体现在他学术、产业生涯的各个阶段,先是将神经网络引入机器翻译,让中国机器翻译从规则、统计方法时期的一路跟随,发展到在神经网络时期向无人之地迈出了第一步。之后,他又预见到了中国互联网产业的无限机遇,在百度建立起完整的 AI 落地应用体系。之所以能做到这些,离不开王海峰对整个 AI 技术领域的长期观察。

在产业智能革命席卷而来的今天,我们不仅能从王海峰身上看到中国和 AI 历史握手的关键节点,还能看到王海峰对于智能产业革命发展的思考。

著名科幻作家刘慈欣在推荐语中写道,“科学是科幻小说的源泉,在我心中,科学前沿和科幻前沿的关系,科幻肯定是跟在科学后面。这本书中介绍的王海峰博士,是中国人工智能科学家成长的一个缩影。我推荐热爱科幻的读者们看看这本书,看看建筑着未来想象力的发端之处。”

接下来,让我们一起走进这段历史。

1989~1999:十年哈工大求学生涯

1989 年,王海峰进入哈工大。在大四做毕业设计时,他来到了李生教授的实验室。在那里,王海峰以机器翻译为媒介,真正与 NLP 相遇了。

原哈尔滨工业大学计算机系主任李生教授。

李生教授从 1985 年就开始研究机器翻译,彼时,中国的 AI 研究还是一个独立而贫瘠的孤岛。在王海峰刚刚入学时,李生教授带头研制的汉英机器翻译系统 CEMT-Ⅰ 就已经成为我国第一个通过技术鉴定的汉英机器翻译系统。1993 年,在王海峰进入李生教授的实验室时,CEMT 系统已经进化到第三代,也早已投入实际应用并获得了不少好评。

李生教授交给王海峰的任务是对 CEMT-Ⅲ 进行优化,并定下了三个目标:提升效率、整合源代码、降低系统维护难度。王海峰善于化繁为简,将 CEMT-Ⅲ 的源代码进行了模块化处理,又在模块之间彼此建立关联,方便在修改代码和系统维护时缩小范围,进而提升效率。回忆起王海峰当时对 CEMT-Ⅲ 的优化,李生教授至今仍然感慨于他在这项看似发挥空间不大的工作中展露出的能力与天分。

继 CEMT-Ⅲ 之后,王海峰又参与了 “863 计划” 的一个重要项目——汉英双向机器翻译系统 BT863。当时王海峰在读研究生,他在 BT863 的汉译英方向做规则知识库的建构,以及计算机软件等方面的准备。

据当时在哈工大实验室工作的学生回忆,那时实验室经费很紧张,即使是 BT863 这样的重点项目,一年也只有十几万元。此外,资料的获取也非常困难。王海峰需要奔波于北京与哈尔滨之间,从国家图书馆复印几千页的资料后再用旅行袋背回。

在这样的条件下,王海峰等人完成了 BT863 的设计。在测试过程中,他们的系统在汉译英部分获得了全国第一,用一分钟左右完成了对 200 句话的翻译。在今天来看,这种速度几乎不值一提,而且整个程序还要装在一块沉甸甸的硬盘里。但当时,这一成绩给了王海峰和其他哈工大人很大的鼓舞。

在参与这两个项目的过程中,王海峰对基于规则和统计的机器翻译技术都有所涉猎。当时,这两个方向的机器翻译系统已经开始投入商业化应用,很多人都在努力扩大词典库、积累句法规则数据,在既有方向继续深挖下去。但是,王海峰的视野没有局限于此。

在本科和硕士期间,他就已经开始认识到神经网络这种参照人脑认知模式的计算方法。在博士期间,他开始思考,自己能否去尝试一些更新的东西。

在这个重要的节点上,王海峰的博士生导师高文院士带他进入了更大的世界。

中国工程院院士高文。

高文曾经在美国卡内基梅隆大学机器人研究所和美国麻省理工学院人工智能实验室访学,1996 年,他就任于国家智能计算机研究中心与摩托罗拉共同设立的先进人机通信技术联合实验室(JDL),王海峰作为博士生也一起来到了北京。

这段时间,王海峰发现,在海外(例如卡内基梅隆大学),已经开始有人将神经网络应用到语音处理之中。但是,当时应用更广的是多层前馈神经网络(BP 神经网络),不能对上下文进行有效建模。针对这个问题,王海峰开始寻求突破。他将循环神经网络的方法引入了机器翻译领域来反映上下文关系,而且取得了很好的效果。

即使在世界范围内,将循环神经网络引入机器翻译领域也不算常见,在国内更是首创。在王海峰等人的努力下,中国机器翻译从规则、统计方法时期的一路跟随,发展到在神经网络时期向无人之地迈出了第一步。

而后来的发展也证明,王海峰选择的方向是正确的。

1999 年,王海峰博士毕业,结束了在哈工大的十年求学生涯。此时,王海峰面临着一个很多人都会面临的选择:留在学校任教还是去业界闯荡一番?

最终,王海峰选择了后者。

1999~2010:十年业界初探

在王海峰博士毕业之前,李开复曾经到哈工大演讲,跟王海峰进行了一场对话。被李开复问及毕业后的打算,王海峰回答说:“我搞了这么多年研究,我希望研究的东西有用。”

抱着这种信念,王海峰走进了业界,而且第一站就是李开复一手创建、有着人工智能 “黄埔军校” 之称的微软中国研究院。当年与王海峰一起报考的有两千多位博士,最终仅有 27 位被录取。

在刚刚加入微软的时候,李开复教王海峰如何做语言模型,手把手教他推公式,帮他改论文。这段时间,王海峰与同事合力完成了微软中国研究院第一篇从零开始的论文。

半年之后,王海峰就转组开始从事搜索的研究。又过了半年,由于微软总部叫停了搜索项目,王海峰也就萌生了离开微软的想法。

虽然在微软只待了短短的 15 个月,但王海峰通过这扇窗口见识到了产业界如何思考问题、解决问题。这对于此后他始终坚持走在产业一线、投身人工智能的产业化进程至关重要。

离开微软之后,王海峰在香港的一家互联网初创公司工作过一段时间,但在互联网降温之后又很快回到内地,加盟了当时刚刚成立的东芝中国研究开发中心。

在东芝的这段时间,王海峰不仅成长为一位出色的领导者,也是一位高产的学者。据不完全统计,这一阶段他发表的学术论文就有 43 篇,涉及自然语言处理、语音基础理论研究以及机器翻译系统的研发等领域。这段时间,他发表了自己的第一篇 ACL 论文,2006 年更是一人中了 5 篇。此外,他的研究成果被应用于东芝的众多产品中,比如车载芯片。

但随着王海峰在业界探索的不断深入,他发现东芝的平台能够提供的应用场景渐有不足。他意识到,想要拥抱更广泛的应用场景,必须具备更多的数据,更大的实验平台、应用平台。而这些条件,蕴藏在冉冉兴起的国内互联网行业。

最终,他选择了百度。

2010~2020:十年百度生涯

为什么是百度?相信大家都会有这个疑问。其实,当时就连王海峰的朋友、同事也对这个选择颇感困惑。因为在他们看来,当时王海峰的去处应该是微软、谷歌这样的国际大企业,或者是顶级科研院所。

对于这个选择,王海峰有着自己的预判。

据王海峰自己回忆,2007 年的时候,他就感觉到未来是属于中国本土企业的。而从他依然希望投身产业界的角度来看,高速发展的互联网产业是最佳选择。在互联网公司中,百度显然又是最擅长技术、最尊重技术人才的。

从研究方向来看。机器翻译的进一步研究和探索,离不开互联网的兴起带来的语料爆炸。而百度的搜索业务,又是互联网世界中最好的语料留存中心。很多科学家都表示,想要进一步探索语言秘境,百度是天然的“矿藏”。同时,百度还是一个连接千万用户的技术出口,可以帮王海峰的技术找到更多的应用场景。

2009 年 8 月,李彦宏在第四届 “百度世界大会” 上推出了全新计算平台 “框计算”。当时,王海峰敏锐地判断出,如果百度想要朝“框计算” 方向进一步发展,就需要更强大的自然语言处理技术的支撑。尤其是语言分析、语义理解、知识获取等方向,百度将面临非常多前所未有的工作,需要在技术深度上寻求突破。而这些领域,恰好是王海峰所擅长、所追求的。

2010 年,王海峰开启了自己在百度的职业生涯。

初入百度时,王海峰做的第一件事就是成立了“自然语言处理部”,以服务搜索引擎中产生的相关需求。此外,百度 NLP 研究的范围逐渐包括了一些当下应用性没那么强、 却更具前瞻性的技术方向,如语义搜索、语义理解、智能交互、深度问答、 篇章理解等。这些技术为之后百度在 AI 技术领域的领先打下了坚实的基础。

当然,如果只是在 NLP 方向布局,我们之后看到的百度 AI 不会像今天这样遍地开花。

几乎在成立 NLP 部门的同一时期,王海峰就已开始着手布局语音技术和视觉技术,牵头组建了当时的 “多媒体部”。在王海峰的推动下,“多媒体部” 很快就取得了大量的研发成果:在语音方面, 有围绕语音识别的复杂声学建模、海量语言模型和高速解码等关键技术;在图像方面,他进一步推进了图像识别、图像分类、图像搜索以及 OCR 等技术的完善。2012 年年中,百度多媒体部门开始推动这些技术的产品化,使其进入了用户的视野。

在基础研究方面,2013 年,王海峰作为执行负责人协助李彦宏创建了世界上第一家企业深度学习研究院(IDL),这个时间早于普通人对于深度学习的第一印象——李世石大战 AlphaGo。而在 2011 年,王海峰等人就已经预判出深度学习在产业界将大有可为。

筹备过程中,王海峰完成了两项至关重要的奠基工作。第一是为百度深度学习研究院明确自身定位,让百度深度学习研究院专注于基础研究。第二是招揽研究人才,为百度深度学习研究院奠定了人才基础。

在此之后,王海峰开始对百度的技术平台化进行了初步推动,成果就是我们今天看到的飞桨等 AI 开源开放平台。

2020 年 5 月,王海峰发布飞桨平台最新全景图。

2017 年,经过数年的技术积累,百度已经为迎接 AI 的全面到来做足了准备。而王海峰接到的任务。就是将百度多年积累、分别发展的各条 AI 战线整合起来。也是在这一年,王海峰被任命为百度新组建的 AI 技术平台体系 (AIG)总负责人。

AIG 基本整合了当时百度体系下的所有 AI 相关技术研发部门,包括自然语言处理、知识图谱、语音、视觉、大数据、AI 平台与生态,还有百度深度学习实验室、大数据实验室、硅谷人工智能实验室等在内的百度研究院。对于王海峰来说,他不仅仅是要将原有的一个个独立的技术部门在物理上组合进 AIG,更要让它们在技术上和管理上都发生化学反应,实现真正的融会贯通。

为了让整个 AIG 在战略层达成一致,王海峰设定了 AIG 的三项基本任务:巩固核心技术,把每项 AI 技术做扎实,并且保持敏锐的前瞻技术布局;用 AI 技术,全面支撑和优化百度业务;面向外部需求,进行 AI 的生态赋能、人才培养以及商业化探索。

AIG 整合后表现出了强大的技术优势,催生了百度大脑等综合性很强的产品和平台。

2019 年 7 月,王海峰宣布百度大脑升级到 5.0。

到 2018 年底,AIG 迎来了另一次重要的架构调整,其中最吸引外界关注的是,王海峰同时担任百度人工智能技术平台(AIG)和基础技术平台(TG)的负责人。这意味着百度在基础技术领域的布局,比如系统、基础架构、安全、工程效率等技术部门,与 AIG 完成了完整会师。至此,AIG 作为面向人工智能时代的技术基础设施,为百度和全产业提供人工智能底层支撑的定位更加明晰。王海峰团队在百度整体布局中的作战范围再次升级。

2019 年 5 月,李彦宏通过内部信,宣布王海峰担任百度首席技术官(CTO),同时继续担任 AIG 和 TG 总负责人。外界认为,这一方面反映出百度整体对 AI 技术的坚定信任,以及对王海峰及其团队的深刻认同,另一方面也反映出王海峰将担负起更重要的战略任务,在百度发展产业智能化的新路线担负更多责任。

2020 年 1 月,王海峰发布内部架构升级邮件,宣布原 AIG(AI 技术平台体系)、TG(基础技术体系)、ACG(百度智能云事业群组)整体整合为“百度人工智能体系”(AI Group,新 AIG)。新 AIG 包含技术中台群组(TPG)和智能云事业群组(ACG),继续由百度 CTO 王海峰整体负责。同时智慧政务、智慧医疗、智慧金融、智能客服与营销四大业务板块升级为四大事业部,并在工业互联网、视频、物联网、工业质检、物流地图等领域加大投入。相关负责人继续向王海峰汇报。

从 2010 年到 2020 年,王海峰不仅帮百度早早地站在了 AI 产业化的起跑线上,还促成了一系列技术和产品的落地。开源方面的持续发力使得百度拥有了中国第一个也是唯一一个功能完备的开源深度学习平台飞桨;“多媒体部”和深度学习研究院的成立为之后 Apollo 自动驾驶等技术的落地早早埋下了伏笔;AIG 等部门、群组的整合更是催生了全方位输出各种 AI 能力的百度大脑。业内有评价,王海峰擅长让项目落地——

让 AI 真正像水和电一样渗透到人们的日常生活。

从 1989 年今天,我们从王海峰身上看到了一段中国人工智能的学术史、教育史与应用史。但除此之外,我们还能从他身上看到中国 AI 的一段“出海史”。

ACL 首位华人主席,中国 AI 的“中坚一代”

前面已经提到,在李生教授刚开始 NLP 研究的时代,中国的 AI 研究还是一个独立而贫瘠的孤岛。中国的研究者很难获取国际 AI 研究的一手资料,国外的研究者也对中国的 AI 研究知之甚少。

到了王海峰的时代,情况有所好转,中国的研究者逐渐走向世界舞台,在世界顶级期刊上发表论文,但学术影响力还稍逊一筹。

于是,王海峰想到一个方法:竞选 ALC 主席。

ACL 是自然语言处理领域影响力最大、最具活力的国际学术组织。NLP 领域最有影响力的几个国际学术会议,包括 ACL 年会、EMNLP、NAACL 等,都是 ACL 旗下会议。

王海峰在竞选时向 ACL 做出了几项保证:1)推动 ACL 在中国的发展;2)提升亚洲 NLP 社群对 ACL 的贡献率;3)加强 ACL 同产业界的联系。从王海峰自身的学术成就、影响力以及他 “中国科技企业代表” 这一独特身份来看,这些承诺都是很有说服力的。最终,王海峰在全球会员投票中成功当选。

2013 年, 王海峰出任 ACL 主席。

在 ACL 任职期间,王海峰提名了众多优秀的中国学者进入 ACL 承担职务,包括周明、赵世奇、吴华、刘洋等一大批中国 NLP 人才。

2015 年,随着中国 NLP 方面的学术成果越来越引人瞩目,当年的 ACL 年会在北京举办。这也是国际 NLP 领域的学术盛会第一次来到中国大陆。在提名终身成就奖这一奖项时,王海峰提议评选一位亚洲人,而且最好是中国人,以提升 ACL 在中国的号召力。最终,李生教授通过重重票选,成为 ACL 成立 53 年以来第一位获得终身成就奖的华人。

2015 年,前 ACL 主席、斯坦福大学教授克里斯托弗 D. 曼宁为李生教授颁发 ACL 终身成就奖。

到 2017 年,ACL 收录论文中亚太地区作者的比例甚至一度达到了 33.3%。

2018 年,在第 56 届 ACL 年会开幕式上,时任 ACL 主席 Marti Hearst 宣布创建亚太区域分会(AACL)并计划在 2020 年举行首次会议。之后每两年举行一次会议,会议地点将设置在亚太地区(今年受疫情影响已改为线上),由王海峰担任 AACL 创始主席。在 AACL 成立之前,ACL 还在欧洲和北美两个地区设有分会,而距离在 1999 年成立北美分会,已经过去了二十年。

对外,王海峰帮助中国 AI 走向了世界。对内,王海峰承担起了培养下一代 AI 人才、在更高层面为中国的 AI 发展出谋划策这些责任。可以说,以王海峰为代表的 AI 人才构成了中国 AI 的中坚力量。

虽然已经投身业界,但王海峰还在坚持带博士生,而且对于博士生非常严格。对于博士毕业生的研究成果,王海峰甚至会一条条地盯着实验数据,眼里容不得一丝不严谨。他兼职博导时带的学生赵世奇表示,王海峰改东西时,都是一个字一个字地改,英文论文则是一个词一个词地改,去钻研细节而不是泛泛地提一提宏观的意见。

此外,王海峰还在深度学习技术及应用国家工程实验室、类脑智能技术及应用国家工程实验室、中国电子学会、中国中文信息学会等国家项目、学术组织以及企业中任职,站在更高层面为中国的 AI 发展奉献力量。

王海峰的勤奋有目共睹,也影响了很多人。甚至百度中还流传着一个 “传说”——王海峰“这辈子” 都没睡过懒觉。但也正是这种勤奋、一丝不苟让我们感受到了这股 “中坚” 力量的坚实和中国 AI 的希望。

百度董事长兼首席执行官李彦宏在序言中写道,希望立志于投身 AI 的青年朋友们,从海峰的故事里看到一种精神和方向。

对于未来 AI 产业的发展趋势,王海峰提到了三点:

第一,在技术层面,深度学习之外的算法和技术会出现。比如小数据学习、低能耗学习,随着对人脑机制的深入了解,新的认知机制和算法将会逐步探索出来,弥补深度学习的一些先天缺陷。

第二,产业层面,不要追风口。在王海峰看来,历史上很多最后成功的往往不是第一个冲出来站在风口上的人或公司。只有扎扎实实地积累,抓住新技术的窗口期,才能一步步把 AI 这个大方向做好。

第三,个人层面,打好基础多实践。对于刚刚进入 AI 或者想要进入 AI 领域的年轻人,王海峰认为,打好基础才是关键,越是掌握基础的东西,比如数学与编程能力,后面才能走得越远。

王海峰的这些想法与其导师李生不谋而合。李生认为,“现在中国 AI 需要做的,就是消除一些短视行为,不盲目沉迷于一时的收益,扎扎实实以科学的态度做科学的工作。在追求科学与真理的光明坦途上,中国 AI 还会走过无数个 30 年。”

x

注册开户获取更多客户

x

恭喜您提交成功

百度推广咨询员会在8:30-18:00以官方电话 021-39185250进行回拨,请您注意接听,谢谢!

了解更多产品资讯