01 简史:互联网风云背后的人工智能生长(2 / 2)

超强大脑汇聚</h2>

十多年前机器学习领域的少数坚持者,现在成了最宝贵的人才。人工智能浪潮兴起之后,在这个开源的世界上,除了数据,最稀缺的资源就是人才了。

人工智能背后的专业知识与数学、生物学等基础学科有极大相关性。人工智能科学家又是这些领域的翘楚,更显难得。但全国人工智能研究方向的博士生、研究生每年只有不到200人,而如今的创业公司多如牛毛,这个数字根本不够分。国内如此,国外亦然。2015年,优步直接挖走了卡内基梅隆大学国家机器人研究所140名研究人员中的40人,引起业界一片哗然。

以上还不是人才竞争的全部。从业者更为敏感的是学术领军人物的流向。最近两年,不少&ldquo;学术明星&rdquo;走出象牙塔,或跳槽,或创业,让人更真切地感受到风向的变化。激流涌动,宝贵的人才去哪里才能充分发挥自己的价值,这是个问题。

百度是中国人工智能产业的代表,大量顶级人才先后投身百度:王海峰加入百度前曾就职于微软,吴恩达从美国来到百度,张亚勤从微软来到百度,林元庆从盛产机器学习专家的NEC美国实验室来到百度、机器人小冰的创造者景鲲从微软来到百度、美国科技巨头中职位最高的华人高管和人工智能技术权威陆奇放弃微软副总裁职位加盟百度......同时,也有很多人才从百度出发,创造了自己的人工智能应用公司。百度本身就是中国在吸引和培养人工智能人才方面活力的缩影。

这么多人类的超强大脑汇聚,目的是要创造划时代的中国大脑。我们经历了PC时代,正处于移动互联网时代,即将迈入一个万物互联的超级智能时代。万物数据汇合,人类加以处理,就可能产生一种&ldquo;超级大脑&rdquo;的生态。百度正在打造这样的生态,宗旨在于像提供水和电一样让人工智能渗入中国人乃至所有人的生活中去,努力促使世界万物向&ldquo;知化&rdquo;[2]的方向发展。比如,百度大脑已经初步具有了自己的眼睛、耳朵、嘴巴和认知决策能力,总体来看,相当于一个儿童,但局部能力如翻译、语音识别、图像识别能力则大大超过人类。我们把这些能力开放给大家,供人们开发探索各种人工智能应用。百度大脑已经成为很多开发者的工具和人工智能的操作系统,促进了人工智能标准化的形成。这将全方位服务人工智能时代的企业、创业者和广大个人用户。

因此我们热切呼唤中国大脑,呼唤国家总体层面的深度学习服务器、算法、应用基础设施平台。中国大脑的形成,将是中国竞争力全方位升级的体现和中华复兴的强力加速器。

<h2>

技术要做人类生命的延伸</h2>

说到人类的数据滋养人工智能,我想先来谈一谈我们的用户,谈一谈无数支持百度以及高科技互联网发展的消费者。

在今天,除了谷歌、微软和BAT这样的大公司,互联网和大数据技术的&ldquo;去中心化&rdquo;发展趋向,使得小企业、有才华的技术人员甚至广大用户都成为具有决定格局态势的力量。

<img src="/uploads/allimg/200412/1-2004120Q230125.jpg" />

图1-4 《硅谷商战》一页

我在《硅谷商战》里就强调了用户的重要性。在我们工程师的眼中,用户是一个严格定义的理性存在,用户需求&mdash;开发&mdash;反馈,是技术文档里的严密描述。但是互联网的发展不仅提供了技术服务上的方便,也提供了思想和情绪发挥的舞台。我们可以说,互联网创造了一种意见型用户。

我们的很多程序员、工程师都很享受百度对技术工作者的宽松环境,简单可依赖。技术员想法单纯,不善交际,醉心于开发出五花八门的产品。具有各种情绪的、活生生的用户和我们工程师的习惯思维不太一样。普通人生活中的点点滴滴以及商场上各种复杂多变的交易和情绪可能是我们实验室里工程师感受不到的。媒体人、公关人更能理解用户的情绪,我们的公关部门有时也会吐槽技术人员不理解用户心理,遇到问题常常以为修改了代码bug(漏洞)就好了。但是人情bug不是代码能够修补的,这对我们是一个触动。技术员与商人和普通用户的隔阂该如何打破,是我们必须考虑的问题,需要我们有更高的产品思想和跨界学习的谦虚心态。

我们对日常用户生活需求和人性的思考是一个持续不断的工作,需要持之以恒。但就这本书的主题来说,我们毕竟是工程师,我们始终不忘考虑如何用技术和数字满足用户的需求。我们要利用技术对数据进行精准区分并服务于不同用户。

数字化,这是从尼葛洛庞帝的《数字化生存》到凯文&middot;凯利的《失控》和《技术想要什么》一直在讨论的趋势,也是技术人才念兹在兹的事情。除了工商、金融、农业、军事、科技数据以外,包裹我们的是生活数据。说到数据总会引起一些警惕,比如隐私数据会不会被贩卖?这个话题我们后面还要说,这里简单来说,人工智能眼中的数据绝不是低学历数据贩子眼中的身份证、密码等数据。今日人工智能重在从混沌数据里发现总体&ldquo;模式&rdquo;,进而优化生产、服务。翻译、语音识别和图像识别的进步就是最好的例子。这些混沌数据,经过人工智能识别规律,就会对人类产生巨大价值,比如从日常领域的语音识别到金融领域的征信防骗再到国家层面的反恐安全。

技术再好也要适应用户。产品端直接响应用户的需求,需要不断优化技术的表现形式。我们认为,好的人工智能要润物细无声,不能像电压不稳定的电源,不能像有污染的水。要不断提高准确率,优化产品细节。比如有的公司语音识别技术虽然不错,但是输入法整体设计不够方便,这就影响了用户体验。百度也有不成功的产品例子,需要和用户一起来改变。

数据和技术不是冰冷的存在,和好的人工智能方法结合,就会体现出人性的一面。

很多网民对图1-5印象深刻。这是2014年初在东莞&ldquo;扫黄&rdquo;之后,百度地图运用数据可视化技术,描绘出东莞与中国各地的迁徙线路热度。

<img src="/uploads/allimg/200412/1-2004120Q2314M.jpg" />

图1-5 东莞8小时迁徙图(正月初十22点前)

注:使用手机百度或智能革命App扫描图片可见AR效果。

有资深新闻编辑告诉我们,当时看到百度这幅图,瞬间感觉超越了新闻事件本身,有一种俯瞰人间的领悟。百度迁徙指数通过数据可视化技术反映了人类的命运和迁徙。数字时代的人群迁徙只是百万年来人类大迁移史诗中很小的一页,却是大数据时代具有历史性的一页。

我要说,这也是人工智能时代具有历史意义的时刻。这是智能地图技术对人类活动、人类命运的感知。人工智能本身尚无人性,但是结合开发者的创意、理念,就可以提供新的视角,甚至是一种别样的人性关怀。

计算机和互联网都是人工智能的身体,每个数据都是人类活动和人性的记录,人工智能因此终于像&ldquo;灵魂&rdquo;一样涌现而出,它是可以有人性的。

<h2>

数据大道</h2>

有位哲学家说,人类是一种&ldquo;在路上&rdquo;的存在。百度积累了海量的地图数据,辅以设计师的智慧和各种精巧算法,可以描绘出人类的各种移动行为,感知人们在路上的生存状态。

百度地图每日位置服务次数最高突破720亿次,每一次都是人类的活动记录。图1-6是北京中关村一天的通勤记录的数据化展示,奔涌的交通热力图和节奏,仿佛这座城市的生命脉搏。

<img src="/uploads/allimg/200412/1-2004120Q231620.jpg" />

图1-6 北京中关村一天的通勤记录

注:使用手机百度或智能革命App扫描图片可见AR效果。

地图之眼具有大视野,通过图1-7,可以感受到中国中部、西部地区的发展态势&mdash;&mdash;西安、郑州、武汉、合肥与北京、上海、深圳等一线城市的联系越来越紧密。

<img src="/uploads/allimg/200412/1-2004120Q231H6.jpg" />

图1-7 城市间交通热力排行图

我们这一代人都听过童安格的歌:&ldquo;为了生活,人们四处奔波,却在命运中交错。&rdquo;我希望在人工智能的帮助下,人类的轨迹不只是交错,还有交集,汇流成河,生生不息。

百度大数据实验室一位年轻的科学家是学生物学出身,之前在普林斯顿研究鱼群的运动规律,一看到百度迁徙图就决定回国了。他说,原来人的数据也可以像鱼群这样研究,而且更方便,所以他决定来百度工作。2016年,他和同事一起利用百度地图上的搜索数据变化状况,准确预测了iPhone(苹果手机)销售量的下降。通过数据,大数据实验室为各种城市生活、企业运营提供智能感知。

2014年交通运输部提出:要深化改革,务实创新,加快发展&ldquo;四个交通&rdquo;,加快建设市场导向、企业主体、产学研结合的行业技术创新体系,促进科技成果转化为交通运输生产力。着力建立多渠道、多方式的交通运输出行信息服务体系,初步建成综合交通出行信息服务平台,向社会即时发布出行信息,解决出行信息不畅等问题。

在此背景下,百度提出了&ldquo;中国智慧交通云服务平台合作计划&rdquo;,与交通运输部公路科学研究院、国家智能交通系统工程技术研究中心共同打造合作平台,依托交通运输部重点科技项目&ldquo;基于云平台的开放式公共出行信息服务研究与示范&rdquo;,激活现有数据,建立部省数据信息资源共享交换机制,促进政企间出行服务信息共享应用,并对全社会开放。

智能地图可以根据用户移动快慢测量道路的拥堵程度,还可以智能规避单双号限行路线。结合虚拟现实技术,可以让人身临其境般寻找路线。以交通大数据为基础,加上算法辅助,响应交通管理部门的需求,智能地图系统已经能为城市交通缓解提供解决方案,大大减少了交管部门的压力。

智能地图对地理数据的收集使得很多智能项目得以展开。达到厘米级精度水平的高清地图技术已经运用到无人车开发中。2016年世界互联网大会上,百度无人车在乌镇进行了公开测试和试运营。体验全程3.16公里,共经过3个红绿灯以及一次掉头,不仅面临人车混行、电瓶车穿行等多种复杂路况,还需应对中雨、薄雾、雾霾等多种天气状况。这个结果丝毫不落后于硅谷同行在北美进行路测的进度。这是无人车的一小步,但必将成就人工智能的一大步。

人工智能不是从天上掉下来的,正是从几十年来计算机网络技术和数据处理技术的进步以及人类的数据生活之中水到渠成的。百度搜索和百度地图的智能化发展就是这个过程的一个缩影。

<h2>

人工智能既不是神话也不是笑话</h2>

如今各种大众媒体上关于机器人的新闻很多,凑热闹的也很多。比如前阵子有新闻报道,一个展会上有一台机器人伤人。其实那只是一个教育辅助机器人,掉下台砸到人而已。还有某个墓园买机器人给守墓保安壮胆的新闻,那个机器人充其量是个玩具而已,恶搞成分更多。如果我们以科普的心态看待历史,就会发现人工智能既不是神话也不是笑话,而是从人类的劳动创造中实实在在生长出来的。我们不需要恐惧也不需要顶礼膜拜。

人工智能领域的科学家对技术的描述常常是直白而谦虚的。谷歌前工程师吴军说过,他在2003年的时候和同伴一起把谷歌的关键词搜索准确率大大提升,解决的一个主要问题就是,对于同义词或者近义词究竟该选取哪一种意思去搜索才能满足用户的需求。对于用户来说,如果搜索给出的结果不准确,用户就会换个近义词继续搜索,或者选择搜索结果中排名并不靠前的结果。这时用户其实亲自做了一个关键词搭配工作,系统会记录下用户给出的关键词搭配关系,现在要做的是更快、更优地反馈结果。他说:&ldquo;至于我们是怎么做到的,说起来可能会显得很没有技术含量,我们事先把多年来用户搜索过的关键词搭配都整理出来,然后在2003年美国独立日的长周末期间,有四天的假期,我们停掉了公司当时五个最大的数据中心中的一个,利用四天时间对每一个关键词的搭配做了特殊处理。这实际上就是一种穷举法。&rdquo;[3]也就是把用户经常选择的词语组合关系固化下来,下一次用户再做类似搜索,系统就能更快、更准地给出结果。

其实机器翻译等领域的技术逻辑,跟上述搜索中应用的有策略的穷举法有异曲同工之妙。据《纽约时报》报道,2016年6月的一个星期三,在谷歌翻译部门的会议上,人们对百度发表在机器翻译领域核心期刊上的一篇文章议论纷纷。迈克&middot;舒斯特(Mike Schuster)的一句话让会议室恢复了秩序,&ldquo;是的,百度出了一篇新论文。感觉就像有人看透了我们做的东西&mdash;&mdash;论文有类似的结构,类似的结果。&rdquo;百度公司的BLEU分数(一种衡量机器翻译和纯人工翻译之间准确度的分数)基本吻合谷歌在2月和3月内部测试中取得的成绩。Quoc V. Le (夸克&middot;维&middot;乐)并未感到不快。他的结论是,这是一个表明谷歌处于正确轨道上的迹象。&ldquo;这个系统与我们的系统非常相似。&rdquo;他安静地说。

Quoc V. Le是吴恩达的博士研究生,他可能并不知道,这篇论文的出炉与吴恩达并无关系,而是自然语言部门独立完成的。《纽约时报》对中国企业的报道当然是一扫而过。但吴恩达认为,国内部分媒体也需要改变习惯,不能总是下意识地认为什么技术都是外国更强,热衷于把后知后觉者当作突破者来报道,实际上人工智能领域很多领先创造都是中国人先做到的。

百度领先一年发布了基于NMT的翻译系统,谷歌在2016年也紧跟百度推出了类似的系统。所以这个领域最前沿的探索者的基本技术都差不多,最后就看谁的积累深厚,谁的优化做得好。

今天的人工智能思路与过去不同,变思维规则问题为数据问题和策略问题。过去人类总想为计算机设计出完美的逻辑,不断把人类的种种逻辑规则抽象成函数之后输入计算机里。现在的人工智能主要基于大数据基础和算法的进步。也就是说,今天人工智能的爆发恰恰建立在20世纪90年代末互联网爆发的基础上。有了互联网,数据才会大量产生。注意,这些数据不是用户自觉填写的数据,比如姓名、年龄、住址、爱好等,而是用户在使用互联网时自动产生的数据,比如每一次搜索、每一次点击就是一种数据,每一次移动轨迹也是一种数据。

中国已经是世界头号制造业大国,现在更需要的是提升&ldquo;软实力&rdquo;。精神、文化是&ldquo;软实力&rdquo;,计算和数据也是&ldquo;软实力&rdquo;。这样的&ldquo;软实力&rdquo;和传统产业叠加,也就是所谓的&ldquo;智能+&rdquo;。它将切切实实融入我们的生产、生活,看得见、摸得着。

<h2>

非如此不可</h2>

问百度要做什么,不如问为什么一定要做?!

每家企业都有自己的战略战术。2013年,国内移动互联网创业风潮开始兴起,不少企业将巨额资金投入这个巨大的&ldquo;无底洞&rdquo;,体现了它们在战略上的勇猛。百度则着眼于战略的长远和科学。当时注意到百度全面发力人工智能的人并不多。今天,人工智能蜚声世界,有人感叹百度战略的超前和坚定。因为百度提前认识到互联网信息产业的本质,一旦下定决心,就坚决走自己的路,不在乎外人评判。为此百度多方布局,重点突破,当全世界都开始关注人工智能的时候,人工智能大格局上已经有中国百度立下的柱石。

我们没有让百度的人工智能去参加下围棋、预测歌手比赛结果这类活动,而是专注于发展内功,同时集中力量把人工智能转化为能够改善人类生活的实用性服务。我们不只把深度学习应用到语音识别、机器翻译和街景门牌号识别等少数领域,而是将深度学习成功应用于显著提升用户体验。

2013年,百度导航率先宣布永久免费,把中国带入导航免费时代。现在,我们把百度地图的数据接口开放出来,供人们开发使用。用户可以使用百度地图提供的定位技术和方案,相比传统GPS Tracker(全球定位系统追踪器)节省了大量成本。快递公司可以以此规划最优送货路线,游戏开发者可以开发类似PokermanGo(口袋妖怪)的位置游戏。我们开放百度大脑,让更多的人可以使用人工智能的眼睛、耳朵为自己服务。我们开放深度学习开发平台PaddlePaddle,让更多有志者可以创造属于自己的人工智能服务。我们也希望让非技术人员学会用数据智能优化自己的工作、完善自己的个性、追求自己的理想。

有很多高考考生想必已经使用过度秘机器人帮助自己选择高考志愿。在中国,任何事情都有很多人去做。在我读书的年代,人们把高考称作&ldquo;千军万马过独木桥&rdquo;。和地图数据类似,度秘机器人通过对千军万马的高考数据进行分析,通过深度学习技术响应并感知高考考生的渴望、焦虑,尽力给出自己的精准回应。在这里,人工智能记录的不是物理空间里的地图轨迹,而是学子成长的心灵轨迹。

20世纪90年代初我远赴美国学习计算机技术,当时有很多和我一样的年轻人,怀着用代码改变世界的愿望,候鸟般往来于中美。如果当时有一张数据地图记录这些跨洋轨迹,那会是很有意思的事情。如今人工智能科学家再次把火种带到中国,我相信这次火焰会燃烧得更热烈,因为中国大地有足够的燃料。中国受教育人口数量巨大,计算机和移动设备普及极快,大量的数据使得中国在发展和应用深度学习技术方面有得天独厚的优势。有了这样的优势,我们可以厉兵秣马创造20世纪90年代硅谷那样的传奇。

百度要做的事情不仅是前沿开发,而且要为用户提供数据基础设施,提供深度学习开发平台,网聚人的智慧。

在特朗普当选美国总统之前,有百余位硅谷精英发表公开信,认为特朗普当选将会是创新的灾难。这对我是一个触动,如果美国的创新真的受到影响,谁来接过旗帜引领创新方向?我们能把世界的创新中心从硅谷迎到中国吗?

人才确实在向我们涌来。百度还在硅谷成立了实验室,近身接触美国人才。百度提出的中国大脑计划堪比任何超级工程。回想70年前,顶尖科学家壮志满怀地从国外回到中国兴建伟大工程,这样的辉煌今天会再次出现吗?

<img src="/uploads/allimg/200412/1-2004120Q231Z5.jpg" />

图1-8 李彦宏在百度贴吧讨论

资料来源:http://tieba.baidu.com/p/4855363507

当然,必须注意到,那个时代的伟大工程往往依赖国家投资和产业政策。&ldquo;冷战&rdquo;结束后,国家竞争压力减小,尖端科技的投资也大为减少。马斯克去开发火箭,其实是国家把NASA(美国国家航空航天局)的火箭技术和团队转移给他。在中国,政府层面的决心和投入依然强大,在发展人工智能产业方面可谓上下同心。这是最好的时代,也是最不确定的时代。人工智能就是一种适应不确定性的方法。大大小小的公司投入人工智能研发,带来竞争和多元化,这应该形成良性的互动和生长。

人工智能的发展也将带来不确定性。美国白宫的报告已经在探讨人工智能对就业的冲击。美国硅谷的高速发展和中部制造业的衰落加大了国家的裂痕,一部分人享有进步成果,另一部分人被扔出历史航船而失去方向。百度要成为人才的方舟,中国企业则要努力打造人类的方舟集阵,让最广大的人群踏上智能时代的历史巨轮。

百度副总裁王海峰博士于2016年11月刚刚当选ACL(Association for Computational Linguistics,国际计算语言学会)会士,成为ACL目前最年轻的会士,他也是该组织五十多年历史上首个出任主席的华人。评选委员会在给王海峰的评语中写道:&ldquo;王海峰在机器翻译、自然语言处理和搜索引擎技术领域,在学术界和工业界都取得了杰出成就,对于ACL在亚洲的发展也做出了卓越贡献。&rdquo;2017年初,在人工智能领域享有盛誉的科学家和高管陆奇加盟百度。这些都在预示着国际人才流动的趋势。中国千百位优秀的人工智能科学家要一起创造人类的未来。

<h2>

未来已来:焦虑与梦想</h2>

不久前,亚马逊的&ldquo;无收银员超市&rdquo;引起&ldquo;血拼族&rdquo;的惊叹。这种特别的购物体验背后,则是&ldquo;收银员&rdquo;下岗的阴影。今天,当各种在线客服被机器客服代替,当速记翻译被语音识别代替,甚至当收银员、驾驶员、工厂工人、普通文书和律师都被人工智能代替时,人们该怎样迎接这个世界?政府和企业该为劳动者做怎样的支持?我们该怎么调整经济、社会生态结构,以适应人工智能时代?我们希望聆听普通人的需求。这也是我们人工智能团队共同打造本书的初衷。

硅谷有位和马克&middot;安德森齐名的风投鬼才彼得&middot;蒂尔。他是PayPal(贝宝)的创始人,善于把握技术大势,捕捉黑马。2016年他因为准确预测特朗普当选美国总统而再次名声大噪。他在2011年时说过:We wanted flying cars,instead we got 140 characters(我们需要能飞的汽车,结果只得到140个字符)。140个字符的推特(Twitter)一度热闹无比,但彼得&middot;蒂尔清楚地看到互联网喧嚣背后缺少什么。他批评人类放慢了进步速度,嬉皮文化代替了进步主义,风投热衷于投资轻资产企业,其中大部分是移动互联网公司,如Airbnb(空中食宿)、优步之类,却对未来没有清晰的规划和信心。他认为&ldquo;互联网+&rdquo;时代人类在比特层面进步大,在原子层面进步小。因此他果决地投资火箭、抗癌药物以及人工智能。

我同样认为移动互联网创业的喧嚣掩盖了我们所要真正追求的进步。百度要为自己的方向而奋斗,要为人类的核心能力进步做贡献。蒂尔说20世纪初的美国人愿意尝试新事物,敢于规划几十年周期的登月计划并去实现。然而现在人类没有这样的计划了,只有风投在到处寻找眼前的增值和及时的痛快。百度愿意幻想一个智能化的世界并去实现它,要让人工智能成为新的操作系统,不仅是计算机的而且是世界的操作系统,同时严肃思考和提前应对人工智能的挑战,最终让这个世界从此不同。所以我说一定要把这件事情办成!

智能革命是对生产、生活方式的良性革命,也是对我们思维方式的革命。巨大的机遇与挑战并存。以下我们将具体探讨智能革命的方方面面,详谈视觉识别、语音识别、自然语言处理等在深度学习基础上取得的突破性进展,并从制造业升级、无人驾驶、金融革新、管理革命、智能生活等多个维度,描绘即将到来的智能社会,进一步探讨人类应该如何应对人工智能的发展,与读者一起把握智能革命的脉搏。

[1] 用来表示关于随机事件A和B的条件概率,其中P(A | B)是在B发生情况下A发生的可能性。

[2] &ldquo;知化&rdquo;是凯文&middot;凯利在《必然》中提出的一个观点,指软件吞噬一切,一切事物都将信息化,哪怕是一张桌子也可以上传自己的数据,如销售轨迹、使用频率等。

[3] 吴军。智能时代[M].北京:中信出版社,2016:179.