像AlphaGo团队一样,百度也好奇自己的技术边界在哪里,人工智能的研发体系究竟有没有偏差?为此,百度团队参加了江苏卫视大型科学类真人秀《最强大脑》,与能够裸眼区分520杯水的“水哥”王昱珩一战高下。在此前的节目中,“水哥”战胜了蚂蚁金服的人工智能“蚂可”。作为国内最强人工智能技术的结晶,百度团队为了这次荧屏上的人机对战特意优化了算法,最终证明百度团队的机器人小度确实技高一筹。
在百度人脸识别技术落地的产品中,最为“高大上”的当属乌镇的“刷脸”门禁系统。有出入资质的人将面部信息事先录入系统,今后出入任何安装有“人脸闸机”的地方,只需“刷脸”即可。
这种技术在百度内部俗称“1对1”,也就是一张面部与资料库中的信息比对,与之对应的是“1对N”。这个概念我们经常在西方谍战电影中见到:系统在监控信息呈现的茫茫人海中搜索一个人的面部信息以确定其方位。尽管国产电影中我们很难看到这种“炫技”,但在“1对N”的比对中,百度能真真切切地做到99%以上的识别准确度。
这项技术说起来容易,做起来难。等到技术成熟和数据库之间互相联网时,我们出门乘坐飞机、火车就无须出示身份证以供查验。因为当我们进入任意的交通枢纽,被摄像头拍摄到面部信息时,系统就能通过人脸识别确认我们的身份和购票信息。这相当于普通人都能获得一条绿色通道,出行效率和公共秩序都将大幅改善。
百度的人脸识别系统只需要1根蜡烛汇聚在1平方米以上的亮度,就能够完成识别和判断过程。在远程开户场景中,活体识别技术反应速度达到每秒20帧,交互过程费时不到2秒。在这一基础上,结合视频序列,百度已经将人脸身份验证应用在百度金融反欺诈领域,用于贷款审批、远程身份证识别、银行卡识别等,从而精准识别用户,预防欺诈。
百度大脑的“好视力”除了搭载大数据,还能做到许多脑洞大开的事情。当我们拍摄了各种角度的故宫太和殿照片后,百度大脑可以去掉重叠和无用的图片信息,通过计算和建模完成太和殿的三维结构建设。这样,千里之外的人们也可以通过网上的虚拟游览身临其境般地感受太和殿的宏伟。随着上传的照片越来越多,百度大脑就能重构更多的景点,让世界各地的人们都可以足不出户体验三维虚拟旅游。
<img src="/uploads/allimg/200412/1-2004120Q23HX.jpg" />
图4-3 玛珠庙(Maju Deval)数字化三维复原示意图[2]
注:使用手机百度或智能革命App扫描图片可见AR效果。
2016年底,上海虹桥机场出现两架客机仅差3秒险些在地面相撞的事故。塔台的调度和预警功能在这一事件中没有发挥出来。所幸飞行员没有坐等塔台指令,而是紧急处置,避免了一起重大事故的发生。这件事也再次提醒我们,完全依赖塔台人工指挥的模式终究难免有疏漏。
林元庆在与民航部门的交流中了解到这样一个细节:机场塔台工作人员为了了解跑道路面情况,每4小时就要派人去检查跑道。这个岗位专业需求度低、薪资低、劳动强度大、人员流失严重,完全可以用人工智能取代:在停机坪附近安装摄像头并结合人工智能对跑道环境进行实时三维重建。飞机、行李车、机场勤务车和所有人员的动作都能实时体现出来。除此之外,跑道上意外掉落的零件和所有异物也能在第一时间被发现,并不会出现遗漏。这种系统建立的准确度、可预测性和安全性都远远高于人工检查。
<h2>
时代召唤中国大脑</h2>
2015年全国“两会”上,我作为政协委员提交了设立“中国大脑计划”的提案——由国家投入专项资金主导,尽快搭建全球最大规模的人工智能基础资源和公共服务平台,比如建立一个拥有几十万台服务器的大型人工智能平台,支撑各个计划参与方的数据调用、模型调试和应用开发,高效对接全社会的智力、数据、技术和计算资源,依托统一平台,实现资源共享,促进研发创新。这将是新一轮工业革命的助推器。基础研究的成果应该让更多中国企业受益。包括语音识别、图像识别、自然语言的理解、多语种的翻译,甚至无人驾驶汽车、无人驾驶飞机、智能制造方面的机器人都可以在这个平台上进行各种各样的创新和实践。
这件事如果只是百度来做,可能只能提供几万台服务器;如果由国家主导投入,那就是几十万台服务器。平台大了就可以降低成本,鼓励更多的创新。国家持续、稳定地大规模投入,让一大批企业成长起来,随之而来的就是越来越多的创新,从而奠定未来10年、20年甚至更长时间里中国在全球创新领域的地位。这是我一直以来的想法:我不在乎华尔街怎么看,我一定要把这事儿做成。
然而任何一个超级工程都可能面临争议。
2016年9月,一场高能物理界的事件意外掀起舆论飓风——“超大粒子对撞机之争”从学界延伸至社会。普通民众都开始关注起“粒子对撞机”这一深奥的物理名词。
粒子研究的重要性在科幻小说《三体》中表现得淋漓尽致——外星智慧生物为了阻止地球科技进步,利用量子纠缠原理创造出拥有十一维度形态的“智子”,发射到地球上。以光速运动的智子能同时干扰人类的所有粒子对撞机,精确破坏粒子对撞结果,锁死人类的基础物理研究,将人类科技禁锢在一个较低的水平上。
“超大粒子对撞机之争”从两位局外人——美国数学家丘成桐和哈佛大学物理学博士王孟源的论战开始,历时3个月。还惊动了诺贝尔物理学奖得主杨振宁和中国科学院高能物理研究所所长王贻芳。
面对中国要不要建造超大型粒子对撞机的争论,反对者指出,建造对撞机需耗资数千亿美元,电能消耗堪比一座大城市,但收获的结果却极为不确定,可能沦为一台物理学者的“大玩具”——美国搁置了类似计划,欧洲大型强子对撞机[3]成果寥寥。所以中国为什么要开建?
支持者则认为,研究上帝粒子“希格斯玻色子”[4]非常重要,这将解开“宇宙如何诞生”的天问。美国和欧洲的放弃和无为正好为中国提供了机会窗口。作为崛起中的大国,中国理应承担理论物理前沿研究的责任。
最终,这场争论以超大粒子对撞机未获得“十三五”规划审批而暂告段落。
新中国成立半个多世纪以来,从不缺乏大计划。从改革开放初期的“863计划”中第一次提到“智能计算机”一词至今,中国科学家用40年的时间逐渐追赶上先进国家的步伐。鲜有人知的是,在没有超级计算机、没有大数据的年代,中国人工智能是从大学实验室录制音库起步的。正是前辈科学家的坚持,中国经济实力与科技实力的与日俱增,互联网企业才能在风调雨顺的中华大地上迅猛成长,集涓成流,浩然成势。
此时,百度建立于中美两国的人工智能研究室里,超过1300名不同族裔和国籍的研究人员正夜以继日地对数百个相关项目进行处理。他们的成果都将汇入百度大脑。这些研发者就像是当年“曼哈顿计划”中的1000多位科学家,像是今天欧洲核子研究中心的3000多位科研人员,他们做着超前于时代、暂不为人理解的工作。改进算法、建模升级和分析处理,百度大脑的研究人员正如粒子加速器中飞奔的粒子一样,酝酿着一场智能革命。
中国大脑计划不同于超大型粒子对撞机。后者占地巨大、能耗惊人(欧洲的粒子对撞机运行需要1200万千瓦电力),开发中国大脑却是一项自下而上、水到渠成的工程,国家无须豁出血本,需要的仅是方向与决心。
“规模经济”是中国产业成功的基本因素。在我们这个拥有超过13亿人口,7亿网民和数以千万计工程师、科学家的大国,海量的数据、充沛的人才、丰富的企业案例、各种各样的应用场景像流水一样奔腾。如果不能物尽其用,错过这一波智能浪潮,而将科技制高点乃至国家安全拱手相让,才是真正的“浪费”。正如互联网海量数据催生了Hadoop(由Apache基金会所开发的分布式系统基础架构)、Spark(加州大学伯克利分校的AMP实验室所开源的类Hadoop Map Reduce的通用并行框架)等流数据处理技术一样,人工智能已经在中国各地分散发展,犹如一个个神经节点,以其脑波促进中国大脑的到来,这是时代的召唤。
<h2>
中国大脑,中国气派</h2>
斯坦福人工智能实验室负责人、全球著名图像识别数据库ImageNet创始人李飞飞这样描述:“从科学到科技再到产品,就像一个4×100的接力赛,每一棒都有它特别的功能,学术界应该算是这个4×100接力赛的第一棒,工业界和实验室是第二棒,产业化、投资是第三棒、第四棒。”
为了这最关键也最刺激的最后两棒,2013年1月,欧盟曾宣布投入10亿欧元,旨在用巨型神经网络计算机模拟整个人类大脑。2016年10月初,美国连发《国家人工智能研究与发展策略规划》和《为未来人工智能做好准备》两份报告,制定人工智能研究与发展策略规划。这一年,中国官方的报告中也频频涉及人工智能。2016年5月,国家发改委、科技部、工信部、中央网信办联合发布《“互联网+”人工智能三年行动实施方案》。2016年8月,国务院《“十三五”国家科技创新规划》发布,人工智能再次成为核心看点。
人工智能是普世的吗?当然。这是目标,但这种普世注定不是某个单一国家能给予的,人工智能的发展必然像生物进化一样充满多元竞争和地方特色。值得玩味的是,美国科技巨头在人工智能赛道上竞逐时,却意外地在中国遭遇水土不服。
2016年末,IBM的医疗机器人Watson落地山东。这个在美国大获成功的机器人,一来到中国“打工”就被语言绊住了。IBM在汉语素材上欠缺积累,让这次合作从一开始就出现了裂痕。Watson这位“技术大神”能够听懂世界上多种语言,却对上海话、广东话、闽南语无能为力。
这不是一个孤例,由东西方生活、思维、文化差异造成的隔阂,历史上从不罕见。
同样是搜索,中外网友的关注点全然不同。在2015年谷歌人物热搜榜上,排名第一的是NBA球星拉玛尔·奥多姆(Lamar Odom),第二名是女子格斗家隆达·罗西(Ronda Rousey),第三名是美国电视节目名人凯特琳·詹纳(Caitlyn Jenner)。这几个人物恐怕只会出现在极少数中国人的搜索框中。而在2015年百度人物热搜榜上,排名靠前的是金星、王思聪,顿时“接地气”许多。
在硬币的另一面,微软聊天机器人TAY在推特上玩耍了24小时,就学会满口脏话、种族歧视、性别歧视,这倒是非常的“美国特色”。
显然,在多元化的网络世界里,没有任何一个国家、机构能“独当一面”。只有不同文化、经济、政治背景的基因进行竞争,才能对网民的需求做出全面恰当的回应。
从国情来看,中国发展人工智能较欧美国家有着更强烈的内在驱动,这种驱动来自民间。百度搜索统计显示,有关“服务”的搜索请求数量始终在迅速增长:2014年比2013年增长了133%。2016年在基数更大的情况下,仍有153%的增长。
在移动互联网领域的应用上,中国比美国更普及。中国网民早已习惯于诉诸互联网寻求服务。如今中国每100张电影票中就有55张是通过网络下单预订的。与之对应的是,互联网服务在美国电影行业的渗透率只有20%,也就是说100张电影票中只有20张是网上订票。比如,中国餐饮行业的互联网渗透率是2%时,美国只有1%。
中国之大,之特殊,要高效实现中国网民的服务需求,人工智能创新就是一条必由之路。
驱动的另一个源头则是产业焦虑。中国制造业成本上升很快。放眼全球,工业越来越自动化和智能化,高端制造业可能会回到欧美,而低端制造业已开始流向越南等国。如果不在短时间内完成产业转型,中国制造业将面临“空心化”的困境:高端制造业、低端制造业都将流出中国——这个转型,能不依赖人工智能这一环吗?
尽管局势紧迫,但中国的实力值得看好。中国企业的执行力、中国政府的支持力度都是新兴产业的强力后援。
如果说网民的需求是“天时”,企业与政府的合作是“人和”,数据则是中国大脑发展必不可少的“地利”。在这一领域,中国更是得天独厚。
庞大的人口规模、复杂的社会环境和面向不同应用场景的互联网企业,汇合收集这个数据全集意义非凡。可以预见,不久的未来除了个人数据,依托于公共环境或者政府背景而产生和积累的数据,如汽车注册信息、学籍学历、犯罪记录等,将以加密的方式形成个人基础电子档案。企业与市场通过服务输出获取的数据,如信用卡账单、消费记录、网站浏览偏好、惯用手机品牌等,则将以用户授权的方式再次转化为服务回馈给使用者。
这里的“使用者”,不是会编码、能建模的“码农”博士,而是普通的公众群体。让更多的人也能便捷地使用智能设备才是真正意义上的科技福利。
当年,美国“阿波罗登月计划”带动大批企业成长创新,美国军方用于“冷战”对抗的ARPAnet(美国国防部高级研究计划局组建的计算机网)衍生出了互联网。中国大脑这个充满想象力的超级工程对中国经济的贡献,也远不止是涌现一批明星科技企业和科技成果,而是将切实为整个经济和社会的转型提供服务和动力。
2017年,百度获批筹建深度学习技术及应用国家工程实验室,由百度研究院院长林元庆、百度深度学习实验室杰出科学家徐伟,清华大学的张钹院士和北京航空航天大学的李未院士组成团队班子。百度将与清华大学、北京航空航天大学、中国信息通信研究院、中国电子技术标准化研究院等共建单位一起,将企业优势资源整合,建设“国内领先、世界一流”的深度学习技术及应用研究机构,从研究突破、产业合作、技术成果转让、人才培养等方面提升我国人工智能领域整体竞争力。
这将是创世纪的超级工程的开篇。
人文主义画家米开朗基罗完成了雄伟的壁画《创世纪》,其中有这样一幕:上帝之手触碰亚当指间的那一瞬,智慧的启蒙就此产生。这幅壁画中上帝的袍服宽大张扬,最近几十年,有人指出上帝袍服的形状其实是一个人类大脑的解剖图。在这幅壁画里,米开朗基罗悄悄藏进了启蒙的密码——上帝就在人类自己的大脑中,是人类自己启蒙了自己!
<img src="/uploads/allimg/200412/1-2004120Q23G32.jpg" />
图4-4 《创世纪》局部图像
资料来源:http://baike.baidu.com/link?url=SyJFcW1lS-vbxAhPwGKX9xdyJ70q YAWrgzeQlQzWWP9-8mf6nTpA2ZjHdvOXtm4TqmWGR97VvSBWZiJ3VNwV61CISw9aC2eH_9ITjpBHq6FR-bmG6lb_LGVCK6J1rpkU
人类在自我劳作、自我启蒙中发展出自我的智慧。如今,深度学习神经网络也在自我运作、自我调试中创造新的“大脑”。这颗巨大的人工智能之脑将成为人类文明新的背景,它正是人类伟大活动的体现,并支持人类文明迈向更高阶段。
[1] 《圣经·旧约·创世记》第11章宣称,当时人类联合起来兴建能通往天堂的高塔;为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间无法沟通,计划因此失败,人类自此各奔东西。此故事试图为世上出现不同语言和种族提供解释。
[2] 2015年4月25日,尼泊尔发生强烈地震,不仅造成8000多人死亡,毁坏了成千上万的住房,还使许多历史建筑变为废墟。百度发起“See you again,加德满都”的行动,呼吁网民上传他们拍摄的历史古迹照片,以便百度利用自己的人工智能成像系统,以数字化方式重建这些文化遗产。活动中,百度共收到上传照片超过42000张,完成八个著名景点的数字重建,其中包括位于加德满都的玛珠庙。
[3] 欧洲大型强子对撞机是现在世界上最大、能量最高的粒子加速器,是一种将质子加速对撞的高能物理设备,英文名称为LHC(Large Hadron Collider)。
[4] 希格斯玻色子是粒子物理学标准模型预言的一种自旋为零的玻色子。物理学家希格斯提出了希格斯机制。在此机制中,希格斯场引起自发对称性破缺,并将质量赋予规范传播子和费米子。希格斯粒子是希格斯场的场量子化激发,它通过自相互作用而获得质量。