<h2>
陆氏猜想</h2>
20世纪80年代是所有亲历者难以忘怀的理想主义年代,那时候中国全体人民追求科学进步,对知识如饥似渴。尤其在校园里,大学生读书如痴如狂。陈景润[1]一类的科学家成为很多人的偶像。
1987年,在复旦大学的校园里,有一个和陈景润一样瘦削、戴着大框眼镜的青年,每天背着一个很大的书包行走在校园里,精神抖擞,喜欢思考在外人看来很玄奥的问题,同学们都喊他“陈景润”。
毕业的时候,他在毕业纪念册上写下了临别赠言:
谨献上本人最新研究成果,与列位同窗惜别。
“陆氏猜想”:HI=>C∪HB
(式中:H:Human I:Intellectualized
C:Computer B:Brain)
其意:人类终将使电脑智能化且使其远胜人脑。诸公不妨一效景润,或许,这颗电脑科学皇冠上的明珠非君莫属。
他是陆奇,后来的雅虎、微软领导者,今天的百度集团总裁。
“陆氏猜想”当然不是一个“陈式猜想”那样的科学定理,却也不是一句戏言,今天来看,更像是一句超前的顿悟。30年前就写下这样的话,信心来自哪里?
<img src="/uploads/allimg/200412/1-2004120Q231324.jpg" />
图2-1 陆奇于复旦大学1984届计算机科学系毕业纪念册上的临别赠言
那时的陆奇只有一个朦胧的感觉:“计算机给我们带来非凡的知识和体验。当时我们在计算机系写下棋程序,虽然是很简单的棋,给我的直觉就是,只要给我们足够的时间,以后一定可以做得比人更聪明,我当时有这样的直觉,所以我就这样写了。之后不久,我遇到一个难得的机会去卡内基梅隆大学计算机系深造。”
陆奇的个人信念是:知道更多,做到更多,体验更多。
从卡内基梅隆大学毕业时他写的是“Know more,Do more”。后来加了一句,变成“Know more,Do more,Be more”。因为他觉得“Be more”更重要,只是当时没有意识到。“Be more”也可以翻译成“成为更多”。人就是“在路上”,不断成为更丰富的存在。
就是这三个需求有机联系在一起,推动人类向前进步。人类的历史就是不断地去发现新东西,我们知道越多,就可以做到越多,我们做到越多,就可以体验越多,生活就会越来越丰富充实。正因为体验更多,我们才会知道更多,这是一个正循环,是人类进步的主旋律。
计算机让我们“Know more,Do more,Be more”,而人工智能就是这个旋律的最新回响。从这个角度去思考,我们可以比较清楚地洞察人工智能从哪里来,往哪里去,它的本质和标准究竟是什么,有志于人工智能事业的人和组织到底应该做什么。
<h2>
下一个浪潮</h2>
我们正在见证的是一个计算机和数字化崛起的时代,这是人类历史大潮中持久的、必经的一个过程。而人工智能是将大潮推向下一个高点的动力。它将开辟一个新时代,给我们的社会带来持久的、长远的革命性影响。这样的影响涉及产业、技术等经济、社会各个层面。但是说到底,这一次人工智能革命将让我们人类整体用完全不同的方式往前走,书写崭新的历史。
首先,我们需要了解“人类进步”的本质——我们为那些能让我们认知更多,实现更多,获得更多经验的事情充满热情地奋斗。
而计算能力的不断发展,正是遵循着上述人类进步的方向,成为人类进步的本质表现。尤其是在计算机编程出现后,人类的进步开始前所未有地加速。其核心模式包括以下关键步骤:人类捕捉宇宙中的各种现象,特别是通过有意地观察获得经验;然后通过计算,将信息有效地组织、处理、提炼,使人类对某个现象进行更深入和抽象的理解,形成知识;人类利用产生的知识认知来采取行动,与现象进行交互,最终实现我们预期的结果。
可以看出,以现代数字计算系统为基础,IT(信息技术)行业在创造数以万亿元计的价值时,正是从组织信息(Information Organization,IO,帮助人类认知更多)、完成任务(Task Completion,TC,帮助人类实现更多)、丰富经验(Experience Enrichment,EE,帮助人类获得更多经验)三个核心维度上使人类取得长足的进步。
而人工智能作为人类计算能力的又一次全新升级,仍然是从上述三个纬度推动人类进步。而且,由于人工智能是一种革命性的、更高级别的智能计算系统(Intelligent Computing System,ICS),它对人类进步的推动作用也是前所未有的、革命性的。
决定现代数字计算系统主要结构的是资源的组织形式。而人工智能计算的本质,简单来说,非常不同于冯·诺依曼的控制流结构,后者采用线性的记忆体和布尔函数作为基线计算操作。而新的范式是神经网络计算,其特征在于分布式的表示和激活模式。在这里,变量由叠加在共享物理资源(如神经元)上的向量表示,并且通过神经元的激活来进行计算。网络的拓扑架构和激活模式提供了巨大的计算空间,可以有效并且自然地捕获丰富的知识(通过拓扑的超参数、权重、激活函数)。相对于冯·诺依曼架构中的本地化表示(其中变量由诸如寄存器的专用或局部化物理资源表示)和符号计算,神经网络计算在学习和表示物理世界以及社会的丰富的语义知识方面更加自然和强大。
通过神经网络计算的力量,下一波的人工智能技术可以在以下两个维度提升目前的计算系统:
一是自动分层特征/表示学习。这是机器学习容量的实质性提升,因为当今机器学习工作的很大一部分关键在于特征工程。如百度大脑已经拥有万亿级的参数、千亿级的样本和千亿级的特征训练。
二是高级认知,特别是感知能力。这是下一代设备(如无人驾驶汽车)和下一代平台(如自然语言会话)产生的巨大催化剂。
人工智能计算的强大能力将有助于产生许多新品种的智能系统,如机器律师、机器分析师、医疗机器人、智能客服人员等。
人工智能计算的另一个发展方向是组织各种服务于特定物理架构和物理要素的系统,如家、办公室、工厂等的智能系统。其基本模式是通过使用物联网传感器的各种原始信号,人工智能的“感知系统”会对物理架构进行识别和感知;而“认知系统”需要组织信息和学习更多关于物理架构的知识,并去预测、判断和决策,以使各类物理系统更加智能。
目前,在科研领域,人工智能计算可以提供更先进的建模能力,成为多领域和新一波科研浪潮的催化剂。
在商业方面,人工智能可以提供额外的机会,为企业组织创建集成的业务计算系统(Business Computing System,BCS)平台。如记录业务对象(如系统设计模型、交易记录)和业务流程[如ERP(企业资源计划)、CRM(客户关系管理)];或者系统设计并模仿人类工作活动,如沟通、协作、阅读、写作、寻求信息等。
目前来说,人工智能的“感知系统”有更广泛、更新的商业机会:一方面,可以构建和部署更多的“传感系统”的子系统,针对的是物理环境或物理系统,如装配线、工厂等。这使得未来人力密集的制造业、商业服务业等,可以采用更先进的信息工具和更强的自动化。另一方面,自然语言处理技术的迅速进步使得我们可以扫描和分析文本文档和信息,并从中提取各种高价值的业务知识,而构建和部署专用的“文本理解子系统”可以得到很多高价值的知识和商业回报。
人工智能“认知系统”的成熟代表了智能时代更长远的未来,所有的行业、职业、社会系统、生活方式都将被重塑。如果数字化社会可以概括为“信息就在指尖”,那么,人工智能时代的本质可以概括为“知识无处不在,任何交互都是智能的。”
这个浪潮对大多数人来说无疑是巨大的机遇。
对商业机构来说:好消息是它们将有许多提升、转化和进入新的增长领域的机会;坏消息是当大浪潮席卷时,没有谁可以岿然不动,如果你没有抓住前进的机会,你就会落后,甚至被时代抛弃。
对企业家来说,仅看一看“巨大市场机遇”的列表,就可以发现许多创造未来商业巨头的机会,彰显企业家精神的智能创业的历史机遇就在眼前。同时,属于智能时代的新的企业领袖也将由此诞生。
对投资人来说,睁大眼睛去发现一个属于智能时代的种子企业,支持它成长为未来的企业帝国,并获取巨额回报的机遇真的来了。
对于国家或政府来说,每一次巨大的技术革命,总是伴随着国家命运的兴衰交替。总有一些国家或政府能抓住历史赐予的机会,一跃而上,赢得一个相当长时期的昌盛国运。要想抓住这样的历史机遇,国家或政府层面决策、政策的前瞻,战略投入的坚决,路线执行的科学有效,都至关重要。
当然,当越来越多的人感知到了人工智能的浪潮,越来越多的创业者投身于这个浪潮时,也难免会有浪潮将起阶段的困惑。
在硅谷,大家都说以后要投资的都是AI+X。比如有一家专投人工智能的投资公司,纽约市前市长布隆伯格是其合伙人(LP),看了几百家公司,看得有点晕了,因为所有的创业公司都在宣称自己是人工智能的公司。对这家投资公司来说,首要的问题就是,如何来进行鉴别,以便有针对性地投资。这促使我们开始深入思考,人工智能企业的标准是什么?哪些是真正的人工智能公司,哪些不是。
<h2>
衡量人工智能的现实标准</h2>
人类历史上,每一项新技术的出现,必然会伴随着各种探讨、反思甚至针锋相对的争论。面对人工智能这一带有全局性、革命性的技术浪潮的逐步兴起,人们的兴奋、质疑以及顾虑就更加多元化。其中有的比较感性,比如讨论人工智能会不会代替人类。这其实是在用人工智能与自然智能(Natural Intelligence)进行比较。
对于自然智能,有各种各样的研究和著作,包括有人提出人脑内部的机理其实是量子计算。对于人工智能,目前还没有一个大家都能够接受的定义。在这个阶段,没有必要去过分追求哪个标准定义比较正确。我们不妨务实地来讨论:现在的技术能允许我们做出什么样的智能体系。
有两种类型的计算系统被人类叫作人工智能。
第一种,本质上相当于“智能计算系统”(ICS)的子系统框架。它将数据作为输入,从数据中提取信息并建立模型,将我们关心的某些现象转化为知识。我们称这种类型的人工智能系统为“通用智能系统”(General AI),并定义“通用智能”的意思是一台机器获取知识和实现目标的能力。
第二种,指具有类似人类的认知能力,能感知(“看”“听”“感觉”),它们可以越来越多地推理和计划,它们可以用感觉运动控制移动。我们称这种类型的人工智能系统为“认知智能系统”(Cognitive AI),是具有感知、推理、规划和感觉运动控制能力的机器。
人工智能系统的另一个二分法是“狭义AI”(Narrow AI)和“广义AI”(Strong AI)。“广义AI”是使用相同的算法来解决一大类问题的系统。原则上,“广义AI”系统可以学习和适应以解决新的问题,而无须人为干预。“狭义AI”系统使用特定算法来解决特定问题,如下棋、识图等。
总而言之,表2-1是对人工智能系统状态的概述,并且是一个务实和可行的定义。
<h5>
表2-1 人工智能系统状态</h5>
<img src="/uploads/allimg/200412/1-2004120Q232E4.jpg" />
智能计算系统与大数据是直接相关的。任何数据都有产生的缘由,都有产生数据的体系和系统,这就是为什么数据会产生,数据的核心是知识。
通用人工智能系统的核心能力就是通过运用算法、计算体系,把知识从数据里提取出来。一旦有了知识,我们就可以做很多事情。我们可以预测,可以解决自动化问题,可以解决任何需要解决的问题。因为知识告诉我们人有什么需求,社会有什么要求,有了知识我们就可以找到答案。所以,人工智能发展的第一个层次就是通用人工智能。
最近几年深度学习的突破主要是在感知层面,特别是视觉和语音识别,还有自然语言的理解。但这只是起步,接下来要做的是认知上的,因为感知只是把外部世界通过光感、声音的振动,或者语言的交流,变成可以被系统识别的符号。最重要的还是理解它的意义是什么。系统看到一幅图片,可以知道有什么样的物体或人在里面,他们在做什么事情。
目前几乎所有能见到的做人工智能的公司可以分别放在四个象限里面。大部分公司做的其实是“狭义AI”。“狭义AI”只解决一个问题,或者解决一个到两个比较窄的问题,下围棋、打牌或者开汽车都是“狭义AI”。与之相对应,“广义AI”用同样一个系统,可以解决所有的问题,那就与人的智能类似了。“广义AI”是人工智能发展的长期目标,其真正实现至少还需要二三十年的时间。
现在,百度、谷歌、微软、脸书等公司都在朝着“广义AI”的方向努力。判断人工智能的能力,或者判别是否真正是人工智能的标准仍然是,人类是否因此知道更多,做到更多,体验更多。比如,百度基于海量的搜索数据做的很多技术分析,以前靠人去做几乎不可能,而现在通过人工智能计算技术,我们得出了许许多多前所未有的知识和结论,人类因此而知道更多,也能因此去做很多前所未有的判断,去实现更多不可能的功业。如具有代表性的无人驾驶技术、自然语言交互技术,使得人类的运动方式、感官方式都在逐渐发生变化。以前人类用眼睛来看、用耳朵来听,以后我们可能不需要眼睛也可以看到,不需要耳朵也能听到,人类将逐步拥有新的感知方式,也将体验崭新的世界。
因此,一切做人工智能的公司是否名副其实,都可以从以上角度来衡量:它属于四个象限中的哪一块?有没有实力让人类和机器一起知道更多,做到更多,体验更多?
美国和中国都有很多公司说自己是人工智能公司。有的公司说云计算是人工智能,有的说大数据是人工智能,但这些都只是人工智能系统的一部分,最终判断人工智能实力的是大数据、云计算、算法、训练时间及其总投入以及软硬件综合实力等。
这种实力不是一蹴而就的,也无法一概而论。地上本没有路,在披荆斩棘的道路上有不同的角色,也有不同的站点,每个人、每个企业达到的程度都不一样。有人刚起步,有人身后已经留下大片果实。
百度大脑可以看作人工智能综合实力的一个典型,对它的能力分解,能使我们更明晰人工智能行业的入门门槛及基本标准。如果一家号称人工智能的公司以下能力皆不具备,那只能说这家公司还没准备好真正进入这个领域。
百度大脑是硬件基础、数据基础和算法能力的紧密结合,是云计算、大数据和人工智能的三位一体,是百度技术战略的核心。云计算是基础设施、大数据是燃料、人工智能是发动机,联合驱动着“互联网的物理化”,将数字世界的互联网技术和商业模式又送回到物理世界,全面改变社会。
云计算,名字在云端,却是百度大脑最底层、最实体的部分,是IaaS(Infrastructure as a Service,基础设施服务)。
百度大脑的超强计算能力就来源于这一层,是高性能计算硬件的集团军。这个集团军拥有数十万台服务器,并且采用先进的集群操作系统来统一管理,堪称人工智能超级计算机。
为了深度学习训练的需要,百度自主研发了GPU和FPGA(现场可编程门陈列)异构计算服务器,单机可扩展至64块GPU/FPGA卡,对比传统服务器密度提升16倍,一台服务器即可完成千亿数据模型训练;百度开创性地研制了基于FPGA的人工智能处理器,提供10Tops的计算性能,相对主流的20核服务器,计算效率提升60倍,在人工智能和大数据应用上,可以达到普通服务器4~8倍的性能。
但百度的优势不只是单台机器的优秀,更在于优良的系统,优秀个体的集成形成强大的总体作战能力。针对GPU集群的智能调度和资源管理系统,可以实现计算、存储和网络资源的池化管理和动态调度,计算集群整体效率和平均使用率达到80%。将异构硬件用于线上产品,用户请求时延降至1/5,计算效率提升数十倍。
这个系统涵盖了国内最大的GPU/FPGA集群(全新的芯片技术),最大的HADOOP/SPARK集群(全新的并发数据处理技术)和运营效率最高的数据中心[全新的异构计算技术、整机柜服务器技术、100G RDMA(远程直接数据存取)通信技术和运维技术],可谓马力十足,提供了开发人工智能所需的计算能力。
它同样燃料充足。基于多年服务于大规模业务,比如通过搜索和视频技术,百度积累了大量的数据:万亿级网页数据,数十亿次搜索数据,百亿级视频、图像和语音数据,百亿级定位数据等。数据就是人工智能算法的燃料,是发展人工智能的又一基础条件。
让硬件与燃料结合的是优秀的算法和模型。百度汇聚了全球顶级科学家和工程师,在理论和实践方面持续创新,搭建了全球最大的深度神经网络,支持万亿级参数、千亿级样本、千亿级特征训练,神经网络层数远远突破100层。
硬件动力、数据燃料和算法灵魂的结合,才产生出百度的PaaS(Platform as a Service,平台服务)。百度PaaS与众不同之处在于,人工智能作为一种横向的服务贯穿全平台。通过深度学习和机器学习技术,结合超强计算、海量数据和优秀算法,在语音、图像、自然语言处理等方面拥有杰出的能力,打造出独特的知识图谱、用户画像和商业逻辑,并且向用户全面开放。用户可以非常方便地使用各种算法模块、开发工具、数据引擎为自身的商业目的服务。我们形象地把不同的平台称作天算、天像和天工,分别针对智能大数据、智能多媒体和智能物联网这三个领域提供服务。
在最上层的SaaS(Software as a Service,软件服务),百度的人工智能很容易凝结成许多垂直行业解决方案,渗透到各行各业。但我们更追求与合作伙伴一起打造智能产业生态,例如教育云、金融云、交通云、物流云等。我们认为,对智能产业生态的构建能力也是判定人工智能价值的重要标准。
在硬件、数据、算法之上还有一个重要的衡量标准,那就是人工智能企业的文化,即人工智能企业的“软实力”。搜索技术是人工智能的先驱,也是最早的互联网数字化世界的门户,其开发流程和技术核心为未来的人工智能奠定了基础。首先,搜索引擎必须与很大规模的数据打交道;其次,搜索引擎必须同时有大规模的机器学习,人工来做是不可能的事,因为数据规模太大了;最后,也是最根本的一点,搜索引擎的开发流程和工程开发文化与人工智能系统的开发是非常吻合的,都以数据为主,通过抽取其中的特征、模式,然后用这个模式给用户带来价值。人们在搜索业务中结成的协作关系,形成的业务能力和工作习惯,都很适合人工智能业务发展,与海量数据一样,积淀为人工智能企业的文化。所以陆奇在微软的做法是,培养人才先从Bing开始。你做过Bing,你到其他什么部门都可以做,那些技术在搜索看来都是很简单的技术。这个文化当然并不完美,但正如神经网络一样,可以在正确的方法指引下不断发展完善。
<h2>
人工智能+世界</h2>
和前几年讨论“互联网+”一样,人们现在开始讨论“人工智能+”,“+”商业、工业、医疗、教育等。如果从“知道更多,做到更多,体验更多”的角度来看,人工智能对世界的改变是根本性的,也就是说,这是一个“人工智能+世界”的问题。
首先,智能革命对于每个人的日常生活都会起到非常深远的影响。举一个简单的例子,由于人工智能突破性的发展,我们与计算器件的交互形式会更进一层。
以前的人机交互都是通过鼠标和键盘,微软发展到今天的规模,也是通过鼠标、键盘和GUI(Graphic User Interface,图形用户界面)这个人机交互的创新。苹果和乔布斯对这个世界最大的贡献是改为用手指来交互,从而改变了世界。而人工智能时代的改变更大,人类将可以用自然语言跟任何器件交流。
自然语言是最有效、最普遍的一种交流形式。人和人之间就是用语言交流,最自然,应用也最广泛。人机之间自然语言交互的实现,意味着人类将不需要了解每一项应用,每一个产品也都不需要学习该怎么去用,直接操作就好。因为,未来汽车是可以跟我们直接交流的,房子也是可以跟我们顺畅对话的。
我们已经看到了这种智能交互的雏形,比如一些智能助手系统的逐步落地。在美国,人们通过亚马逊智能音箱,把房子变成智能系统。在中国,百度的度秘团队也在这个领域做了很多前沿探索,我们有机会彻底改变日常生活中的人机交互方式。
人工智能将极大地加速人类的创新步伐和创造社会价值的效率,改变社会的规模也会和过去完全不一样。人类进步的每一次革命性进程,都是从发现新的知识开始。无线电是这样,互联网也是这样。而未来知识的发现模式会发生根本性改变。以前,人类去思考、去发现现实世界的规则。数字化世界到来后,借助人工智能的数据处理方式,人和机器将共同发现新的知识。这就意味着,人类创造新的企业,创造新的社会进程,改变世界的速度将焕然一新。因为人类“知道更多,做到更多,体验更多”的进程大大加速了。
最后,人工智能将带来一场新的工业革命。为什么很多人认为工业4.0以后,人类将进入数字化社会的新阶段?就是因为,智能系统将有能力在现实世界里提取数据,抓取知识,进而更好地帮助人类感知和认知现实世界,也将从经济、社会、文化等层面广泛而深刻地改变现实世界。我们确实处在一个非常振奋人心的时代,跟早期工业革命非常类似,但是人工智能比工业革命对社会的影响更广、更大。