第五章 机遇来临:ai先行的创新与创业(2 / 2)

<h3>

人工智能的商业化路线图</h3>

本质上,过去20年的互联网和移动互联网是一个不断将线上、线下的业务场景紧密连接,同时也不断促使数据产生、流转、集中和再利用的过程。如果把世界看成一个大市场,互联网和移动互联网的作用就是让这个大市场中的信息更透明,让信息流通更顺畅,以此降低交易成本,消除信息不对称。

但在知识、数据的积累达到一个顶峰,业务流程也因为信息的高效流转而顺畅连接到一起后,如何进一步提高生产率,降低业务成本,提升业务收入呢?我们认为,下一次生产率革命的关键是&ldquo;自动化&rdquo;,而人工智能正是帮助现有流程实现自动化的最好工具。

从投资人的角度看,AI兴起的最大契机还不是深度学习技术的发明,而是过去20年互联网、移动互联网的高速发展对自动化的强烈需求。有了这个需求,有了成熟的业务流程和高质量的大数据,深度学习技术的突破就是&ldquo;万事俱备,只欠东风&rdquo;的事了。

所以,战略方面,我们丝毫不用担心AI能否落地、能否商业化。谷歌、Facebook、百度等互联网巨头的搜索和广告业务本质上就是机器学习驱动的,而且早已被证明是成功的。我们需要关心的只是人工智能在接下来的时间内,以何种趋势、何种方式在其他领域落地的问题。

创新工场管理合伙人、资深投资人汪华认为,人工智能的商业化大致可分为三个主要阶段:

第一阶段,AI会率先在那些在线化程度高的行业开始应用,在数据端、媒体端实现自动化。这一过程会首先从线上&ldquo;虚拟世界&rdquo;开始,随着在线化的发展扩张到各个行业,帮助线上业务实现流程自动化、数据自动化、业务自动化。

互联网和移动互联网的发展已经在许多领域为AI做好了业务流程和数据上的准备。拥有高质量线上大数据的行业会最早进入人工智能时代。例如,大家常说金融行业是目前人工智能应用的热点,这正是因为金融行业特别是互联网金融已经做好了使用AI的准备。此外,美团等公司将餐饮服务与线上业务连接了起来,滴滴、摩拜单车等公司将交通出行与线上业务连接了起来,在这些拥有线上业务流程和高质量数据积累的地方,AI同样开始发挥作用,大幅提高线上业务的自动化程度。

第二阶段,随着感知技术、传感器和机器人技术的发展,AI会延伸到实体世界,并率先在专业领域、行业应用、生产力端实现线下业务的自动化。

可以感知实体世界信息的传感器和相关的感知技术会越来越成熟,越来越便宜。在线下业务中,计算机系统可以通过物理方式接收线下信息或帮助完成线下操作。这个转变意味着人工智能从线上的&ldquo;虚拟世界&rdquo;走进了线下的实体世界。这个阶段,人工智能的商业化会首先从生产力的角度切入,整个世界的生产制造会逐渐被AI渗透。工业机器人、仓储机器人、物流机器人等将在这个阶段实现大范围的普及。

第三阶段,当成本技术进一步成熟时,AI会延伸到个人场景,全面自动化的时代终将到来。

随着技术的日趋成熟,相关的智能产品价格大幅下降,AI终将从企业应用进入个人和家庭。那时,每个人的工作和生活中,大量的应用场景都会因为AI的帮助而更加自动化、更有效率,人类的生活质量终将因AI的普及而大幅提升。这个阶段里,AI商业化的核心目标是创建全面自动化的人类生活方式。

根据汪华的判断,我们目前正在进入AI商业化的第一个阶段,也许只需要3年左右的时间,AI就可以在各种在线业务中得到普及。AI商业化的第二个阶段,要花五六年、六七年的时间才能充分发展起来。而标志着全面自动化的第三阶段,也许需要十几年或更长的时间。

就像过去20年互联网和移动互联网的商业化所走过的历程一样,人工智能的商业化会以自己的节奏,分阶段、分步骤地渗透到人类生产、生活的方方面面。而且,AI对整个社会的改变,可能比过去20年互联网革命所带来的改变要大得多。能否准确把握AI商业化的脉络,是AI时代的创业能否站在&ldquo;风口&rdquo;上的关键。

<h3>

AI创业的五大基石</h3>

每个时代的创业有每个时代的特点。人工智能创业就与此前的互联网时代创业、移动互联网时代创业很不相同。

<img src="/uploads/allimg/200412/1-2004120Q212253.jpg" />

图58 人工智能创业的五大基石

按照我的归纳和总结,人工智能时代的创业有五个前提条件:

&middot;清晰的领域界限:人工智能创业,要解决的领域问题一定要非常清晰,有明确的领域边界,因为这一类问题是今天以深度学习为代表的人工智能算法最善于解决的。例如,同样是做机器人,如果做一个借助视觉传感器更好地规划扫地线路、提高清洁效率的扫地机器人,将机器人的需求限定在一个有限的问题边界内,这样的解决方案就相对靠谱;如果上来就要做一个长得像人一样、可以与人交流的人形机器人,那以今天的技术,做出来的多半不是人工智能,而是&ldquo;人工智障&rdquo;。

&middot;闭环的、自动标注的数据:针对要用AI解决的领域问题,最好要在这个领域内,有闭环的、自动标注的数据。例如,基于互联网平台的广告系统可以自动根据用户点击以及后续操作,收集到第一手转化率数据,而这个转化率数据反过来又可以作为关键特征,帮助AI系统进一步学习。这种从应用本身收集数据,再用数据训练模型,用模型提高应用性能的闭环模式更加高效。谷歌、百度等搜索引擎之所以拥有强大的人工智能潜力,就是因为它们的业务,比如搜索和广告本身就是一个闭环的系统,系统内部就可以自动完成数据收集、标注、训练、反馈的全过 程。

&middot;千万级的数据量:今天人工智能的代表算法是深度学习。而深度学习通常要求足够数量的训练数据。一般而言,拥有千万级的数据量是保证深度学习质量的前提。当然,这个&ldquo;千万级&rdquo;的定义过于宽泛。事实上,在不同的应用领域,深度学习对数据量的要求也不尽相同。而且,也不能仅看数据记录的个数,还要看每个数据记录的特征维数,特征在相应空间中的分布情况,等等。

&middot;超大规模的计算能力:深度学习在进行模型训练时,对电脑的计算能力有着近乎&ldquo;痴狂&rdquo;的渴求。创新工场曾经给一个专注于研发深度学习技术的团队投资了1000万元人民币。结果,团队建设初期才两三个月时间,仅购买深度学习使用的计算服务器就花掉了700多万元。今天,一个典型的深度学习任务,通常都要求在一台或多台安装有4块甚至8块高性能GPU芯片的计算机上运行。涉及图像、视频的深度学习任务,则更是需要数百块、数千块GPU芯片组成的大型计算集群。在安装了大型计算集群的机房内,大量GPU在模型训练期间发出远比普通服务器多数十倍的热量。许多机房的空调系统都不得不重新设计、安装。在一些空调马力不足的机房里,创业团队甚至购买了巨大的冰块来协助降温。

&middot;顶尖的AI科学家:今天的人工智能研发还相当依赖于算法工程师甚至是AI科学家的个人经验积累。水平最高的科学家与普通水平的算法工程师之间,生产力的差异不啻千百倍。人工智能创业公司对顶尖AI科学家的渴求直接造成了这个领域科学家、研究员的身价与日俱增。谷歌雇用杰弗里&middot;辛顿、李飞飞,Facebook雇用扬&middot;勒丘恩,据说都开出了数百万美元的年薪。国内AI创业公司如旷视科技,也用令人瞠目的高薪,将机器视觉领域的顶尖科学家孙剑&ldquo;挖&rdquo;了过来,担任公司的首席科学家。

<h3>

AI创业的泡沫现象及六大挑战</h3>

当然,看到人工智能创业机遇的同时,我们也必须保持足够清醒的头脑。2016年到2017年,人工智能的创业和投资明显存在无序、失衡、过热的情况。人们常常担忧的泡沫现象的确存在。

看一看如星火燎原一般在美国、中国、以色列等地建立的自动驾驶创业团队吧,自动驾驶这个行业确实巨大,但真的需要那么多早期创业团队吗?要做一个第4级或第5级的自动驾驶,技术难度异常大,非要投入巨资和最顶尖的研发人才不可。那么,这么多初创的自动驾驶团队里,究竟有几个是可以在自动驾驶普及的那一天幸存下来并成长为行业巨人的呢?

家用机器人的概念就更别提了。那么多号称开始研发家用机器人的公司,如果是做亚马逊Echo那样限定使用场景的智能家电还好说,如果上来就要做语言交流、人形外观的机器人,那几乎一定会因为技术水平无法达到人类用户的预期而走向失败。这道理很好理解,越是长得像人的机器人,用户就越是会用人的标准去衡量、评价它,希望越大,失望也就越大。

语音和自然语言处理方面的创业也有类似问题。今天的语音识别虽然做得相当不错,但机器的能力仅限于感知领域,只能完成听写这种以转录为主的任务。也就是说,机器目前只能很有效地将语音转换为文字,但根本无法直接理解文字的含义。只有限定一个非常特定的领域,技术才能解决问题,如果要求自然语言处理算法支持通用的人机对话,那就不切实际了。目前有许多从事智能客服、智能聊天机器人创业的团队,这些团队如果不善于界定问题领域,就很容易将需求问题变复杂,以至于人工智能技术也爱莫能助。

基于人脸识别技术的身份认证、安防类应用是中国人工智能创业的特色领域,并已经产生了至少四家独角兽或接近独角兽规模的创业公司。但这个领域的市场空间绝对不会像自动驾驶那么宽广,目前二三十家公司都要削尖脑袋挤进人脸识别市场的情况显然是过热了。

基于人工智能的辅助医疗诊断刚刚起步,就出现了一大批瞄准这一方向的创业公司。但只要是熟悉医疗行业的人都很清楚,在这个行业里,要得到闭环的、有标注的、数据量足以发挥深度学习效能的医疗大数据,其难度远超普通人的想象。没有符合要求的医疗数据,人工智能又该从何谈起?所以,在智能医疗领域,今后可以成功的初创公司,一定是那些既懂人工智能算法,又特别了解医疗行业,可以收集到高质量医疗数据的公司。

概括来说,目前的人工智能产业发展面临六大挑战:

一、前沿科研与产业实践尚未紧密衔接:除少数垂直领域凭借多年大数据积累和业务流程优化经验,已催生出营销、风控、智能投顾、安防等人工智能技术可直接落地的应用场景外,大多数传统行业的业务需求与人工智能的前沿科技成果之间尚存在不小距离。面向普通消费者的移动互联网应用与人工智能技术之间的结合尚处在探索阶段。科学家和研究者所习惯的学术语境,与创业者和工程师所习惯的产品语境之间还无法快速衔接。

二、人才缺口巨大,人才结构失衡:据Linked In统计,全球目前拥有约25万名人工智能专业人才,其中美国约占三分之一。这一数量级的人才储备远无法满足未来几年中人工智能在垂直领域及消费者市场快速、稳健增长的宏观需求。人才供需矛盾显著,高级算法工程师、研究员和科学家的身价持续走高。人才结构方面,高端人才、中坚力量和基础人才间的数量比例远未达到最优。

三、数据孤岛化和碎片化问题明显:数据隐私、数据安全对人工智能技术建立跨行业、跨领域的大数据模型提出了政策、法规与监管方面的要求。各垂直领域的从业者从商业利益出发,也为数据的共享和流转限定了基本的规则和边界。此外,许多传统行业的数据积累在规范程度和流转效率上还远未达到可充分发挥人工智能技术潜能的程度。

四、可复用和标准化的技术框架、平台、工具、服务尚未成熟:虽然Tensor Flow、Caffe、MXNet等深度学习框架已被数以万计的研发团队采纳,相关开源项目的数量也在飞速增加,但一个完整人工智能生态所必备的,从芯片、总线、平台、架构到框架、应用模型、测评工具、可视化工具、云服务的模块化与标准化工作,尚需3年或更长时间才能真正成熟。

五、一些领域存在超前发展、盲目投资等问题:目前的人工智能技术只有在限定问题边界、规范使用场景、拥有大数据支持的领域才能发挥最大效能。但创投界存在盲目追捧,不顾领域自身发展程度,或利用人工智能来包装概念等现象。由此产生的盲目创业和投资问题虽非主流,但仍有可能阻碍整个行业的健康发展。

六、创业难度相对较高,早期创业团队需要更多支持:与互联网时代、移动互联网时代的创业相比,人工智能创业团队面临诸多新的挑战。例如,对高级人才较为依赖,科学家创业者自身的商业实践经验较少,高质量大数据较难获得,深度学习计算单元和计算集群的价格十分昂贵,等等。

<h2>

AI是中国创新、创业的最好机会</h2>

如前所述,AI创业既客观存在局部过热的泡沫,也有巨大的潜能尚待挖掘。总体来说,目前的人工智能大格局中,机遇是主旋律,泡沫和危机是必须克服的局部挑战。这一格局在全球如此,在中国亦如此。

而且,若专就中国AI创业环境来说,人工智能更是助力中国科技腾飞的最好机会之一。互联网和移动互联网时代,中国科技精英已经用淘宝、微信、摩拜单车等&ldquo;中国创新&rdquo;让世界看到了我们的创造力和执行力。人工智能时代,中国的人才优势、市场优势、资金优势、坚持多年创新的商业模式优势等,都是人工智能最好的生长土壤。如果措施得当,行动高效,中国甚至有可能借人工智能技术全面占据信息科技的制高点,在创新、创业领域真正成为引领者而不是跟随者。

<h3>

AI领域,中国人/华人已是科研中坚</h3>

2016年,美国白宫发布的《国家人工智能研究与发展策略规划》报告从Web of Science核心数据库里查询提到&ldquo;深度学习&rdquo;或&ldquo;深度神经网络&rdquo;的文章,统计其数量变化趋势。报告说,从2013年到2015年,SCI收录的论文里,提到&ldquo;深度学习&rdquo;的文章增长了约6倍,同时强调:&ldquo;按文章数计算,美国已不再是世界第一了。&rdquo;

美国不是世界第一?谁是世界第一呢?报告指出,中国发表的相关论文数量在2013年及以前还落后于美国,而在2014年和2015年,中国的相关论文数量就跃居世界第一。如果只统计论文数量,中国在AI研究领域,已经是不折不扣的领跑者了。

白宫《国家人工智能研究与发展策略规划》中的数字统计,其实还是存在一些技术上的问题,比如,直接搜索关键字&ldquo;深度学习&rdquo;&ldquo;深度神经网络&rdquo;,是否真的能涵盖这些年人工智能领域的所有科学研究进展?统计论文数量时,是否要考虑论文所发表期刊的影响因子,以便衡量论文的重要程度?

创新工场使用更严格的条件,只统计Web of Science核心数据库中SCI影响因子较高的人工智能期刊中的论文,并在主题上涵盖人工智能相关的所有科研领域,做了一次独立的数据分析。

根据创新工场的统计,在2006年到2016年的时间段里,近两万篇顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29.2%和31.8%。近10年,华人用五分之一左右的作者人数,平均贡献了三成的顶级AI研究文章和被引用数。从统计角度来看,这已经是超出平均水平的科研贡献了。

<img src="/uploads/allimg/200412/1-2004120Q2122A.jpg" />

图59 华人在人工智能研究领域的贡献占比

从变化趋势看,2006年到2015年,华人作者参与的顶级AI论文,占全部顶级AI论文数量的比例,从23.2%逐年递增到42.8%。而华人作者参与的顶级AI论文被引用次数,占全部顶级AI论文被引用次数的比例从25.5%逐年递增到55.8%。

<img src="/uploads/allimg/200412/1-2004120Q212231.jpg" />

图60 华人在人工智能研究领域贡献的变化趋势

举例来说,《IEEE模式分析与机器智能汇刊》(IEEE Transactions on Pattern Analysis and Machine Intelligence,简称PAMI)在2006年到2016年,引用数很多的前500篇顶级的人工智能论文中,作者一共1220人,其中华人科学家、研究者316人,占25.9%。所有作者单独累加计算的被引用数总和是231361次,其中,华人科学家、研究者被引用数总和是63846次,占27.6%。如果单看2014年(当年华人的文章数、引用数均较高)的数据,华人科学家、研究者被引用数占51.8%,超过了半数。

也就是说,即便只统计顶级出版物里的顶级文章,中国人/华人在人工智能领域的贡献,在发展趋势上也和白宫报告中揭示的规律一致&mdash;&mdash;无论从哪个角度来说,中国人/华人正在人工智能领域里发挥举足轻重的作用,而且,从2014年和2015年开始,中国人/华人已经处于人工智能研究的领先地位,占据了人工智能科研世界的半壁江山!

当然,需要特别指出的是,我们不能单看这些反映整体趋势的统计数据就沾沾自喜。事实上,上述数据所表现的,仅仅是中国AI科学家以及全世界的华人AI科学家作为一个整体,已成为AI科研的最大阵营这一事实。但从突破性科研贡献的数量和质量上说,中国还无法与美国相比。如果只统计那种革命式的、里程碑式的突破,中国人或华人的占比就会少很多了。深度学习&ldquo;三巨头&rdquo;中没有一个华人面孔,这个事实至少说明,中国或世界华人科研群体中,还缺少顶级大师式的人物。用围棋的段位来比喻的话,就是中国在人工智能领域拥有不少六段、七段甚至八段的高段位棋手,但暂时还缺少九段的顶级高手。

一方面,客观承认中国与美国在AI前沿科研上仍存在较大差异;另一方面,我们也必须看到中国AI科研力量的蓬勃兴起。中国国内的研究者和分布在世界各地的华人研究者,他们在人工智能领域共同构成了一个巨大的人才储备库。无论是从国家的层面,还是从投资者、创业者的层面,我们都应该想办法培育好、用好这个人才库,尽量鼓励海外华人科学家回国创业,或者帮助国内创业团队尽快赶超世界水平。

<h3>

中国有独具优势的AI创业环境</h3>

尽管存在诸多挑战,但我仍然大胆预测,在未来5年内,中国将会诞生许多世界级水平的人工智能企业。为何我会如此坚定?因为中国具备了人才储备、行业需求、庞大市场、生态系统等许多极有利于人工智能发展的条件。

人才储备方面,除了上节提到的中国科研力量不可忽视之外,中国人也普遍对国内的数学等理工科的教学水平感到自豪。高水准基础科学、工程学教育可以造就大批高素质的年轻人才,这是任何一个新兴产业赖以发展的关键。

中国学生普遍理工科较强,数学较强。这在人工智能时代里,显然有巨大的优势。庞大的理工科学生基础,造就了一大批高素质的人工智能科学家、工程师。同时,即便是没有专门去学计算机科学的学生,他们中有很多已经具备了非常扎实的数学知识,这些学生在需要时可以通过培训,较快地成为掌握深度学习等人工智能技术的算法工程师。目前,创新工场正和许多致力于人工智能发展的企业一道,加强与高校的合作,努力培养更多的人工智能人才,同时也投入资金,开展人工智能科研数据集和竞赛的建设,让更多的人有机会参与到人工智能技术的普及和提高中来。

行业需求方面,中国的传统行业较为薄弱,但这种状况反而给中国带来了一种后发优势。如今,中国许多传统企业在技术转化领域还大幅落后于美国企业。但是这些中国企业坐拥的是海量数据和充沛资金。它们有热情也有动力去投资那些能帮助企业拓展业务、提高收益、降低成本的人工智能技术与人才。

此外,中国有全球规模最大的互联网市场,网民人数近八亿,大量的互联网公司正在深耕市场。很多非人工智能的互联网公司成长到一定规模之后,为了转型升级、扩大规模,都需要引入人工智能技术。而且,中国市场既开放又有许多独特性。尽管美国人工智能企业领先全球,但它们要想进入中国市场必须跨越重重阻碍,因为中国市场需要的是最&ldquo;接地气&rdquo;的本地化解决方案。此外,对于人工智能的探索性和试用性需求,中国往往会采取相对开放和鼓励的路线,这也可能促进行业的超速发展。

也就是说,中国虽然在人工智能的前沿研发中不如美国,但中国有独具优势的AI科研和创业环境,有机会实现弯道超车,后发先至。

举例来说,美国的金融行业已经发展得非常成熟,金融企业使用的营销、风控等模型是数十年经验积累的结果,让美国金融企业转变思路,采用基于深度学习的新一代人工智能系统,这要花费大量的时间与精力。反观中国的金融系统,各种新型金融机构十分活跃,基于互联网的金融产品几乎每年都在进行模式创新。中国的新兴金融机构没有那么多历史包袱的束缚,反而可以更快地试用或部署深度学习算法,帮助自己改进业务流程,提高效率。

现在正是将人工智能技术转化为产业应用,解决现实社会问题的黄金时期。抓住人工智能热潮中的机遇期,中国应当会有一番大作为。

<h3>

AI黄埔军校&mdash;&mdash;微软亚洲研究院</h3>

说到今天的中国AI创业,就不能不提一所培养人工智能人才最多,输出人才质量最高的人工智能黄埔军校,这就是我于1998年回国创立的微软亚洲研究院(1998年创立时的名称是微软中国研究院)。

我非常怀念1998年创立微软亚洲研究院的时光。那段时间,就像我自己的&ldquo;阳光灿烂的日子&rdquo;一样,似乎只要你有足够的热情,就可以将全球范围内最具实力的华人科学家聚拢在一起,共同从事机器视觉、语音识别、智能交互、多媒体、图形学等前沿领域的研究,共同享受科研带来的快乐。

那个时候,虽然刚刚经历国际象棋领域的&ldquo;人机大战&rdquo;,但科研界和产业界还处于人工智能发展的低谷期,人工智能科学家还不像今天这样被高科技企业以重金&ldquo;哄抢&rdquo;。太多太多急功近利的科研人员耐不住人工智能领域的寂寞,都匆匆转向其他更容易完成产业转化的领域。

但微软亚洲研究院不同。我们从一开始就制定了面向未来的主导原则,确定了围绕人工智能各技术领域组建高水准研究团队的基本思路。敢于设想别人不敢想的未来,敢于做别人不愿做的研究,这是微软亚洲研究院之所以能在数年之后成为国际人工智能领域科研重镇的关键。

<img src="/uploads/allimg/200412/1-2004120Q212410.jpg" />

图61 一张珍贵的照片:1998年,微软中国研究院(微软亚洲研究院前身)的初创团队合影

在那段&ldquo;阳光灿烂的日子&rdquo;里,我亲自聘请或招募到微软亚洲研究院的科研精英们一个个都那么年轻,那么有活力。今天,他们中几乎每个人的名字都在科技大潮中熠熠生辉。尤其是在人工智能领域,今天中国最好的AI创业团队里,首席科学家的人选中,许多都曾经在微软亚洲研究院工作过。

1999年加入微软亚洲研究院的张宏江是视频检索领域的&ldquo;开山鼻祖&rdquo;。张宏江在微软亚洲研究院期间,就曾带领和指导视觉计算组解决人脸识别的问题。今天,人脸识别在中国的金融和安防两个垂直领域得到了广泛应用,人脸识别方向的优秀初创团队,几乎都能从师承关系上回溯到张宏江当年指导过的这个研究组。例如,商汤科技创始人汤晓鸥曾在微软亚洲研究院担任视觉计算组主任,商汤科技的核心技术团队也基本来自微软亚洲研究院。2016年加盟旷视科技(Face++)担任首席科学家的孙剑曾在视觉计算组工作了十几年,是沈向洋的得意门生,而旷视科技的技术骨干差不多都是孙剑和汤晓鸥的学生。

<img src="/uploads/allimg/200412/1-2004120Q2122F.jpg" />

图62 微软亚洲研究院创立早期,我和张亚勤在清华大学与计算机系学生交流

此外,像郭百宁、芮勇、马维英、颜水成等一大批青年科学家,当年都曾在微软亚洲研究院从事人工智能相关的科研项目。今天,郭百宁担任微软亚洲研究院的常务副院长,芮勇则在2016年加入联想担任CTO,马维英于2017年2月出任今日头条副总裁,颜水成现在是360公司首席科学家、人工智能研究院院长。更年轻的人工智能大牛中,旷视科技的创始人印奇、商汤科技的杨帆、初速度(Momenta)的创始人曹旭东、依图科技的创始人林晨曦、Linkface的创始人夏炎、深度学习框架Caffe的作者贾扬清等,都有在微软亚洲研究院实习或工作的经历。

当年接替我担任微软亚洲研究院院长的张亚勤,他的研究方向主要在多媒体领域,但也和人工智能有很多交集,例如对视频的压缩、分类、理解,都需要AI的帮忙。相关的三维图形学研究,会慢慢由纯粹的图形学问题逐渐演变为使用人工智能算法理解空间结构等AI问题。此外,微软亚洲研究院当年从事搜索、大数据等方向研究的,最后都需要融合机器学习特别是深度学习技术。应该说,当年我和张亚勤为微软亚洲研究院规划的几个研究组,除了其中偏重人机交互界面技术的小组(当年由王坚领导的小组。王坚后来成为阿里云的创始人)外,其他研究组都或多或少与人工智能相关。

<img src="/uploads/allimg/200412/1-2004120Q212O2.jpg" />

图63 微软亚洲研究院的四位历任院长:李开复、张亚勤、沈向洋、洪小文

当年我在微软亚洲研究院开创的一番事业,许多年后,在人工智能领域真的结出了让人欣慰的果实。几十年来,人工智能技术几起几落,但始终有那么一批志存高远的科学家、研究员、大学生埋头科研,探索未知。正是因为有微软亚洲研究院等一批面向未来的科研机构存在,人工智能才得以在今天蓬勃发展起来。

<h2>

创新工场的AI布局</h2>

2009年,我离开谷歌,创办了帮助青年人完成创业梦想的风险投资机构&mdash;&mdash;创新工场。迄今,创新工场已在移动互联网和各垂直领域投资了近300家创业公司,其中包括30余家以人工智能技术为核心驱动力的公司。创新工场对人工智能目前和未来落地的主要应用场景有着透彻的理解和深厚的经验积累。

把握时机对创业和投资至关重要。创新工场根据技术成熟度和未来发展趋势,将人工智能各应用领域划分为现阶段已成熟、3到5年成熟、5到10年成熟、10年后成熟等不同类型,并分别设计相应的投资策略。

<img src="/uploads/allimg/200412/1-2004120Q212b8.jpg" />

图64 创新工场在人工智能领域的投资布局

如图中所示,创新工场将人工智能领域的应用划分为大数据、感知、理解、机器人、自动驾驶等不同门类,每个门类中,按照人工智能技术的应用成熟度,将具体应用领域排列在时间维度上。

总体来说,人工智能在互联网、移动互联网领域的应用,如搜索引擎、广告推荐等方面已经非常成熟。在商业自动化、语音识别、机器视觉、手势识别、基础传感器、工业机器人等方面,人工智能可以立即应用,立即收效。

金融类人工智能的应用虽然已经起步,但尚需一段时间才能真正普及。智能教育、智能医疗、AR/VR中的人工智能、量产的传感器、商业用机器人等,预计会在3到5年成熟可用。

可以供普通技术人员乃至非技术人员使用的人工智能平台(包括计算架构、算法框架、传感平台、云服务等),会在3到5年后趋于成熟并拥有足够大的商业机会。

通用的自然语言对话工具、智能助手、普及型的家用机器人等,则至少需要10年甚至更长的时间,才有可能完成商业化。

另外,在自动驾驶领域,3到5年内,必将是第2级到第3级的辅助驾驶最先大规模商用,而且,鉴于安全考虑,这些自动驾驶应用也会是限定场景、限定道路等级的。真正意义上的&ldquo;无人驾驶&rdquo;,即第4级或第5级的自动驾驶,还需要5到10年才能上路运行。

除了直接投资,创新工场还宣布成立人工智能工程院。这是一个专门面向人工智能的创业人才培养基地和创业项目孵化实验室,其使命是为人工智能创业提供人才与技术、产品和商业经验、市场推广、软硬件平台、高质量大数据源等多方位的支持。

人工智能领域的高级人才和高水准技术团队如果已经有了清晰的商业模式和成熟的产品规划,创新工场可直接提供投资支持;如果商业模式或产品规划尚未清晰,创新工场人工智能工程院则可使用孵化的方式,帮助创业者实现创业梦想。

创新工场人工智能工程院的主要工作任务包括:

&middot;对接科研成果与商业实践,帮助海内外顶级人工智能人才创业:创新工场人工智能工程院面向海内外招聘顶级人工智能科学家和驻场创业家(EIR),利用创新工场丰富的产品化和商业化经验,协助他们完成前沿科研成果向商业应用的转化,同时也可根据需要,为他们匹配优秀的创业伙伴,搭建高效的创业团队,对接有价值的商业渠道,发展成熟的商业模式。

&middot;培育和孵化高水准的人工智能技术团队:创新工场人工智能工程院招聘人工智能相关的算法工程师、架构工程师、应用开发工程师等高级人才,并在高校相关专业招聘实习生。来自谷歌、微软等顶级工程与研究团队的技术专家将作为导师,带领并培养年轻工程师、研究员,孵化高水准的人工智能技术团队。

&middot;积累和建设人工智能数据集,促进大数据的有序聚合和合理利用:大数据是人工智能科研与产业化的关键。创新工场人工智能工程院计划在科研数据和商业数据两个方面投入资金与技术力量,推动数据集建设和大数据聚合,探索在高效利用大数据的同时切实保证数据安全和用户隐私的技术、流程与规范。

&middot;开展广泛合作,促进人工智能产业的可持续发展:创新工场正与国内顶级高校合作建设人工智能相关课程,同时也积极与技术社区、科技媒体、教育机构等开展合作。创新工场计划利用算法竞赛、技术俱乐部、论坛和会议等方式全面推动技术交流与人才培养。创新工场还希望加强与政府相关部门、国内外高科技公司的合作,促进人工智能相关的技术、格式、接口、服务的标准化,提高人工智能在更大范围内的普及程度,建立规范、合理、健康、可持续发展的人工智能产业生态。