「深度」人工智能走出实验室

更新时间:2016年06月29日10:22:27 点击次数:849 打印此页 关闭
分享到:

▲ 关注“健康点”轻阅读智库

#人工智能

假设把围棋的招数换成医学文献和健康数据,人工智能系统能否通过信息的不断摄取,逐步具备诊断病情的推理能力?如果医生有AlphaGo这样的智能助手,人们对社区医生的不信任感会否减少?人工智能技术正以前所未有的速度落地商用,巨头们在加速布局,寄望“赢者通吃”。



作者:张而弛;来源:财新网


跟很多一线城市的三级甲等医院一样,每天清晨不到七点,北京安贞医院的专家挂号处就排起长队。这家成立于1984年的医院以治疗心血管疾病闻名,门诊专家号往往在开门的刹那就被“秒抢”一空。


中国医疗资源分配不均是痼疾。北京市统计局和国家统计局北京调查总队2015年调查数据显示,去北京社区医院治疗慢性病的人不到三成,75%的人去那里只是为了开药。


辉瑞中国医学部副总裁谷成明希望解决这个问题,但通过现有体系培养优秀医生耗时太久,于是他转向美国科技企业IBM。3月1日,两家公司在北京宣布,将借助机器学习和深度数据挖掘等方法,建立一个中国的慢性病风险预测模型,辅助医疗诊断。安贞医院从2014年起就与辉瑞开展心血管医疗大数据项目,预计此次也会在合作之列。


“现在的世界里,我们必须依靠外界的力量和工具,让别人替我们学习、推理,帮助我们解决问题,这就是IBM人工智能系统Watson能够带来的解决方案。”谷成明在发布会上说。



整个三月,人们都在热议李世石与机器人AlphaGo的对弈。情绪在一周内经历了两个极端,赛前纷纷不看好人工智能,机器3比0领先之际,又开始担心人类马上会被机器取代。根据谷歌博客,AlphaGo一共学习了3000万步围棋走法,直到系统能在57%的概率下预测人类行为。谷歌旗下公司DeepMind还给AlphaGo设定了目标,让其通过不断的自我训练,最终算出最佳解决方案。


假设把围棋的招数换成医学文献和健康数据,人工智能系统能否通过信息的不断摄取,逐步具备诊断病情的推理能力?如果医生有AlphaGo这样的智能助手,人们对社区医生的不信任感会否减少?这正是辉瑞与IBM想要解决的问题,也是DeepMind将与伦敦帝国学院、伦敦皇家NHS信托基金会一起研究的课题。


人工智能的应用潜力巨大,但最乐观的人也承认,现在的技术还存在大量缺陷。过去的60年,人们数次判断人工智能的大规模应用已不遥远,并投入巨资研发,但屡屡无果而终。这一次会不会带来真的飞跃?


2015年以来,从微软人工智能助理小冰登上东方卫视播报天气,到百度在北京路测无人车,从Facebook用机器判断用户喜欢阅读的内容,到谷歌用人工智能系统RankBrain改进搜索结果,人工智能技术正逐步走出实验室。巨头们的尝试都还处于摸索阶段,但由于人工智能系统是越用越“智能”,各家公司都在想方设法比别人更早开跑。


除了大企业的重金投入,人工智能技术也日益成为投资界新宠。根据风险投资数据公司CB Insights的报告,2015年,全球做人工智能的初创公司一共募集到了3.1亿美元,几乎是2010年4500万美元募资规模的七倍。2015年投下的资金里,50%是种子轮,19%是A轮,说明这个领域的投资仍集中在早期。


种子已播下,市场关注的是:谁能挖到第一桶金。


热潮再起


1968年,美国科幻电影《2001太空漫游》首次出现了一个人工智能形象——HAL 9000型电脑。这台电脑能与人对话,能跟宇航员下棋。它从不犯错,控制着整个宇宙飞船,向木星进发。但快半个世纪过去了,像影片中那样强大的人工智能并未出现在真实世界。



“人工智能”一词源于1956年美国的达特茅斯会议。“冷战”背景下,美国政府投入大量经费想要研发一台可自动翻译俄语的机器,当时的一个解决方案是1943年提出的神经网络理论。该理论参考了人脑神经网络的工作原理,用算法和结点来模仿神经元处理信息的方式。但彼时神经网络模型并不成熟,计算机的运算量有限,使得研发出的机器既做不到准确翻译,又开销巨大。各国政府因此对人工智能技术失去信心,整个领域在1974年前后进入了“冬天”。


1981年,随着大规模集成电路的应用,日本宣布研发“第五代计算机”,希望能在电脑中结合人工智能。美国等随后跟进,促使大量资金再次涌入相关领域。但几年之后,这些计划并没有留下什么革命性产品。到1987年,人工智能方向的投资再次无以为继。


高盛在2015年2月发布报告称,新一轮人工智能投资热潮的兴起是“一场完美风暴”:受益于近年的智能手机革命,许多零部件设备,如传感器、相机、雷达等已更为便宜,这导致更多设备被连接起来,并反过来产生了大量可分析数据。另一方面,神经网络和并行计算在过去十年取得重大进展,计算机能够更好地理解信息,甚至包括语言对话和图片这样的非结构化数据。


“深度学习的想法已经存在了好多年,但这种技术只是五六年前才开始变得这么好,为什么?”百度首席科学家吴恩达反问财新记者。吴恩达曾帮助谷歌搭建了深度学习研究项目“谷歌大脑”,2014年他离职来到百度,负责百度在硅谷的实验室研究。


“主要有两个原因,一是像百度、谷歌、Facebook这样极少数的几家大公司拥有了海量的数据,二是我们有超级电脑这样的计算平台,可以去使用这些数据。”吴恩达表示,人工智能现在面临的最大矛盾是“机会太多、人太少”,有非常多有价值的项目,没有足够的人去尝试。这既包括百度在开发的无人车,也包括人工智能在金融、搜索、图片识别等各方面的应用。


高盛也预测,人工智能技术将“电子化”人们的决策过程,降低医疗、金融分析等领域的技能门槛。


深度学习的优等生


吴恩达所提的深度学习是机器学习的一种,也是此次人工智能革命的基础。从2006年起,这项技术正越来越多地被应用到各个领域当中。


微软全球资深副总裁彼得 · 李(Peter Lee)曾向财新记者解释深度学习的原理。近年来,微软研究院一直在探索将深度学习应用在语音识别上,并推出了虚拟机器人“小娜”(Cortana)和实时语音翻译应用Skype Translator。



彼得解释称,为了让机器学会一种语言,微软研究院搭建了一个五类分层的“深层神经网络”,通过长期训练,使这个系统能够完成较为准确的语音识别。


“想象有一个多层的蛋糕,每一层都在学习人类怎么说话。在蛋糕的最底层,我们让它学习最基础的音素;在上面一层,可能学习连在一起的几个音素,知道声音是如何连在一块的;再上面一层是一个个词语,再到词与词的搭配和组合,最后到整个句子的理解。每往上一层,机器学的就越多。”彼得说。


在学会人类语言后,每次听到有人说话,机器就会将声音层层分割为一个个音素,与系统中已有的数据作对比,然后识别出人类在说什么。


彼得告诉财新记者,在研究过程中,他们还发现了一件“神奇”的事情,就是机器学会英文后,再去学中文,其英文水平也会相应提高。这是因为中英文句子被切成非常小的音素后,主要的差别在最上面几层,而最底层的区别不大。因此,当微软训练机器汉语时,最低几层对于音素的识别也得到了强化,机器识别英文的能力也增强了。


“这在计算机科学领域叫做迁移学习,即在一个任务里学习到的内容可以应用到另一件任务上面。这是很强大的一个能力。”彼得告诉财新记者。微软的目标是,在让机器学会多种语言之后,可以帮人们进行即时翻译,打破语言鸿沟,“连接世界上所有的人”。


在AlphaGo学习围棋的过程中,谷歌对机器学习的另一个领域——强化学习进行了探索。强化学习是指在设立目标后,让机器向着这个目标不断尝试,通过给予持续的激励,让系统自己找到最佳的解决方案。


这种方法的突破性在于,以前人们都是通过编程,让机器严格执行人类的命令。而强化学习则把探索答案的过程交给了神经网络,让其在一次次的摸索中寻找最优路径,最终的道路有可能是人类都未曾设想的。


强化学习是DeepMind公司赖以成名的因素,也是2014年Facebook与谷歌争抢这家公司的原因。在4亿美元拿下DeepMind的背后,是谷歌对人工智能技术的巨大期望。


“我们在重新思考我们做事的方式,而机器学习是其中核心且能改造其他部分的方式。”谷歌CEO桑德尔 · 皮查伊在2015年10月的季报会议上表示,“我们正在将机器学习技术全面地应用到我们所有产品上面,包括搜索、广告和YouTube等。”


老Watson的新征程


2月22日,IBM年度云计算和移动会议Interconnect在美国拉斯维加斯展开,吸引约2.3万人参加。



一步入展厅,参观者便会看到一扇巨大的拱门,门楣处写着:“欢迎来到认知时代。”展厅里,IBM与软银合作的Pepper机器人正与参观者进行英文对话,并能伴着劲歌跳舞。还有IBM员工向客户展示他们的“认知计算”系统能够如何分析公司的销售数据,判断什么样的客户最有可能再次购买公司产品。


“认知商业”是IBM自2015年起主打的一个概念,包含具备规模化学习、能根据目标推理、能与人类自然互动能力的认知计算系统。IBM始终坚持认知计算与人工智能不同,认知计算不是制造“替代人们思考”的机器,而是“增加人类的智慧”。这个概念的核心实际上是其人工智能系统Watson。


作为人工智能领域较早的探索者,IBM曾在1997年和2011年分别创造了两次轰动性事件:1997年,IBM研发的“深蓝”电脑打败了国际象棋冠军加里•卡斯帕罗夫;2011年,其研发的超级计算系统Watson又参加美国电视节目《危险边缘》,通过答题打败了两位人类冠军选手。


在两次人机对决中,IBM展示了人工智能强大的计算、搜索和语义分析能力。但除了获得大量媒体曝光,这些技术并未变现。由于只会蛮算,“深蓝”在战胜人类之后便遭拆解;Watson则有太多功能为问答节目定制,在用于其他领域前,仍需重新改造。


直到2014年,IBM才下定决心将Watson作为主攻方向。2014年1月,IBM宣布投资10亿美元组建Watson业务集团。这次转型的代价是IBM在同一个月与联想达成协议,出售自己的X86服务器业务。



此后,IBM在人工智能领域下的“赌注”越来越大。据财新记者不完全统计,从2014年至今,IBM至少收购了八家与认知计算相关的公司,投资了四家初创企业,已披露的收购金额超过56亿美元,包括医疗数据公司Truven,美国天气频道母公司的数码和数据资产,以及能够阅读医学影像的公司Merge Healthcare。


所有这些收购都凸显了数据在人工智能时代的决定性作用。与谷歌、Facebook等坐拥大量用户数据的互联网公司不同,IBM这样的传统科技企业并不能使用各企业存储在其服务器或云服务上的数据。而要对Watson进行深度学习训练,海量的数据是其变得更加智能的必要条件。


为此,IBM四处寻找合作伙伴,希望借助他人的力量在各个行业占得先机。2016年CES(国际消费电子展)期间,IBM在一个多小时里一口气宣布了四项合作,包括帮助美国家电厂商惠而浦分析其智能家电收集到的数据,与医疗设备公司美敦力合作为糖尿病患者分析血糖水平;还向开发者推出了28个应用程序接口(API),希望开发者能在自己的产品中嵌入这些技术,加入IBM的生态圈。


“作为一个企业,IBM不可能什么都靠自己来做,”IBM大中华区董事长陈黎明在3月1日宣布“认知计算”在中国落地时表示,“IBM自己研发了一套Watson系统,合作伙伴可以在云平台上搭建各种各样的应用,很多大戏都可以在这个平台上唱。”


在2015年的报告中,高盛也表示,由于人工智能是越用越智能,“这项技术可以强化行业领导者的主导地位,因为它们在访问专用数据上有预先存在的优势”。不过,高盛的分析师们也明确指出,虽然IBM对这项技术期望甚高,他们短期内还看不到Watson能带来什么显著收入。


除了短期赚不到钱,IBM还意识到,Watson进入中国需要克服诸多本土化困难。这一方面是Watson需要能够“懂中文”,另一方面还要克服外资企业难以获得的中国核心数据的问题。


为此,IBM选择了中国智能语音技术提供商科大讯飞进行语音识别上的合作。在获取数据方面,IBM则拉上了大型国企中国电子信息产业集团(下称“中国电子”)。中国电子在官网上自称是“中国最大的国有综合性IT企业集团”。


3月23日,中国电子宣布与IBM签署合作协议,将在陕西咸阳通过分析空气监测站和气象卫星传送的实时数据流,为管控雾霾提出精准方案。2016年,双方还将在湖南长沙对200家企业进行智能制造试点,帮助长沙制造业企业转型升级。


“我曾经开玩笑地比喻,我看到这个蛋糕很好吃,很想吃,但中间隔了一层玻璃;可能中国有一家企业,也想吃这块蛋糕,但却没有能力。”陈黎明曾向财新记者解释“认知计算”在中国落地的模式,“这时候如果两家合作,就解决了你我都想吃蛋糕的问题。”


陈黎明还呼吁,中国应当进一步开放数据,将其作为一个资源来开发。“世界上所有的资源都是越用越少的,只有数据越用越多。你如果不去开发这个数据资源,还是需要花钱去维护和存储。随着时间的推移,有些数据可能就没有任何的价值了。”


竞逐无人车


业界有观点认为,自动驾驶可能是人工智能所有应用中变现能力最强的。它可能让司机下岗,让人们逐渐从买车变为租车,还可以在车内给开发者留下足够的广告空间。苹果首席运营官Jeff Williams将汽车称为“终极移动设备”。从科技公司到整车厂都对制造无人车展现出了极大的兴趣,而这个行业的发展也折射出,人工智能想要落地,需要法律法规、硬件设备等外围环境的配合。


无人车充分体现了人工智能的特点:无自主意识,专注,不像人类那样容易开小差;更重要的是,最先开发出产品的公司将能够积累大量数据,使系统变得更“智能”,从而吸引更多的人选择该公司的产品。



↑百度无人车驾驶汽车


2015年12月10日,百度宣布其无人驾驶汽车在北京完成了一次全自动驾驶路测。百度自动驾驶事业部总经理王劲近日透露,百度在无人车上的投资至少将达到百亿级。他认为,无人车与搜索类似,谁先进入就有领先优势,是一个“赢者通吃”的市场。


“如果我提前一年部署了10万辆车,一辆车一年跑2万公里是很正常的,这就是20亿公里的驾驶经验。我比你多了20亿公里的驾驶经验以后,你还怎么跟我竞争?我的系统已经到了非常先进的时候,你还在原始状态。”王劲说。


他的逻辑各竞争对手都懂,但各自实现路径不同。在传统车厂看来,自动驾驶需要循序渐进,一步一步地往车上添加各项功能,看消费者是否愿意为其埋单;而以谷歌、百度为首的科技公司,则希望能跳过中间阶段,一次性研发出可以自动驾驶的无人车。


这两大阵营都认为对方的发展思路不对。传统车厂认为,无人车需要雷达和服务器,一次性添加的成本太高,没有多少消费者愿意购买;而在谷歌和百度看来,“半无人驾驶”的问题是,人们几乎肯定会在自动驾驶的时候分心,当突发事件来临时,系统无法处理最复杂的问题,人又不能很快作出反应,极容易发生车祸。


王劲坦承,现在百度的无人车价格较高,2015年时车顶上的一个激光雷达成本就高达70万元。百度希望跟生产厂家合作,五年内将其降低到2万元以下。“今年同款激光雷达已经下降到50万元。”王劲举例说,“当我们量产的时候,我们整套无人驾驶设备每个月的折旧费和使用费加起来,是雇一个司机价格的五分之一到三分之一。”


百度计划在三年内实现无人车商用,五年内实现量产。百度的“商用”指的是在特定区域内对固定环境内的路面、红绿灯等实现100%的识别,进行车辆全自动驾驶。其模仿的对象更像是固定路线上的公交车,而不是可以随意选择目的地出行的出租车。


这一目标不易达成。谷歌的无人车项目从2009年启动,至今仍不时有车祸新闻曝出,考验着人们对无人车的信心。作为后来者,百度虽可以吸取谷歌的教训,少走一些弯路,但王劲承认,无人车在技术上还有“很大的提高空间”。



“无人驾驶肯定是方向,有很多技术上的困难,实现的路径不会像谷歌、百度想的那么容易。”从事汽车传感器研发的上海海拉电子技术中心总监张全慧告诉财新记者,在传统汽车业,每一项技术的小的提升,都意味着相关的系统、传感器完善的过程,用户的体验和反馈是技术提升必不可少的,“人车环境、车车环境、道路环境,都需要逐步成熟”。


无法忽视的风险


3月9日,AlphaGo刚赢下与李世石围棋大战的第一局,昆仑万维(300418.SZ)便在当晚发布公告,拟通过全资子公司出资300万美元与其他方成立昆仑人工智能科技公司。消息一出,市场质疑昆仑万维“跟风”炒作,并没有给出热情的追捧。


在业内人士看来,人工智能技术需要长期投入,不断改进。虽然人工智能受益于物联网、云计算等技术的大规模应用,但其发展也会受这些技术普及程度的限制。在与IBM宣布合作的发布会上,科大讯飞轮值总裁、讯飞研究院院长胡郁表示,人工智能技术快速地进入人们生活是一种“错觉”。


胡郁认为,人工智能是一套复杂的系统,不是用一些微创新和产品创新就能实现的。他介绍,科大讯飞在2010年发布中文智能语音云服务,之后不断收集用户的使用数据,不断优化后台,才能在五年后对嵌入式设备上的语音输入做到95%的准确率。


复旦大学计算机科技学院教授危辉也向财新记者表达担忧,深度学习会否像人工智能历史上的许多技术那样,“红过一阵子后,再过五年十年都不提它了?”


在危辉看来,人们在人工智能早期就有类似深度学习的想法,只不过现在的计算速度更快,能够通过大量的硬件设备去实现它。但他担心的是,过几年,人们发现这个技术有缺陷或不能解决一些复杂问题后,就可能会抛弃它。“现在做的一些技术,其实没有突破太多已经存在的经典难题,基本上都是已有技术的堆砌。”


危辉指出,深度学习现在最大的限制在于,交给人工智能的问题必须是一个“很干净”、很规范的问题,往往限定应用场景。比如一个能够在人脸库中做好人脸识别的系统,未必能在人来人往的大街上做好,因为大街上人脸的背景干扰和自身的变化太多了。


他还举例,IBM的Watson可以很容易理解血压这类较为简单的概念,并用一个数值来表示压力的变化。但一旦遇到“某部位功能障碍”这类复杂概念时,人们便很难用简单的物理数值来表示。而机器如果无法理解这些概念,便不能做下一步推理。


“知识的获取和表示,是人工智能的老大难问题,这是个理论难题,已经超越了工程难题的范围,目前没有非常好的解决办法。”危辉说,“我觉得,IBM他们低估了这方面的困难。”


IBM中国研究院院长沈晓卫也曾公开表示,今天的Watson更像是开启了商业计算机时代的IBM System/360,还处在“婴儿阶段”,其技术和商业模式都还不理想。System/360是IBM在1964年推出的大型主机,曾帮助美国实现“阿波罗登月计划”。


“我们在上世纪60年代的时候,不可能想象到今天计算机会发展成这样。同样,我们今天也不敢想象20年后的‘认知计算’带来的震撼。”沈晓卫说。


公众已经开始担心人工智能技术成熟后的问题,比如将机器人用于战争是否会带来像核武器一样的后果。特斯拉创始人埃隆•马斯克比谷歌更早投资DeepMind,但他2014年8月在推特上表示:人工智能有可能比核武器更危险。马斯克与LinkedIn联合创始人里德•霍夫曼等人捐资10亿美元,在2015年12月成立了非政府研究机构OpenAI,希望使一部分人工智能技术脱离各种利益的驱使,将专利与世人共享。


“很难预测与人类具有同等智能水平的人工智能将给社会带来多少好处,也很难想象,如果开发或使用不当,这项技术将给社会带来多大的危害。”OpenAI团队在宣布成立的公开信中写道,“鉴于人工智能让人惊叹的发展,我们很难预测类人工智能将在何时出现。但当它出现时,有一家能将全人类的利益置于私利之上的研究机构是很重要的。”


在《连线》杂志创始主编凯文 · 凯利看来,每一个发明都不可避免地带来新的问题,但同时也会带来新的解决方案。“解决这些问题的方式不是减少技术的使用,而是通过改进技术来提供解决方案,当然这些新技术又会产生新的问题。”他对财新记者说。


凯文 · 凯利认为,只要人们在不断创造新的可能,就是一件好事。“即使新的科技发明带来的49%是问题,但它同时也带来了51%的好处,差别就在于这2%。”他说,“2%很少,但人类需要这2%,通过一年年积累产生强大影响力。所以,即便新发明带来的好处只比问题多一点,这一点就是人类进步的动力。”


财新实习记者尚甲对此文亦有贡献


- end -

上一条:李克强主持国务院常务会议 确定医疗大数据措施 下一条:24小时冷静期后,聊聊医生集团融资的两个问题