MENU
科研中心

科研中心

之江实验室聚焦网络信息和人工智能两大领域,重点在未来网络计算、泛化人工智能、泛在信息安全、无障感知互联、智能制造与机器人等五大方向开展基础性、前沿性技术研究。

发布日期:2018-12-07

李开复万字长文科普人工智能:AI是什么 将带我们去哪儿?(三)

深度学习的挑战

深度学习也面临挑战

但是深度学习以及机器学习还面临很多挑战。这里有几个问题。

  第一个问题,就是我刚刚提到的:目前仍然没有一个统一的平台。在深度学习方面,现在的人懂就是懂,不懂就是不懂。这就是为什么Google最近花了重金不断在挖业界顶尖的人才,给年轻人开出的年薪甚至超过200万美元。这些人也就是二十来岁,博士刚毕业不久,怎么会这么值钱呢?

  其实就是因为两个理由,第一,这些人进入了公司之后,会被投入到健康、医疗、预防等等各个领域的研究。他们虽然每年拿走公司的两百万美金年薪,但是也许两年后他们就能在相关领域创造出两亿美金的价值,所以对Google公司而言,这些人才实际上不贵,是非常划算的。

  第二个理由就是Google多雇一个,Facebook就得少雇一个。这不是开玩笑。因为在美国有三个大公司在疯狂挖人工智能的人才——Google、Facebook和Microsoft,他们之间竞争激烈,对人才的吸引力也不相上下。

  第二就是深度学习的网络太大,需要海量的数据。

  第三,因为数据太多,所以计算特别的慢,所以需要非常大的计算量。

  第四点有点奇怪但也合理:机器无法用人的语言告知做事的动机和理由。即便机器训练做了很棒的深度学习,人脸识别、语音识别做的非常棒,但它不能和人一样,它讲不出来这是怎么做到的。虽然有人也在做这方面的研究,但是在今天,如果一个领域是不断需要告诉别人该怎么做,需要向别人去解释为什么的,那这个领域对于深度学习来讲还是比较困难的。比如AlphaGo打败李世石,你要问AlphaGo是为什么走这步棋,它是答不上来的。

  即便有如此多的局限,我们还是认为人工智能在很多领域可以迅速应用,并且可以帮助企业打造竞争壁垒。

  人工智能如何帮企业打造竞争壁垒?可以从如下四个方面思考:

  第一,如果你有垄断性的大数据,你就会有很大的优势。关于数据需要注意的几点是,首先垄断性大数据不是公开的数据,不是剽来的数据,也不是买来的数据,因为这样的事情你能做竞争对手也能做。其次,无标签的数据也不会给你带来优势。再次,如果是人工标签的数据也不行,因为人工标签太慢了。最好的数据是闭环的数据,所谓闭环的数据就是在你应用的时候可以捕捉到数据并且知道最终你根据数据做出的抉择对或不对。我们投资的face++,它有和美图、阿里的合作,就一定程度形成了特别大的数据的优势。

  第二,拥有庞大的机群。机群是很重要的,包括需要什么处理系统的支持,怎么去部署,用什么样的计算架构等等。

  第三,你要有一批特别懂的人。没有平台的时候,你就只能把一批人丢进去,让他们去解决特别大的问题。

  第四,当你没有平台的时候怎么办?我们就可以找一批特别聪明的人,让他们不断的调节算法——当然这构成一个短期的竞争优势,从长期看,一旦大的人工智能平台出来,这种优势就不存在了。所以现在来做人工智能,抓到这个先机是特别特别重要的。

  人工智能如何快速商业化?

第一,不要用人工智能去取代人。

  机器不一定要取代人,很多情况之下他只要能辅助人就可以了。我谈到了很多工作会消失,但医生会全部失业吗?一定不会,应该是最高明的医生创造很多机器人给他人使用。记者就不再需要了吗?写深度文章还是需要的,但简单拼拼凑凑的文字就不需要了。所以这些工具一定程度上是在辅助人而不是取代人。

  第二,要聪明的找到容错的用户界面。

  想想搜索引擎,搜索引擎的精确度其实是很低的,你想一想,当你去百度,Google搜索的时候,它们给出的第一条就是你要的答案的情况有多少?我估计不会超过50%,但是为什么我们都说搜索引擎聪明,不说他笨呢?第一个理由当然是因为它博学,第二个则是因为它的界面做的非常的聪明:它给用户提供很多结果,而用户只要能找到他满意的那个,就会认为搜索引擎很棒,因为没有它的话,用户可能什么也找不到。这一类的容错的界面,即便它的识别率很低,给你很多结果,让你在一定时间里得到满足,其实还是达到了一定的可用度。

  第三,让用户提供自然的大数据。

  当Siri推出的时候很多人都说“这就是个玩具而已”,认为它没有真实的用处,但是苹果靠Siri收集了很多人的真实语音,收集了大量数据。

  很多人把Siri当成一个搞笑工具,会问它诸如“你是男是女”这种无聊问题,苹果就把这些无聊的问题深度分析了一下,去了解人们最常问的都是什么问题,然后他们就考虑能不能优化Siri,让它对正常问题的解答能让人们在一定程度上得到满足。人们满足了以后,就会继续的问,如此问题越问越多,苹果也就可以得到更多的数据。

  苹果的这种数据收集方法非常聪明,值得借鉴。我们以前在学语音对话的时候,问的都是非常正经的问题,到最后分析来分析去,不过是那固定的几万句,一直没有跳出这个框框,得到的结果也就不会让人满意。但用一种有趣的方式,你就可以像草船借箭一样,去“借”到几亿个数据。这些数据哪怕不精确也无妨,因为整体来说深度学习非常聪明,能把那些不精确不精准的东西忽略掉。

  第四,关注局限领域。

  Google很伟大,它要做全天候全路况的无人驾驶,它想把全部竞争对手都击败,最后就剩一个Google。这个计划很宏伟,但是是不是一定要这么做呢?我觉得不见得。其实我们完全可以先做一个用于局限领域的无人车,把这样的一个产品先做起来,然后我们通过它获取数据,学习教训,不断改进。

  想想无人驾驶叉车。这个叉车是产生价值的,因为它取代了一个叉车工人去开叉车;它技术难度相对低,因为它只要知道从A走到B;它不上路,不用担心政府的法律法规,不需要考虑撞到人怎么办,是不是要停下。

  Google Car能在高速公路上比99%以上的人都开的更好,但是它碰到一些极端的情况,比如大风大雨的漆黑天,它就没辙了,因为它不知道该怎么办,从来没看到过这种情况。这种情况下只有把车子停下来,但那一停会发生什么呢?当然就追尾了。

  既然这种情况连Google也避免不了,为什么我们不先考虑做一些可控环境下的商业驾驶项目?这也是一个值得思考的问题,不是说Google的路线不对,而是说有两种路线可以走。

  总结:人工智能的未来蓝图

李开复:人工智能的未来蓝图


上图是我认为的人工智能的未来蓝图,这是我们创新工场现在对这一领域的理解,以及可能会发生的顺序。

  大数据应用方面,现阶段我们已经看到很多互联网应用,BI、商业自动化马上也会使用相关的技术,未来几年,离钱最近、产生用户最多、产生价值最大的领域可能就是金融、医疗、教育,当然也包括任何有大数据的行业。

  在感知方面,今天的人脸识别、语音识别已经做的蛮好。对于VR/AR,我们在短期还不是太乐观,但是随着它三五年以后慢慢得到普及,一定需要非常多的新的自然语言的界面。此外,我们大胆预测三到五年之内会有一个人工智能平台出现。

  我们并不认可家庭机器人会很快出现,理由是消费者的期望值是最高的,今天机器人的技术还不行,犯错也太多,而且有时候会看起来太傻,另外价格也太贵,感应器不够灵敏。基于这些理由,我们对家用机器人的投资还只限于一些给小朋友的玩具,或者小鱼在家这种用于沟通的工具,这一类的家庭应用我觉得还是合理的,但要一个能够在家里帮你扫地做菜的机器人出现,恐怕还是一个非常长期的事情。任何行业都要有经济理由来投资这个领域,不断迭代优化它的技术,再进入下一个阶段,所以机器人简单来说应该是工业、商业,最后普及到家庭,所以今天很多对家庭机器人过火的观点和做法我们是不认可的。

  关于无人驾驶,我们的观点是虽然Google Car很伟大,但是因为它要去适应各种路况,所以要到应用阶段也还需要很长的时间。我们认为可以先在局限环境中慢慢推进无人驾驶。

  从长期看,未来人工智能会在所有的领域彻底改变人类,产生更多的价值,取代更多人的工作,也会让很多现在重复性的工作被取代,然后让人去做人真正应该去做的事情。短期来说,人工智能商业价值也很大,短期在很多领域都能产生价值。

李开复和清华大学姚期智院士


演讲后问答实录:

  问题一:刚才听到了人工智能的介绍,真的认为人工智能给我们带来了很多的便捷,的确是快要步入到一个黄金时代,很多人可以从劳动密集型的工作中解放出来。我的问题是,如果很多事儿都可以交给机器来完成,那么剩余的劳动力是否会催生另一个黄金产业,比如服务业等等?

  李开复:这个问题很好,我曾经写过一篇文章《如果十年之后有一半的人失业了,下面该发生什么》,讲过这个问题。悲观的预测是,因为现在的95后,00后大部分成长在虚拟世界里,现实世界只是他们一个小小的补充,所以他们可能深陷其中而不能自拔了。反正人工智能让他们失业,也找不到工作,同时政府也可以养着他们,他们不需要工作,那么干脆每天带着虚拟眼镜起来就玩游戏,不思进取就好了。这个是我特别担心的,也是可能发生的。

  乐观的是上天让我们来到这个世界,本来就不是让我们来做中介、助理这类劳力的工作,我们被生为有感知,有大脑,应该是有更高的目标。那么,是不是上天让人工智能来到我们面前,就是让一批有思考能力的人帮人类找到一条新的出路,让我们每个人能够找到自己的更高目标,让一半失业的人找到他们的归宿,有自我实现的机会呢?

  我对年轻人的建议是做最有热情的事情,要不然机器肯定取代你,要做就要做顶尖最棒最有创意的事情,要不然你肯定会被取代。

  问题二:您讲了很多前景中的事情,我们都觉得美好,但是在实现前景的道路上,最大的几个技术瓶颈在哪里?在解决瓶颈的过程中,您看到的大公司解决这些瓶颈的方案是什么?

  李开复:最大的瓶颈就是人工智能的平台。平台化会带来井喷的效应,但这个平台是什么我今天也无法描述。你可以看到iOS的平台,安卓的平台等等,每一次都造成了井喷式的效应,所以平台化是必然的也是必须的。对于无人驾驶和机器人方面,主要是感应器的价格等问题,一旦问题解决,这些领域也会发生井喷效应。这些都需要聪明的大脑试着去解决。

  问题三:第一个问题,您刚才提到人工智能的黄金时代到来了,那么您能举一个到三个导致这种黄金时代到来的创新明星吗?第二个问题,当人工智能呼啸而来的时候,大家很快意识到人工智能第一个急需解决的问题是人,如果人类把持不住,可能人的时代就过去了。

  李开复:今天有四位CEO,分别代表了芯片领域、金融领域、视觉识别领域和无人驾驶领域,这四个公司虽然目前领域不同,但在到达下一个阶段后,一定会做平台,一定要扩张。任何一个领域都是先做一个切入的应用,做好了之后再扩大,变成一个平台,最终获利最多的就是那些有上下平台连接的公司。

  关于你的第二个问题,即人类将面临的下一个挑战问题,不是机器人占领了世界,我们被机器统治这样的问题。虽然我不排除这些事情发生的可能性,但是我呼吁大家先要应对一个现实问题——下一阶段50%的人可能失业的问题。这可能是一个最大的问题,毕竟在过去的工业时代也好,信息时代也好,失业率从来没有这么高过,今天的政治经济体系也不能承担这么高的失业率。所以我觉得聪明的人应该赶快解决这个问题,这个问题可能十年后就要到来了,当这个问题解决完了之后,我们再去想下一个问题。

  问题四:您讲到的人工智能在各个领域都会以极快的速度超过人的领域,但是它是不是只在某些领域做的更好,在某些人类没有开拓的领域,它有没有自我开拓的能力,根据已有的领域和问题,开拓新的领域?“奇点”真的出现,是不是就说明人工智能有跨领域思考学习的能力?

  李开复:从过去已经发生的事情来看,还不存在人工智能的自我开创,未来有没有可能,这其实是一个蛮有意思的话题。我想即便是一些人类未曾进入的领域,只要你能把它量化,变成一个input/output,我觉得机器还是可以学成的。但是我也相信大部分人类的伟大创意都不是那么容易量化的。

  第二个关于奇点的问题,回到刚才讲的,机器学习并不知道它自己在干什么,它只是一个非常聪明的input/output而已。另外它没有自我意识。科幻小说和现实生活很大的差别是因为科幻小说里面的机器都有自我意识,所以我觉得,由于机器的自我意识和自我创造力,还有自我解释的行动能力,这三者都不存在,奇点来临也就不是那么容易的事情。我相信在未来的一百年,这三点都有可能被克服,也会给人类带来机会和灾难,但是我们现在真正面临的问题还是50%的人可能失业的问题。

上一条:超级通俗的云计算,大数据,人工智能科普文…

下一条:李开复万字长文科普人工智能:AI是什么 将…

该内容仅限
内部人员查看

请登录