MENU
科研中心

科研中心

之江实验室聚焦网络信息和人工智能两大领域,重点在未来网络计算、泛化人工智能、泛在信息安全、无障感知互联、智能制造与机器人等五大方向开展基础性、前沿性技术研究。

发布日期:2018-12-07

李开复万字长文科普人工智能:AI是什么 将带我们去哪儿?(二)

       经过这个学习之后,我再去做监督训练,看机器是否能够识别他们,如果不能,就在训练之后做微调。例如,如果我输入了马云的脸,出来的却是王宝强,那训练系统就会告诉你的网络说这个是错误的:这不是王宝强,这是马云。那接下来就是要进行微调,以便于下一次机器看到这个脸时,能识别出是马云的概率高一些,出来王宝强的概率低一些。

分层无监督训练


但是这么一调也不能调的太过火了,要不然就会有overtraining的问题,我们就对整个数学公式做一点微调,用大量的数据,不断重复的去教它,经过不断微调,那么它就很可能在多次之后降低识别错误。

  其实这一整套理论在二三十年前就已经有了,我在做我博士论文的时候,很多我的同事就在做训练神经网络的工作。

  深度学习在最初的时候训练速度特别特别慢,所以比较难进入工业级别或者是应用级别,比如,你的手机是做不来这个的,因为它的速度实在太慢了。但经过这么多年,我们的计算机变的越来越快,另外也有了更多取巧的训练和识别做法,深度学习的应用可能性也发生了变化,它能被应用的领域越来越宽。多年前,我过早的进入了这一领域,但是现在,人工智能大规模应用的时机已经到了。

  凭什么这么说?一个很简单的评估标准就是,我们的深度学习或者是任何的机器学习,它是不是超越人类的能力表现,如果超越的话,可能很多应用就会产生。比如在机场,如果机器识别人脸的准确度超过人,那么我们那些边防的人就可能不需要那么多。这并不是说机器不会犯错,而是说既然人不能比机器做的更好,那我不妨就用机器取代。

  深度学习的应用领域

  在过去的五年,深度学习的准确度从75%多提升到了97%左右,而人的表现准确率大概是95%。从95%到97%听起来只进步了2%,但实际上是把错误率降低了40%,这是很大的进步。如果这种进步持续,未来人工智能必然会超过人类的表现,同时也将可以进入一些可应用的领域。这就是今天我讲人工智能进入黄金时代的证据:在很多领域,也包括我们在face++做的人脸识别,包括了Apple、Google,科大讯飞的语音识别,它们的认知水平将在未来几年的时间内超过人类,而一旦超过人类,应用就会快速的增加。

深度学习的应用领域举例


深度学习首先可以应用于识别,包括人脸识别和语音识别等,这些可以用于安防,安检等。

  人脸语音的数据来之不易,但是BI,商业的流程、互联网的数据却非常丰富。Google、百度很早就已经在搜索,在广告以及推荐系统里面充分使用了类机器学习技术,解决该推荐什么商品,一个商品怎么定价,在什么位置会卖的最多,应该把这样的产品卖给谁等问题。这一类的推销可以直接产生经济价值,而社交媒体营销,整个互联网广告,这每一个领域都是几十亿,几百亿甚至更大的市场。

  将智能用于炒股其实也是一个不错的选择。在国内在国外,很多人都在做这方面创业的工作。利用智能,我可以随时来算一篮子股票和期货应该如何对冲,以寻求最大的利润。顶尖金融分析师也会做这个,但是他不可能把所有的股票的排列组合都考虑一遍,但是机器可以二十四小时不睡觉,每天都在算怎么能赚最多的钱。除此之外,deep learning深度学习的技术可以把各种的因素都融合进来,比如这个公司的高管有没有变动,今天出了什么新闻,行业里还有没有什么变动……甚至你可以对一个智能系统说如果明天巴西发生了地震,什么股票该被购买,甚至你可以说发生了地震不要问我,你直接去买它就可以了。

  银行保险方面,比如说贷款该不该审批,则无论是银行的贷款,还是P2P的贷款,都可以通过机器来判断,而且数据未必要来自银行内部。

  医学方面,因为我自己生过病,也深深的受过这方面的痛苦,我也感觉到在今天的医生的判断真的不是最完善的。一方面医生有好有坏,顶尖的医生是非常少的;第二方面比如在癌症方面,它每一年都有新的药出来,那每个医生每天忙着看病人,就不见得有时间去研究这些药物,那些药物也不是每个国家都可以使用的。还有就是每一个人,他的各种特质,不见得就适合用这个药。这些其实都是可以用机器学习来做出来的。

  前一阵我在美国碰到了一些科学家,他们正在用机器学习的方法来发明新药。我们的科学研究方面当然要有聪明的头脑和很好的实验,但是其中有一个很关键的部分,就要是一定的程度去排列组合:试很多东西,对小白鼠先试试这个有没有用,再试试看那个有没有用,然后再在猿猴身上实验,再进行人体实验。在以前,这整个过程都是由人脑完成,但是这个交给机器来做也许会更精准。甚至有一家公司它养了非常多的白老鼠,他里面所有的实验都是通过机器学习精准进行:每天白老鼠活了几只,死了几只,什么药可以进到下一步……这些都是靠机器学习加上非常精密的系统来做。

  我们发明的很多新的材料,都不是靠纯粹的科学方法推出来的,也是去试一试,把这个碰到那个,就产生了有很特殊效应的材料。这些知识都可以输入我们的信息学习系统,通过它我们可以帮助发明新的事物。

  在教育方面也有应用。在学习的过程中,如果基础没有打好,下一个层次根本学不下去。智能化的教育系统会识别你的学习水平,然后根据你的水平确定学习内容。比如,你的乘法没有学好,机器就不可能让你去学除法。

  当然学习外语也是很好的例子,我们今天的语音识别做的这么好,为什么我们学外语还是一定要找外教,为什么语音识别不能再上一层楼呢?所以,当你的技术一提高了,语音识别应用就不会只是我的讲话进去然后文字出来,它还有可能用在教育领域。

  在这么多机会之下,这个人工智能会重塑亿万级别的领域。当然这个不是明天就会发生,因为我觉得人工智能在很多方面还是相当大的欠缺……

  人工智能将重塑亿万级别的领域

  人工智能会重塑很多亿万级别的领域。当然这个不是明天就会发生,因为今天我们在很多相关方面仍存在相当大的欠缺。

  比如,在我们的计算架构上面,现在还是需要时间去做算法的改进提升,需要去研究如何部署云端架构,另外深度学习用时仍太长,这些还都是需要探索的内容,而且并没有一个标准化的答案。

  另外,算法框架也非常重要。我们可以看到有一些重要技术的推进,实际上是因为有了开源或者API或者标准的出现,但现在仍有很多方面还没有出现相关标准。当然我们知道Google的TensorFlow等提供了一些开源的方法,但是其实他们还没有真正的平台化,比如你把TensorFlow丢给一个没学过机器学习的人,哪怕是清华大学顶尖的计算机系学生,他也很难用其创造价值。如果清华的学生都不能,那它的普及性就有问题了。

  为什么iOS、安卓能够做的很好,就是因为它产生了平台化效应,使得很多人能够比较容易的介入。然后我们可以看到像Hadoop这样七八年前很多人觉得很高深的东西现在也慢慢变得平台化了。今天,如何使得整个机器学习的体系平台化,以便于让更多的非专业人士能够使用,这个是目前面临的一个很大的瓶颈,需要一定的发展时间才能得以突破。

  在一些领域中,很多技术性问题可以在两三年内得到解决,但是还有很多问题并非如此简单,比如说语义。我们说语音识别是相对简单的:音进来,字出去,这个非常明确,一个API就可以调动。但是音进来,确定是何种情境的语义出去就很难。这些我觉得两三年远远还不够,还需要更多的时间去理解。

  传感器一定程度来说是价格的问题、如何普及的问题。现在我们看到Google Car虽然做的很牛,但是正如驭势科技的吴甘沙说的,Google Car实际商业化的一个巨大瓶颈就是价位的问题:传感器实在太贵了。因此要把这件事做下来就是一个鸡和蛋的问题——降低价格就需要量,但量怎么起来?价格不下去量也起不来。要解决这个问题也需要一定的时间。

  最后还有很多机械方面的问题。控制机械运动的算法,硬件运动后给出的回馈等等在机械部门也还需要一些开发。

  整体来说,虽然我认为机器学习、深度学习在突破人类的精确度方面已经做的非常好,但是以上几个领域还是需要一些时间才能取得突破。但是这一天肯定是会来临的,我们怎么知道会来临呢?

  Google的野心

  我们知道,不久前Google重新组织了公司架构,将搜索业务和其他前沿项目子公司都放进了控股公司Alphabet公司。很多分析师说,Google把搜索和其他的业务分开来做Alphabet,是为了优化它的股价,其实这种说法太表面了,他们没有了解一个真正有野心的公司在做什么。

  一定程度上,Google之所以成立了Alphabet,是因为Google经过搜索和广告业务的积累,逐步发展了一套我们可以简称为GoogleBrain的模式。Google Brain其实就是机器学习的大脑,这个机器包括了平台也包括了专家,如果它用在搜索领域就是一个搜索引擎,如果它能够用在医学领域,那它可能就是一个癌症诊断系统,它也可以用于人类寿命的延续以及智能家电等各种不同领域。所以Google的野心就是把机器学习作为一个核心,然后用它去解决非计算机非互联网领域的各种问题。

  当然它现在还不是一个整体平台,但Google 就会找一些极聪明的人来进军这些领域,有平台的用平台,平台未成形的就用聪明才智来想办法。现在看来,Google这种模式也做成了很多有意义的事情。所以,对于Google,我们千万不要低估了它的能力,因为这家公司可能是未来推动人工智能平台化的最大力量。

  怎么证明这是真的呢?从最近Jeff Dean演讲的一张图我们就可以看到Google内部有多少项目在用深度学习。

Google内部对深度学习的大量应用


我们可以看到,从2012年到今天,Google对深度学习的利用在快速增长,应用领域也极为广泛。从这张图我们就可以看到Google,也就是现在的 Alphabet在人工智能方面是多么的有野心。

  再回到我原来的问题,我们现在是不是生逢其时,可以在正确的时候选择进入人工智能这个领域呢?如果我们相信Google这帮人很聪明,如果我们相信Google对深度学习的使用逻辑,我们也要相信人工智能的应用期即将来临。

上一条:李开复万字长文科普人工智能:AI是什么 将…

下一条:李开复万字长文科普人工智能:AI是什么 将…

该内容仅限
内部人员查看

请登录