最强大机器学习平台开源 谷歌准备主宰人工智能?
2007年11月,谷歌发布了开源手机操作系统Android,为八年后这一系统主导全球智能手机市场奠定了基石。如今谷歌希望再次得到开源赐予的力量,让人工智能崛起。
谷歌本周宣布,发布新的机器学习平台TensorFlow并将其开源,所有电脑用户都将能够利用这一世界最强大的机器学习平台进行研究。谷歌在其官方博客中写道:
几年前,你还没法利用谷歌应用进行语音输入,也不能通过谷歌翻译直接阅读俄语,更没法在谷歌图片中直接定位你的爱犬。我们的这些应用当时还不够智能。但是在短暂的时间之后,它们变得更加聪明,如今,凭借机器学习技术,你可以很轻松的完成上面的事情。
但是,尽管我们在机器学习领域取得了这些成果,我们认为还有空间可以做的更好。
所以,我们打造了一个全新的机器学习系统,我们称之为TensorFlow。TensorFlow比我们过去的系统更快、更智能也更加具有弹性,能够更简单地在新产品和新研究中加以采用。
我们亲身体验到TensorFlow的能力,认为它在谷歌之外可能会产生更大的影响。所以,我们今天决定,将TensorFlow开源。
我们希望这将促进机器学习社区,不管是学术研究人员、工程师还是业余爱好者,都能够通过直接在代码而非纸面上进行研究,从而更加快速的交流观点,最终让科技更好的服务所有人。
谷歌原有的深度学习系统DistBelief开发于2011年,它让谷歌能够针对数据中心构建大型神经网络,典型的应用包括提升谷歌应用中的语音识别能力,以及为谷歌搜索加入图片搜索功能。
不过DistBelief存在一些限制,较难配置,且和谷歌内部设施紧密结合,无法很好地分享研究代码,因而谷歌推出新一代的TensorFlow系统。
谷歌表示,已有超过50款谷歌产品采用了TensorFlow,将深度学习技术带给用户,包括谷歌图片应用中的脸部识别技术。如今谷歌将自身产品与服务的特色,以开源的形式贡献给了世界。
TensorFlow:人工智能界的Android
谷歌在博客中只是提到TensorFlow是机器学习系统,并未做过多解释。那么TensorFlow到底是什么?
简单来说,TensorFlow是一个文件库,研究人员和计算机科学家能够借助这个文件库打造分析图像和语音等数据的系统,计算机在此类系统的帮助下,将能够自行作出决定,从而变得更加智能。
这也是机器学习的基本原理,即计算机对输入的数据加以理解之后,利用这些数据作出合乎逻辑的决定,从而实现类似人脑的功能。
而在机器学习的基础之上,TensorFlow则更加复杂,能够非常精确、快速地消化和输出数据,可以用作打造人工智能工具的核心。
TensorFlow系统使用数据流图处理信息,在这个系统中,具有多个维度的数据在不同的数学计算体系中流转,这些复杂的数据就被称作“张量”(tensor),而这些数学体系中流转的则为“节点”(node)。数据从在不同节点之间流转,就能告诉整个系统不同数据之间的关系。“张量”(tensor)在节点图中流转(flow),也是TensorFlow命名的由来。
将TensorFlow开源,意味着不论是研究人员还是大学生,都有机会使用这一专业软件。不论是创业公司还是大到能和谷歌匹敌的企业,都能够像使用Android系统一样,根据自身需要使用TensorFlow,即便是在TensorFlow的基础上开发出与谷歌直接竞争的新工具。而谷歌得到的好处则是,在整个人工智能领域树立权威。
谷歌希望看到的理想结果
早在三个月前,斯坦福大学计算机教授Christopher Manning和他的学生获得优先使用TensorFlow的机会。在使用仅仅数周之后,Manning就决定在自己的课程上使用这个系统。
除了开源属性上和Android一样,Manning认为TensorFlow还有点像Gmail。他称,尽管竞争者众多,但Gmail更加整洁好用。Popular Science援引他的话表示:
以前不是没有高水平的深度学习资料库,但总体上,看那些资料库更像是三名学者加上一个大学毕业生的打造作品。
在其他深度学习资料库中,最出名的是Torch和Theano,它们分别由小型团队进行更新维护,与谷歌在机器学习领域投入的资源不可同日而语。
Manning表示,TensorFlow是谷歌对开源社区的巨大贡献,而谷歌自身也将间接受益于这个举动。他表示:
已经有一些公司在雇佣大量优秀人才参与人工智能开发,特别是深度学习。谷歌不是慈善机构,我相信他们在将这贡献出来之前就已经想到,大学将会出现很多这方面的博士研究生。
不过在TensorFlow的缔造者之一、谷歌工程师Jeff Dean看来,机器学习社区对TensorFlow的采用率到底会有多高,还很难说。他表示:
尽管在谷歌看来,它用处很大,但真正的考验在于机器学习社区是否也这样看。打造这个工具的初衷是,机器学习社区的想法不仅仅停留在理论上,而是能够更加快速的实施。
我们希望能够推动机器学习领域研发的加速。
对于机器学习社区来说,这是谷歌送来的大礼。最理想的情况是,机器学习社区也能以同样的方式共享他们的研究成果。
对于开发人员来说,TensorFlow是一个相当完整的工具包,集成了大量工具以及Apache 2.0协议,能够很方便的商用。开发者既可以在电脑环境中进行编译,也可以将它部署到移动设备上。谷歌还提供了使用教程及文档,帮助开发者快速理解并使用这一平台。
Manning称,能够在移动设备上运行深度学习算法,将是TensorFlow和其他开源系统最大的区别。
对于现在就想尝鲜TensorFlow的开发者来说,谷歌也提供了一个可用版本。此外,它还内建了大量API接口,软件开发者能够很容易控制他们自己的TensorFlow模块。
谷歌如何打造这一系统?
为了打造TensorFlow,谷歌已经花费了三年时间。对于TensorFlow的称呼,谷歌希望外界称其为“机器智能”而非“人工智能”,它认为后者包含太多言外之意,谷歌想打造的是真正的“智能”,只不过载体是机器而已。
在谷歌内部,TensorFlow的核心模块已经使用了多年。谷歌工程师如果对人工神经网络感兴趣,都可以自由地对这个系统做出修改,在这种开放的组织结构下,约有100个团队对打造强大的机器学习技术做了贡献。
谷歌首席执行官Sundar Pichai在10月的业绩沟通会上表示:
我们希望在自身所有产品中使用机器学习技术,不管是搜索、广告、YouTube还是Play商店。
尽管现在还处在早期阶段,但是我们将会系统性地在所有这些产品中应用机器学习。
化繁为简
如今计算机程序解决问题的方式,大多是通过机械地与文件库中的字典进行比对,然后识别文档的意思。但是如果要像人类一样进行理解,计算机就需要将文档细分为不同的区块,对每一区块进行专门的理解。
人工智能领域先驱、谷歌工程师Geoff Hinton称,“对于一份文档,谷歌希望弄懂其中的逻辑关系,这份文档想说什么,一个想法是如何与上一个想法衔接的。”“如果我们能开始这样做,你就能获得更好的搜索结果,因为这样一来计算机实际上是自己在读取文档并加以理解。”
至于为何谷歌现在还没有开始这样做,Hinton称,人工神经网络能力即便达到极限,也与人脑差距很远。目前最好的算法能够操纵数亿个变量,而人脑能够处理的则高达100万亿。
尽管如此,Hinton称他对人工智能研究的前景依然非常乐观,其中很大部分原因是思维载体(thought vectors)研究日益盛行。通过将文档转化为思维载体,机器就能够理解并记住文档信息,从而通过逆向工程,用人脑理解事物的算法来学习。
此外,过去五年中物体和语音识别技术的进步,也是Hinton感到乐观的重要原因。以前这些极为复杂的技术如今都已变为现实,在标准测试中的识别错误率也大幅下滑。他表示:
它们正逐步向人类的水平靠近,虽然不是每个方面都是这样,但在物体识别等方面已经达到这一成就。几年前,计算领域人士会告诉你,很多年内都不可能达到这种水平。
但是不管计算机对人脑模仿的多好,如果普通人不知道如何加以利用,就什么都不是。这也正是谷歌希望解决的问题,让人工智能尽可能看起来简单。
转载请注明出处。GIS帝国网站报道中出现的商标及图像版权属于其合法持有人,只供传递信息之用,非商务用途。