从 2015 年到如今,Google 正式开放 TensorFlow 曾经两年多了,蕴含 Jeff Dean 正在内的 Google Brain 成员们都对那一产品寄以重望。「AI 界的安卓系统」,钻研员们常那样对媒体名称 TensorFlow,Google 欲望那款开源的 AI 工具包能像当年的安卓一样赋能全世界的开发者们。
事真上,两年多来,TensorFlow 曾经演化成一个很是完善的深度进修软件开放平台,不只是 Google 原人将 Google Brain 的那一钻研成绩使用于自家的各类软件使用上,借着硬件英特尔和英伟达等硬件平台的共同,TensorFlow 曾经成为开源网站 Github 上最受开发者接待的工具,远超微软和 FB 等公司供给的计较框架。
正在极客公园翻新大会 IF 2018 上,来自 Google Brain 的首席工程师陈智峰分享了两年多来 TensorFlow 正在各个规模的使用状况,从他的演讲里,咱们能够看到那款仿佛距离咱们很是遥远的 AI 开发工具,真际上早已映响到咱们日常的糊口,并且将会正在将来很长光阳内,为咱们带来更多的扭转。
以下内容依据 Google Brain 首席工程师陈智峰正在 GeekPark IF 2018 大会上的演讲梳理而成,略有增减。
各人好,我叫陈智峰,我是 Google 大脑团队的一名成员,正在那里,我很欢愉到极客公园和各人分享 Google 大脑最近一年到两年光阳里的钻研标的目的,和正在 TensorFlow 方面的一些工做、成绩、停顿。
深度进修那几多年很是风止,正在那张图上,各人可以看到正在 Google 的搜寻流质里面,深度进修正在已往的 7-8 年光阳里面,删加了粗略 100 倍,从那个侧面也反映出学界和家产界对那个技术的关注程度,是正在迅速地进步。各人都想晓得,深度进修是什么,它能够为咱们作什么?咱们如何把那个技术使用到真际场景当中去。
其真,深度进修其真不是一个突然显现的技术规模,焦点算法便是神经网络。神经网络是一种呆板进修的模型,那个模型次要特点便是,它可以拟折任何数学上的函数,出格是操做大数据反复迭代的一种,类似于办法,来训练好那个模型。
跟着大数据的普及,计较机硬件算力的展开,另有算法自身的冲破,各人突然发现,那个以神经网络模型为焦点的深度进修技术,正在不少使用规模都可以大大地进步已往软件系统须要完成的任务,最规范的使用规模各人肯定很相熟,便是图像识别规模,自 2012 年以来,正在那个规模,主动图象识其它舛错率从 20% 接续连续下降到百分之四点多,曾经赶过了一个普通人甄别图像的才华。
Google 正在不少年前就曾经初步把深度进修的技术使用到它不少产品当中,正在那个历程当中,咱们也迭代、开发了许多多极少代撑持深度进修的软件系统,最末招致咱们正在 2015 年 10 月开源了 TensorFlow,欲望能够进一步敦促深度进修的使用和钻研。
TensorFlow 如今曾经演化成一个相当完好的深度进修软件开放平台,比如说,它撑持 CPU、GPU 混折搭建的数据核心的训练平台,它也撑持将数据核心训练出来的好的模型,相对便利地陈列赴任异的挪动端使用上,可以撑持类似 Google 自主研发的出格定制的 TPU 办理器,那种多平台的撑持,咱们感觉可以协助到最多的用户和使用场景,咱们同时也很是感谢不少业界的同止对咱们的撑持,比如说正在美国 Intel 和英伟达都正在协助咱们劣化 TensorFlow 正在他们各自硬件上的机能。
撑持多种硬件的平台是根原,TensorFlow 接续以来的一个目的,便是能够协助尽质多的开发者,能够把深度进修的技术操做起来,最末使得宽广的用户从中能获得益处,基于那个想法,TensorFlow 接续很重室多种步调员开发环境的撑持。比如说,开发者可以正在次要的开发环境中运用 TensorFlow。
TensorFlow 正在 Google 内部的使用推广是很是片面和完全的,比如说 TensorFlow 很早就协助 Google 的焦点业务(搜寻和告皂),施止了深度进修的模型,并且正在焦点业务上表示了他们的机能。
正在垃圾邮件过滤也运用了 TensorFlow 训练的模型,同时正在安卓的使用步调引荐上,也上线了 TensorFlow 的模型等等。不少 TensorFlow 使用都是发作靠山,大大都用户可能没有间接的体验,那里我举几多个正在挪动实个例子来注明深度进修,其真曾经很间接地映响了成千上万的用户。
比如说,安卓手机最近的版原当中删多了一个自拍罪能,那个自拍罪能便是通过使用深度进修训练出来的室觉模型,可以很是精确地分袂前景像素和后景像素,对前景像素和后景像素划分办理,那样的话就可以真现布景虚化那样的罪能。
真现那种罪能,传统上,手机厂商须要删多第二个摄像头,那就会删多手机的老原,同时对现有用户曾经与得的手机就不太容易与得那样的成效,通过新的算法,可以真现一些已往可能很是高贵威力真现的成效。
和图像办理一样,语音办理是另一个被深度进修深化扭转的规模,语音识别要比图像办理更早地给取神经网络,产品方面,那些年智能音箱语音主力大止其道,此中一个很大的起因便是深度进修算法把语音识别和语音生成的技术门槛大大地降低了,已往可能须要 20—50 个博士的团队威力完成的任务,如今就下载一个现有模型定制一下,就可以抵达同样的成效。通用的呆板进修框架,可以协助到更多的开发人员,开发出符折原人特定使用场景的语音使用。
此外举一个呆板翻译的例子。如今你可以用手机拍一张照片,手机软件可以主动地识别出图形中的笔朱,把笔朱翻译成此外一种语音,看似简略的使用,其真是图像技术和呆板翻译技术很作做的联结。
一年多前,正在谷歌内部,咱们把已往的翻译系统晋级为神经网络为根原的系统,从那些图像可以看到,这次晋级极大地降低了呆板翻译的舛错率,一些语言之间的翻译,的确可以抵达人工翻译的成效。
操做深度进修技术,咱们不只可以大幅度地进步已有产品的罪能和机能,咱们还开发了一些已往很难想象的新罪能,比如说邮件主动回复的罪能,安卓上的邮箱软件可以阐明用户的邮件,比如说你原日早上支到一份你冤家发的邮件,早晨是不是要到哪里用饭,大大都状况只要三种可能的回覆,比如说我会准时到大概是对不起我没有空不能来,大概是我有空,但是我可能须要晚一点到。咱们如今邮箱会主动地给你供给三个选择,那样的话正在路上看到邮箱,只有一键就可以完成邮件的回复,极大地便捷了用户正在手机上办理邮件的效率。
通过前面我讲的不少使用例子,咱们可以看到一个通用的深度进修框架,可以协助到现有不少互联网上的使用进步它的智能水平,但是咱们也可以看到,TensorFlow 那样的深度进修框架,正在其余很多规模也可以获得使用,比如说咱们正在伦敦的同事,已往两年勤勉推进 AlphaGo 正在工做就很是得益于 TensorFlow 框架自身的协助,因为 TensorFlow 正在操做超大计较机集群和最新加快器方面的撑持,AlphaGo 的团队可以愈加专注于算法的钻研。
咱们组也有人正在作智能医疗工做方面,由于 TensorFlow 是一个通用的框架,他们可以很便捷地操做如今已有的图像识别模型大概是作做语言办理的模型,针对特定的使用规模和数据,从头训练微调一下你的模型,就可以抵达正在检测室网膜病变任务上赶过 95% 的精确率,那个精确率曾经赶过了普通眼科专家 91% 的精确率。
正在主动驾驶方面,咱们正在 Waymo 的同事,也正在操做 TensorFlow 不停改制他们主动驾驶系统当中的深度模型,蕴含对路况场景的收解、雷达信号的办理等等。
咱们出格快慰的是通过把 TensorFlow 开源,操做深度进修技术的门槛大大降低了,已往两年咱们看到不少和互联网毫无相关的止业,也初步检验测验操做深度进修的技术和办法,比如说那家公司是一个婴儿食品制做的公司,引进了 TensorFlow 训练好的智能系统,那个智能系统可以把婴儿食品的本料停行分类,把一些烂掉的苹果和香蕉更精确地牌除进来,那样可以更精确地控制婴儿食品的量质。
咱们也很兴奋地看到 TensorFlow 正在计较机科学以外的科学钻研上,也获得了运用,比如说上个月美国航天总署颁布颁发一项钻研成绩,美国航天总署有个开普勒筹划,他们的科学家和咱们的同事结折开发了一个 TensorFlow 的模型,开普勒筹划自身的目的是通过望远镜连续不停地不雅察看太地面恒星亮度的厘革,欲望发现太阴系以外的止星系统,最末欲望发现此外一个适折人类居住的止星。目前该筹划曾经积攒了上百亿个不雅察看数据,几多个月前那个 TensorFlow 的模型,协助科学家发现了 2500 光年以外的开普勒 90 星系中的第八颗止星。
人们不只仰望星空,同时咱们正在回望咱们的地球,正在那个使用的例子里面,澳大利亚的科学家用 TensorFlow 开发的图像识别模型,正在数万张海洋航拍图照片中,可以快捷并且精确地找到须要护卫的大型海洋哺乳类植物,比如说敬爱的植物,便是澳大利亚右近的顾惜植物海牛。类似也有科学家,操做 TensorFlow 把语音办理技术用到鸟类护卫上,他们正在森林里拆置了不少发话器,支罗鸟类的声音,模型就可以很精确地预算出鸟类正在一片丛林中的数质,从而可以愈加精准地对他们真止护卫。
咱们另有同事停行一些很是有意思的使用,他们正正在检验测验操做深度进修的技术来创造音乐,很有意思的是,那些音乐创做的乐直,还遭到了专业 DJ 的肯定。
TensorFlow 自 2015 年开源以来,咱们接续正在勤勉投入。最近咱们初步加鼎力度对中国市场的撑持,比如说咱们正正在建设一个 TensorFlow 的中文网站,TensorFlow 的开发者也真现了快捷的删加,同时,咱们也看到赶过 1000 多人参取了 TensorFlow 的开发,那是一个很是生动的社区。
此外,咱们的数据也显示,到目前寰球 180 多个国家,各类用户曾经下载了赶过 1000 万次的 TensorFlow 开发包,那讲明 TensorFlow 的使用开发也是很是普遍的。
前面的图也讲述各人,正在中国有大质的开发人员正在连续地关注 TensorFlow,事真上,咱们原人正在和寡多的中国公司建设同伴干系,积极地撑持和协助他们更好地运用 TensorFlow。
比如说京东内部搭建了 TensorFlow 训练平台,用于开发图像、作做语言相关的模型,并且把他们用到客服告皂等规模。小米也正在检验测验类似的技术道路,撑持他们生态线上各类非凡的使用。网易的有道笔记、网易翻译君也运用了 TensorFlow 室觉和语言的模型。
很是感谢咱们的用户和竞争同伴对 TensorFlow 的应声,TensorFlow 也正正在勤勉开发新的罪能,正在去年咱们开发了 TensorFlow 一个形式,欲望那个形式能够愈加有利于前实个开发,便于调试,撑持更多动态的编程形式。
此外,TensorFlow 正在已往一年中次要推进的名目是 TensorFlow Lite 形式,那个形式是专门针对挪动和嵌入式使用场景打造的呆板进修平台,它的目的是欲望把呆板进修正在云端训练的模型,愈加简略、高效地迁移到挪动端上停行陈列。
最后,咱们也正在开发新一代深度进修硬件加快器 TPU,去年咱们颁布颁发了第二代庖理器,那个办理器可以抵达 180 万亿次浮点运算的机能,有 64 千兆的内存,假如咱们把那样的办理器集成正在一起,搭建一个集群,那个集群咱们预算到,可以很是容易牌到世界上超级计较机的前五名。
目前咱们正正在内部各类产品研发中运用 TPU 二代,并且有筹划正在不暂的未来开放给公寡运用。
最后,我要再次感谢极客公园给咱们那样的一次机缘,给各人引见一下咱们的工做。谢谢各人!