来源:新智元
本文约1500字,建议阅读5分钟。
本文带你了解ArXiv最火深度学习框架。
仅仅一年时间,PyTorch在学术圈中地位飙升,论文提及数量猛增194%,从第2018年第4位升至2019年第2位!而Keras则排名第三。Caffe不增反降,排名第四。不过在企业当中,Keras仍力压PyTorch。
一年不算短,但也不算长。一年时间,可以让Swift从11位跌倒13位,也可以让PyTorch从第4位飙升194%至第2位!
PyTorch狂涨194%,逼近TensorFlow份额
UC伯克利RISELab的在读博士Caroline Lemieux,分享了他们团队收集的深度学习框架和数据科学库使用情况的统计数据。O'Reilly Media的首席数据科学家Ben Lorica根据RISELab团队的数据,做了一张图:
图中可以看到,TOP 3框架在过去一年中均有增长。表现最为亮眼的PyTorch在过去的一年里增速高达194%,成功超越Keras和Caffe,直逼第一名TensorFlow。
当了多年老大的TensorFlow只有23%的增长,低于第三名Keras的26%。而第四名Caffe不增反降,跌了29%。
除了份额外,从上图中的增长曲线还可以看出,PyTorch从去年开始发力,在今年第一季度获得了一个非常陡的增长曲线,甚至几度超越TensorFlow。
不知道TF有没有感觉到背后的寒意。
Reddit网友的吐槽或许也能从一个层面,反映出为什么使用人数最多的TensorFlow反而不受待见、新晋黑马PyTorch却备受拥戴的个中缘由:
probablyuntrue:TensorFlow太让人抓狂了,PyTorch比TF好太多!bunny113:TF简直翔一样!我从GitHub上“偷”的1.0代码,在其他版本上都用不了,PyTorch比TF好太多!yusuf-bengio:TF的常量老变来变去的,烦死了!PyTorch比TF好太多!mexiKobe:老变就是因为从底层就有漏洞不得不重构啊。PyTorch比TF好太多!ML_me_a_sheep:TF背后绝对是一帮天才。他们并不是像你们说的那样胡搞瞎搞,TF很好的贴合了谷歌的需求,并不是我们这帮凡夫俗子能够完全理解的。所以,我用PyTorch。PyTorch比TF好太多!(这位sheep请你坐下!)rjurney:连个像样的tf.keras文档都没有。PyTorch比TF好太多!…不知道TF有没有再次感觉到背后的寒意。
不过整体来看,排名和去年相比变化不大。前四依然被TensorFlow、PyTorch、Keras和Caffe牢牢把持;MXNet超越了Theano上升了一位。
数据权威性和科学性
数据来源
据悉,RISELab团队使用的数据,是基于知名电子出版服务arXiv.org上所发布论文的简单全文搜索结果进行统计的。
也就是说,这个数据反映了每个框架在论文的全文中被提及的数量。搜索结果显示,最受论文作者们欢迎的深度学习框架是TensorFlow和PyTorch。
从2019年1月到6月底,大约1800篇论文提到了TensorFlow,而PyTorch被提及的数量和TensorFlow差距不大。
Lorica认为,在某种程度上,研究人员和高校教师所使用的工具都是非常前卫的,并且能够强烈影响未来专业人士的框架使用情况,PyTorch和TensorFlow将在未来成为企业的首选。
发布机构
该数据的发布机构RISELab,前身是大数据领域世界顶尖的实验室之一、UC伯克利大学的AMPLab。AMPLab曾推出过多项世界知名技术,比如Apache Spark、Apache Mesos和Alluxio。
AMPLab是加州大学伯克利分校一个为期五年的计算机研究计划,初衷是使用数据去训练更加丰富的模型,从而理解人和机器如何进行合作以解决数据中的问题,包括有效的数据清理、进行可衡量的数据扩展等。
AMPLab在2017年年底被关闭,接任者RISELab专注于提供SRDS,即安全实时的决策堆栈。RISELab团队的任务是将大数据分析推向一个更深度的次元,在这个次元中,传感器无所不在,AI是真实可触碰的、世界是可编程的。
RISELab是UC伯克利最新的五年期项目,有着强力的财政支持,将聚焦于提供安全执行的实时人工智能系统。
企业方面的调查结果却有点不一样
最近O'Reilly也发布了一份有关机器学习框架使用情况的调查,有超过1300名行业人士返回了有效结果。
这份调查面向的不是学术界,而是企业。结果显示,其中近半数受访者称在使用TensorFlow或scikit-learn,而使用PyTorch有29%,Keras略高达到34%。
Keras作者François Chollet认为,Keras的使用在产业界和整个数据科学圈中最占主流,产业既包括大公司也包括创业公司。不过,在研究社区,Keras的份额要小很多。这或许就是在企业中Keras的份额仍然高于PyTorch的原因之一。
在你争我抢,合纵连横之下,中国的开源框架,什么时候才能在这样的排名上拥有自己的姓名呢?
参考链接:
/
编辑:于腾凯
校对:林亦霖
— 完 —
关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。