最近几年人工智能概念的火热很大程度上是因为随着计算能力的发展(此处可cue英伟达)深度学习算法在应用落地方面大放异彩(主要是图像和语音的识别和分类上)。
在2012年的ImageNet图像大赛上,多伦多大学的Geoffrey Hinton教授(现在的深度学习三巨头之一)就带领着团队使用深度学习进行机器训练与图像识别,错误率只有15.3%,成为图像识别学科历史上的一个重要节点。
2015年的ImageNet图像大赛上,微软亚洲研究院团队的系统错误率低至3.57%,第一次超越了人类。
2016年,人工智迎来了自学科建立60年以来最大规模的市场应用爆发潮。承借着深度学习在计算机视觉领域的首先爆发,云计算平台、显卡、芯片等的研发成为行业热点,而数字医疗、智能家居、自动驾驶、语音助手等应用也获得了极大的突破。
扯远了,在回答这个问题前,首先要把几个概念搞清楚,“人工智能(AI)”、“机器学习”、“深度学习”、“卷积神经网络”。
以下概念范围从大到小:
人工智能(Artificial Intelligence)是一个非常大的范畴,包括感知智能、认知智能、运动智能等等,又可以分成强人工智能和弱人工智能,攻壳、机器姬之类的属于前者。
机器学习(Machine Learning)是人工智能的一种方法,也是现在比较受欢迎的一种主流思想,可以顾名思义地理解成让机器学会学习。
深度学习(Deep Learning)是机器学习的一种,也是现在非常火热的一个研究方向。深度学习中的“深度”,最简单理解就是“有很多层”。
“深度学习的深度,指的是超过一层的非线性特征转换。(It’s deep if it has more than one stage of non-linear feature transformation)”——Yann LeCun(“卷积神经网络之父”、现任Facebook人工智能研究院的院长、美国纽约大学教授、深度学习三巨头之一)卷积神经网络(Convolutional Neural Network,CNN)则是深度学习的一种方法,安排深度学习的深层架构可以通过直接堆叠,也可以通过卷积神经网络。
所以我们回到问题上,“想做一个人工智能的东西”这个表达比较含糊,如果你说想造一个素子小姐那短期内还是不太可能的……如果你说想利用深度学习、机器学习来打造一款AI应用,比如图像分类、视频处理、人脸识别之类的,还是可行的。
上文提到的Yann LeCun大神就曾经回答过这个问题:
首先,你需要尽一切可能把所有具有连续性的数学和物理课程都上一遍。微积分(I)、 微积分(II), 微积分(III)、线性代数、概率论、统计学这几项是必不可少的,另外你还需要尽可能多的去听物理学的课程,贝叶斯推理、反向传播算法、傅立叶变换等等未来都会用到。
如果必须要在“iOS编程”和“量子力学”之间选一门,一定要选量子力学。不过与此同时,你还是要确保学习编程……
看到这里还没有点小叉叉的同学,给你一朵小红花。
全部学完之后,[划掉]导师就会来邀请你申奖学金了[/划掉],接着选一个你感兴趣的AI问题。然后独立对这个问题进行思考。(比如我想做一个人脸识别的软件,我应该用什么方法采集数据,如何分类人脸特征,如何识别等等)
一旦你形成了自己的想法,就开始读书、读论文。网上也有很多关于机器学习、深度学习的材料、教程和视频课程,但是建议你先思考-再读书-最后看教程。
小智插话:对于中国学生而言,你还需要确保自己的英语水平常年保持在6级以上。毕竟所有大牛的论文都是英文的……
读完之后你将会发现,(1)你之前的想法有点幼稚,但是(2)你对这个问题的看法开始有点不一样了。
接着,如果你是个本科生,你就可以去勾搭教授了,清华、中科院、北航等都是业内不错的院校,英语好的可以去勾搭国外教授。但是鉴于你现在也没有发表什么作品,教授勾搭不到的话,转而勾搭博士/博士后也是可以的。
对于已经工作了的人来说,有几个线上文献/课程可以参考。
2015年5月《自然》杂志上刊登的一篇概述性论文《深度学习》(Deep learning),由深度学习三巨头(Yann LeCun、Yoshua Bengio 、Geoff Hinton)共同撰写。
地址戳:
系统性的课本方面,Yann LeCun推荐由Goodfellow、Bengio 和 Courville共同撰写的《深度学习》(Deep learning)
地址戳:
此外,Facebook、英伟达等也都设立了AI相关的线上/线下课程教程、还有Caffe、Torch、TensorFlow、Theano等这几大开源平台的使用手册、最近国内外各类的AI大会也都层出不穷……想学东西的方法很多,这只是其中一条路而已。