我们分两个部分回答这个问题:1.什么是机器学习;2.机器学习有什么技术含量。
1.什么是机器学习?
我们从定义和应用两方面去了解
定义:机器学习的定义主要参考维基百科维基百科(中文)的定义:机器学习是人工智能的一个分支,实现人工智能的一个途径,即以机器学习为手段解决人工智能的问题。机器学习在近30年已发展为一门多学科领域交叉科学,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。从上述定义中我们总结出机器学习的特点:1.人工智能的分支,2.多学科交叉
应用:目前机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域。深度学习和强化学习为机器学习的热门分支。
而目前最火热的深度学习是机器学习的一个新领域,由Hinton等人于2006年提出,基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。
2.机器学习有什么技术含量:
从以上的描述中我们已经直觉的感到机器学习好像很复杂,技术含量挺高的,下面我们从专利数据中更客观的了解机器学习的技术含量。
专利:某个领域的专利的数量可以很客观的反应这个领域的技术含量是多少,专利越多,所包含的技术含量约高。
从图中可以看出,人工智能领域的专利仅次于半导体领域,远远高于硬件和软件行业
那么机器学习具体有什么技术含量呢?我们从三个部分去了解,它们是机器学习的三驾马车:算法,框架,硬件
算法:强化学习和深度学习是机器学习的两大热门分支
机器学习:相关算法包括逻辑回归、隐马尔科夫方法、支持向量机方法、K近邻法、三层人工神经网络方法、Adaboost 算法、贝叶斯方法以及决策树方法等。
强化学习:强化学习是智能体从环境到行为映射的学习,以使奖励最大化。 常见的算法包括Q-learning,贝尔曼方程,深度Q网络(DQN),深度确定性策略梯度。
深度学习: 典型的深度学习算法包括深度置信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络,生成式对抗网络等。其中卷积神经网络、循环神经网络是两类典型的模型。卷积神经网络常被应用于空间性分布数据;循环神经网络在神经网络中引入了记忆和反馈,常被应用于时间性分布数据。
框架:框架是进行机器学习的基础底层结构,一般包含主流的神经网络算法模型,提供稳定的机器学习API,支持训练模型在服务器和GPU、TPU间的分布式学习,部分框架还具备在包括移动设备、云平台在内的多种平台上运行的能力。目前主流的开源框架有TensorFlow、Caffe/Caffe2、CNTK、 MXNet、Paddle-paddle、Torch/PyTorch、Theano 等。
硬件:硬件是机器学习的基础,为机器学习提供强大高效的算力。传统的CPU芯片架构已无法满足机器学习等大规模并行计算的需求,取而代之的是GPU,TPU等可以用于性能加速的硬件、神经网络芯片、传感器与中间件,这些是支撑人工智能应用的前提。