标准定义:对于一个任务及其表现过程的度量方法,给出特定的算法,能够通过利用经验数据不断提高在该任务上的表现过程的方法,就称为机器学习。
简单定义:
举一个简单的例子:出租车司机开车送你从上海到北京,这里“任务”就是是上海到北京,“表现过程”就是上海到北京不同的路,“经验数据”就是每条能走的路。然后设计出一个算法,构建出的“上海出发往哪条路上开——模型”能通过利用经验数据得出结果到北京速度效果的提高。
为了实现每次利用经验数据对表现过程的提升,当前最主流的方法就是“误差反向传播法”。这种方法的核心思想就是:让机器自由去试错,然后根据尝试的结果与样本的真实结果之间的误差反向调整试错策略。误差较小的尝试要奖励,误差较大的尝试给予惩罚,然后将这个尝试过程一直循环进行下去,直到多学习到的结果在所有样本上的表现达到我们所定义的最优。
有了“误差反向传播”算法,机器探索从上海到北京的路会越来越多,同时找到最优的路会越来越快,这和老司机在开过很多回这条路后获得最优的选择本质没有区别。
而这里人和机器的差距也会体现出来,当数上海到北京路非常多的时候,人就没办法像机器那样一直进行探路,而对机器的数据处理能力来说,这个数据量可能几分钟就能得出最优选择,
当然人能另辟蹊径,新手可以向老司机一路打听,而不用自己一路重复摸索。