机器学习和数据挖掘的工具有很多,首先需要确定自己选用的编程语言,比如说Python是一种通用语言,具有高质量的机器学习和数据分析库,非常适合快速原型设计;C++是用于CUDA并行计算的中级语言,可以开发在实时约束下直接与硬件交互的驱动程序和软件,应用很广泛;还有R语言,适合统计计算和图形,是统计,可视化和数据分析的语言和环境,可以实现快速数据分析和可视化等等。
用于数据分析和可视化工具的有pandas,用于增强分析和建模的Python数据分析库;matplotlib,用于高质量可视化的Python机器学习库;jupyter notebook,用于交互式计算的免费Web应用程序,可实时创建代码和共享文档,开发和执行代码;还有Tableau,用于数据科学和商业智能的数据可视化工具。
还有一些机器学习库,比如Numpy,使用Python进行科学计算的扩展包;scikit-learn,一个开源的Python机器学习库,集成了很多机器学习算法等等。
一些机器学习/深度学习框架工具,包括Tensorflow、Caffe、Pytorch、Keras、CNTK、MXNET、Theano在内的十几种深度学习框架,最常用的、用的最多的是Tensorflow和Caffe。