现如今,Python 的踪影可以说是无处不在。简洁、开源、灵活是这款工具的最大特点。在计算机世界中,Python 的象征物是蟒蛇,而蟒蛇表征的恰恰是灵活性。这一切都使得 Python 特别适合于大数据,所以数据分析和挖掘的最佳工具非 Python 莫属了。但是 Python 并非擅长一切,比如 Java 更多用于工具开发,Matlab 则用于数值计算及矩阵运算。
目前在数据分析和挖掘算法方面用的最多的编程语言有:Java、C++、C、Python、R 等等。与其他相比,Python 具有以下优点:
Pythond vs. Java
Python更简洁,Java过于庞大复杂,语法很多
Python vs. C C++
Python更容易学习,语法简单易懂,但他们通常扮演不同的角色,Python是一种脚本语言,C和C++通常要和底层硬件打交道
Python vs. R
R 和 Python 一样,简单易上手,相比于 Java、C++、C,投入的时间精力相对少很多。在数据方面,R 和 Python 具有以下共同的优势:
Python 和 R 本身在数据分析和数据挖掘方面都有比较专业和全面的模块,很多常用的功能,比如矩阵运算、向量运算等都有比较高级的用法,所以使用起来产出比大。
这两门语言对于平台方面适用性比较广,Linux、Window都可以使用,并且代码可移植性还算不错。
对于学数理统计的人来说,应该大多用过 MATLAB 以及 mintab 等工具,Python 和 R 比较贴近这些常用的数学工具,使用起来有种亲切感。
但是相对于 R 语言,Python 的优势在于兼顾了效率和性能,而且 Python 的可扩展性很强,你可以用 Python 开发商业化的产品,但用 R 估计不可能,R 语言做研究还行。所以,Python 在机器学习领域的人用的较多。据我所知,做市场调研、计量经济学、统计学的人几乎没有用Python的。
以上。所以Python 目前是大数据时代最好的语言。