当前位置：Web开发网 » 编程语言 » Python语言 » 正文

Hadoop支持用python开发吗？还有哪些支持python的分布式计算系统框架？

2021年11月27日9610Web开发网百度已收录

hadoop支持python，我理解的是任务被yarn下发到工作节点，通过shell方式被调用。这种方式比原生的MR还慢，所以没大有人用吧。

spark应该是对python比较友好的框架了。要说缺点，毕竟是scala或java风格的api，用起来不够python。再就是用过pandas和numpy，感觉spark的api还是比较基础。

除此之外，python推荐你了解一下dask，celery这两个框架。dask是基于numpy，pandas封装的，兼容大部分np，pd的接口。且支持分布式，有可视化界面。整体来说是不错的选择。

celery是一个分布式任务调度框架，本身设计并不是专门为了etl，所以性能会比dask差一些。但个人感觉作为生产系统使用，celery稳定性更高一些。

上一篇: Python能否进行大规模数值计算？

下一篇: Python和云计算学哪个比较好呢？

Python分布式计算

文章来源：Web开发网，欢迎分享，转载请保留出处
原文地址：https://kaifa5.com/15612.html

阅读延展

分布式计算的特点是什么？

想自学大数据，不知道从哪里学起，有什么书籍和学习路线推荐么？

「大数据」Hadoop生态系统：分布式计算系统

Python在日常工作中能用到吗？

一台windows电脑可以实现分布式爬虫（python编写）吗？

IT行业招聘需求放缓 “云计算”元年到来(转载)

评论列表暂无评论

发表评论取消回复: 好顶踩