基于python编程语言的推荐算法, 适合于图博档数字资源整合平台的运用, 帮助用户高效准确地查找所需信息。我们在开发图书借阅推荐系统时, 利用当今最流行的python具体实现了“基于用户的协同过滤算法”和“基于物品的协同过滤算法”, 这些代码详细可读性强, 对于实际工作者具有较好的参考价值。利用Python提供的丰富的网络处理和文本分析标准库, 解决图书馆日常工作中需要定期总结、汇报业务数据的问题, 提高了业务工作的效率。用Python编写的网络爬虫可以使用多线程技术提高程序运行效率,通过加锁来保证所获取数据的正确性,使用数据库存储爬取的大规模数据。爬虫程序的主要应用是实现信息的聚合,为用户提供更多可选择的信息。本设计中的爬虫程序主要为用户提供多个网站的图书信息,最终以网页的形式呈现给使用者。首先从数据库读取网页地址以及相应的规则,爬虫程序结合网页规则提取数据,把数据存入到已连接的数据库中,再把这些数据写入到HTML文本中,这样便完成了整个信息的聚合过程。