书香华南师范大学

Python3网络爬虫宝典

  • 作者: 韦世东著
  • 出版社:电子工业出版社
  • 出版日期:2020年01月
  • 阅读:
  • 收藏:
  • 推荐:

评价:
1 2 3 4 5
3
0
0
0
0
0

扫码下载微书房APP,手机阅读

评价:
1 2 3 4 5
0 未评价
标签:

内容简介

本书从实际的爬虫业务需求延伸到知识点和具体实现,并详细介绍了其中的原理。首先带领读者领略爬虫程序的构成和完整链条,学习自动化工具的应用场景和基本使用;接着介绍了增量爬取的分类和具体实现、基于Redis的分布式爬虫实现和基于RabbitMQ的分布式爬虫实现,通过阅读论文和源码剖析详细介绍了高准确率的网页正文自动化提取方法;然后通过源码调试了解到与Python项目的部署和调度相关的知识,进而动手实践,编写了一款具备权限控制、Python通用项目部署、定时调度、异常监控和钉钉机器人消息通知的爬虫项目管理平台;最后通过解读分布式调度平台的核心架构,帮助大家了解分布式架构中最为重要的节点通信、文件同步等知识。

读此书的朋友们也读...

书评

  • 所有书评
  • 我的书评
  • 书友的书评
按好评数排序
必填,最多可输入1000字。发言请遵守相关法律法规。 针对本书第 页发表评论