前言
使用 requests进行爬取、BeautifulSoup进行数据提取。
主要分成两步: 第一步是解析图书列表页,并解析出里面的图书详情页链接。 第二步是解析图书详情页,提取出感兴趣的内容,本例中根据不同的数据情况,采用了不同的提取方法,总的感觉就是BeautifulSoup用起来很方便
以下是几个典型HTML内容提取的Python代码片段
1、提取详情页链接
列表页中的详情页链接片段
提取详情页链接的Python代码
2、提取详情页中的图书名称
详情页中图书名称HTML代码
提取图书名称的Python代码
3、提取电子书价格信息
详情页中电子书价格HTML代码
提取电子书价格的Python代码
完整代码
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。