上面的博客把基本的HTML解析库已经说完了,这次我们来给予几个实战的项目。
这次主要用Requests库+正则表达式来解析HTML。
项目一:爬取猫眼电影TOP100信息
代码地址:https://gitee.com/dwyui/maoyan-Requests.git
项目二:美食爬取(包含多层爬取)
代码地址:https://gitee.com/dwyui/meishi_Requests.git
上面的博客把基本的HTML解析库已经说完了,这次我们来给予几个实战的项目。
这次主要用Requests库+正则表达式来解析HTML。
项目一:爬取猫眼电影TOP100信息
代码地址:https://gitee.com/dwyui/maoyan-Requests.git
项目二:美食爬取(包含多层爬取)
代码地址:https://gitee.com/dwyui/meishi_Requests.git