python简单爬虫 - 军军小站|张军博客

          import re
          

          from urllib.request import urlopen
          

          

          def getPage(url):
          

              response = urlopen(url)
          

              return response.read().decode('utf-8')
          

          

          def parsePage(s):
          

              ret = re.findall(
          

                  '
          
            .*?
            
              .*?
              
                (?P
                
                  \d+).*?
                  
                    (?P
                  
                  '
                  

                         '.*?
                  
                    (?P
                    
                      .*?)
                    
                  
                  .*?
                  
                    (?P
                    
                      .*?)评价
                    
                  
                  ',s,re.S)
                  

                      return ret
                  

                  

                  def main(num):
                  

                      url = 'https://movie.douban.com/top250?start=%s&filter=' % num
                  

                      response_html = getPage(url)
                  

                      ret = parsePage(response_html)
                  

                      print(ret)
                  

                  

                  count = 0
                  

                  for i in range(10):   # 10页
                  

                      main(count)
                  

                      count += 25
                  

                  

                  # url从网页上把代码搞下来
                  

                  # bytes decode ——> utf-8 网页内容就是我的待匹配字符串
                  

                  # ret = re.findall(正则，带匹配的字符串)  #ret是所有匹配到的内容组成的列表

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索：z360901061

微信扫一扫加我为好友

QQ号联系： 360901061

您的支持是博主写作最大的动力，如果您喜欢我的文章，感觉我的文章对您有帮助，请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧，狠狠点击下面给点支持吧，站长非常感激您！手机微信长按不能支付解决办法：请将微信支付二维码保存到相册，切换到微信，然后点击微信右上角扫一扫功能，选择支付二维码完成支付。

【本文对您有帮助就好】元

2元

5元

10元

20元

自定义