python爬虫 编码问题

系统 1343 0

一、往文件中写入数据

往TXT文件写入的时候报错  'gbk' codec can't encode character '\xXX' in position XX

打开文件时,增加一个选项:

            
              def wirteFile(content):
    path = os.getcwd()
    a_path = os.path.join(path, "content.txt")
    f = open(a_path, "w+", encoding="utf-8")
    f.write(content)
    f.close()
            
          

open()中添加编码类型

 

二、lxml etree 显示爬取的内容时,中文乱码

            
              session = requests.Session()                                                             
res = session.get('https://seat.lib.whu.edu.cn/login?targetUri=%2F', headers = headers)  
html = etree.HTML(res.text)  # 转换成element对象,构建成xpath解析对象                                 
result = etree.tostring(html, encoding='utf-8')  # bytes类型 这里需要增加编码方式                               
print(result.decode("UTF-8"))                                                            
            
          

 


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论