python实现爬虫 - 军军小站|张军博客

解决print（）中文的乱码问题！！！

              # -*-coding:utf-8 -*-
import io
import sys
#改变标准输出的默认编码(改变中文输出的乱码问题)
sys.stdout=io.TextIOWrapper(sys.stdout.buffer,encoding='utf8')

　　selenium+chrome 浏览器进行爬虫
下载chrome的浏览器驱动（http://chromedriver.storage.googleapis.com/index.html）下载响应chrome浏览器版本（浏览器的版本在chrome://version/这个网页可以看到）的即可（win32 就行）安装到C:\Program Files (x86)\Google\Chrome\Application 下面（exe文件）

                  
                    #导入selenium的浏览器驱动接口

                  
                  
                    from
                  
                  
                     selenium import webdriver

                  
                  
                    from
                  
                  
                     time import sleep
#驱动路径 记得前面加r 防止字符转义
#
                  
                  !!!
                  
                    注意这里必须把驱动程序中的路径写完整，后面必须加上这个chromedriver.exe  否则会报错 执行不成功
driver 
                  
                  = webdriver.Chrome(
                  
                    "
                  
                  
                    C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe
                  
                  
                    "
                  
                  
                    )
#用driver打开百度页面  后面的地址是百度的地址
driver.
                  
                  
                    get
                  
                  (
                  
                    '
                  
                  
                    http://www.baidu.com
                  
                  
                    '
                  
                  
                    )
# 查找页面的“设置”选项，发送一个你要搜索的值，并进行点击
# 获取页面名为wrapper的id标签的文本内容
data 
                  
                  = driver.find_element_by_id(
                  
                    "
                  
                  
                    wrapper
                  
                  
                    "
                  
                  
                    ).text
print(data.encode(
                  
                  
                    '
                  
                  
                    GB18030
                  
                  
                    '
                  
                  
                    ))
# 打印页面标题 
                  
                  
                    "
                  
                  
                    百度一下，你就知道
                  
                  
                    "
                  
                  
                    
print(driver.title)
# 生成当前页面快照并保存
driver.save_screenshot(
                  
                  
                    "
                  
                  
                    baidu.png
                  
                  
                    "
                  
                  
                    )
driver.find_element_by_id(
                  
                  
                    '
                  
                  
                    kw
                  
                  
                    '
                  
                  ).send_keys(
                  
                    '
                  
                  
                    人民币
                  
                  
                    '
                  
                  
                    )
sleep(
                  
                  
                    2
                  
                  
                    )
#并进行点击
driver.find_element_by_id(
                  
                  
                    '
                  
                  
                    su
                  
                  
                    '
                  
                  
                    ).click()
sleep(
                  
                  
                    4
                  
                  
                    )
#退出驱动程序
driver.quit()

（参考：https://blog.csdn.net/u010986776/article/details/79266448）

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索：z360901061

微信扫一扫加我为好友

QQ号联系： 360901061

您的支持是博主写作最大的动力，如果您喜欢我的文章，感觉我的文章对您有帮助，请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧，狠狠点击下面给点支持吧，站长非常感激您！手机微信长按不能支付解决办法：请将微信支付二维码保存到相册，切换到微信，然后点击微信右上角扫一扫功能，选择支付二维码完成支付。

【本文对您有帮助就好】元

2元

5元

10元

20元

自定义