正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。re模块使Python语言拥有全部的正则表达式功能。compile函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。本章节主要介绍Python中常用
系统 2019-09-27 17:54:25 2161
(一)方法方法简单说明add_cookie(cookie_dict)在当前会话中添加cookie信息cookie_dict:字典,name和value是必须的delete_all_cookies()在当前会话中删除所有cookie信息delete_cookie(name)删除单个名为name的cookie信息get_cookie(name)返回单个名为name的cookie信息,如果没有找到,返回noneget_cookies()返回当前会话所有的cook
系统 2019-09-27 17:54:00 2161
爬虫爬取网页信息的思路:发送网页端请求—>获取响应内容—>解析内容—>获取想要的数据—>保存数据这次我们要实现的是爬取静态网页的股票数据,首先是获取沪深A股的所有股票代码,再用这些股票代码获取相应股票的信息东方财富网有所有个股的股票代码(沪深A股所有股票)查看其网页源代码在网页源代码中可以搜索到相应的元素,判断其是数据是静态的接下来是获取每只个股的信息,由于周六日没开市,东方财富网的个股信息没有显示这里改用百度股市通(个股)同样地检查元素可以发现个股的信息
系统 2019-09-27 17:52:55 2161
在Python中,读写文件有3个步骤:1.调用open()函数,返回一个File对象。2.调用File对象的read()或write()方法。3.调用File对象的close()方法,关闭该文件。新建一个sj.txt文档,内容为hello.输入代码:helloFile=open('F:\\sj.txt')调用open将返回一个File对象。File对象代表计算机中的一个文件,它只是Python中另一种类型的值。有了File对象,就可以开始从它读取内容。希望
系统 2019-09-27 17:49:15 2161
python中判断一个对象是否为函数两种方式:使用hasattr,通过验证有没有__call__函数进行判断deftest():print"hello"printhasattr(test,"__call__")通过使用callable进行判断printcallable(test)另外:查看内置函数都有哪些可以使用如下方式printglobals()["__builtins__"].__dict__输出:{‘ArithmeticError’:Arithmet
系统 2019-09-27 17:48:41 2161
使用介绍如何添加断点?说到debug,肯定是要添加断点的,这里有两种方式添加断点:在想要断点代码后添加一行pdb.set_trace()若是使用这种方式,直接运行Python文件即可进入断点调试。用命令行来添加断点bline_number若是使用这种方式,需要python-mpdbxxx.py来启动断点调试。常用命令先简单介绍一下使用命令,这里不用记住,等用到的时候回来查就行。1进入命令行Debug模式,python-mpdbxxx.py2h:(help)
系统 2019-09-27 17:48:35 2161
Selenium是一个可以让浏览器自动化地执行一系列任务的工具,常用于自动化测试。不过,也可以用来给网页截图。目前,它支持Java、C#、Ruby以及Python四种客户端语言。如果你使用Python,则只需要在命令行里输入“sudoeasy_installselenium”并回车,即可安装selenium的Python版本的客户端支持。以Python为例,我们可以使用下面的脚本来给指定页面(比如脚本之家首页)截图:#-*-coding:utf-8-*-#
系统 2019-09-27 17:47:20 2161
最近在学习机器学习的过程中,常常需要将本地写的代码传到GPU服务器中,然后在服务器上运行。之前的做法一直是先在本地写好代码,然后通过FileZilla这样的文件传输工具来将写好的文件传到服务器,再通过ssh工具远程连接到服务器,执行相应的python脚本。这样的方式十分繁琐,效率很低。今天听到朋友提到了配置远程解释器使用场景先说说自己的使用场景,我是在什么情况下,需要将IDE配置成这样的环境来方便我的工作。首先,我需要在本地机子上写python代码,但是因
系统 2019-09-27 17:46:10 2161
今天是2019.9.11号22:51分这是我自学Python的第二天,也是我写博客的第二天,还是不知道怎样写博客的第二天,有点懵今天学Python还是一样的懵,错误还是有很多,而且脑中也不够灵活,逻辑能力还是有待提高,还得继续加油,为了以后能成为一名IT大佬,我得坚持再坚持,努力再努力,加油吧!骚年!!!!!结果是由过程决定的,相信我努力的过程会有回报的.我能行的,我相信自己下面是我的知识总结和错误总结======我======是======一======
系统 2019-09-27 17:46:05 2161
hashlib模块主要提供字符加密算法功能,如md5、sha1、sha224、sha512、sha384等,这里的加密算法称为摘要算法。什么是摘要算法?它又称为哈希算法、散列算法,它通过一个函数把任意长度的数据转换为一个长度固定的数据串(通常以16进制符表示)摘要算法的作用主要在于密码的密文存储,以及文件的一致性验证(比如在下载的时候,检查我们下载的文件和远程服务器上的文件是否一致;两台机器上的两个文件,检查上面的文件是否相等)使用md5算法:import
系统 2019-09-27 17:45:57 2161