写了个阿里巴巴招聘网站爬虫,这次是存在csv文件里,小伙伴们可以对比一下~importrequests,json,csv#写入csv文件中list=[]csv_file=open('阿里巴巴招聘.csv','w+',newline='',encoding='utf=8')writer=csv.writer(csv_file)list_head=['职位名称','部门','是否招聘','学历','大类','小类','工作地','工作经历','要求','职责'
系统 2019-09-27 17:49:31 1927
1、模板的使用Flask使用的是Jinja2模板,所以其语法和Django无太大差别Flask中模板里面,执行函数时,需要带()才执行1.为了防止xss攻击,加了验证,所以页面上显示字符串的形式,解决办法,有两种方法方法一:在后端使用Markup,等价于Django里的mark_safev=Markup("")方法二:在前端使用safe{{v1|safe}}2.静态文件的两种导入方式目录结构:在这里插入图片描述方式一:在这里插入图片描述方式二:在这里插入图
系统 2019-09-27 17:49:29 1927
1、类变量、实例变量概念类变量:类变量就是定义在类中,但是在函数体之外的变量。通常不使用self.变量名赋值的变量。类变量通常不作为类的实例变量的,类变量对于所有实例化的对象中是公用的。实例变量:实例变量是定义在方法中的变量,使用self绑定到实例上的变量,只是对当前实例起作用。2、访问类变量在类的内部和外部类变量都可以直接使用className.类变量的形式访问。但是在类的内部,也可以使用self.类变量来访问,但是这个是用含义就不同了(后面使用代码验证
系统 2019-09-27 17:49:16 1927
文件常见的读写模式w以写方式打开,W文件若存在,首先要清空,然后(重新)创建a以追加模式打开(从EOF开始,必要时创建新文件)r+以读写模式打开w+以读写模式打开(参见w)a+以读写模式打开(参见a)rb以二进制读模式打开wb以二进制写模式打开(参见w)ab以二进制追加模式打开(参见a)rb+以二进制读写模式打开(参见r+)wb+以二进制读写模式打开(参见w+)ab+以二进制读写模式打开(参见a+)读取文件内容open读取所有内容使用open打开文件后一定
系统 2019-09-27 17:49:09 1927
前段时间为准备百度面试恶补的东西,虽然最后还是被刷了,还是把那几天的“战利品”放点上来,算法一直是自己比较薄弱的地方,以后还要更加努力啊。下面用Python实现了几个常用的排序,如快速排序,选择排序,以及二路并归排序等等。复制代码代码如下:#encoding=utf-8importrandomfromcopyimportcopydefdirectInsertSort(seq):"""直接插入排序"""size=len(seq)foriinrange(1,s
系统 2019-09-27 17:48:21 1927
不喜欢Python的人经常会吐嘈Python运行太慢。但是,事实并非如此。尝试以下六个窍门,来为你的Python应用提速。窍门一:关键代码使用外部功能包Python简化了许多编程任务,但是对于一些时间敏感的任务,它的表现经常不尽人意。使用C/C++或机器语言的外部功能包处理时间敏感任务,可以有效提高应用的运行效率。这些功能包往往依附于特定的平台,因此你要根据自己所用的平台选择合适的功能包。简而言之,这个窍门要你牺牲应用的可移植性以换取只有通过对底层主机的直
系统 2019-09-27 17:46:49 1927
使用Pycharm来实现Spark-SQL。frompysparkimportRowfrompyspark.sqlimportSparkSessionfrompyspark.sql.typesimportStructField,StringType,StructTypeif__name__=="__main__":spark=SparkSession\.builder\.appName("appname")\.master("local")\.getOrC
系统 2019-09-27 17:46:34 1927
近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录1.在正常情况下..可以用importchardetthischarset=chardet.detect(strs)["encoding"]来获取该文件或页面的编码方式或直接抓取页面的charset=xxxx来获取2.遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理.st
系统 2019-09-27 17:38:01 1927
下面是struts2标签的常用的用法一定要注意:url中includeParams的属性的默认值是get,如果没有在struts.xml指定新的值,那么使用url标签引用的所有的静态文件都会带上通过get方法传递的参数值。另外:includeParams的属性值还有none、allall,是把get和post
系统 2019-08-29 23:50:44 1927
一般软件的注册机制可以通过获取硬件序列号,然后用非对称加密算法生成相应的公钥和私钥。但是用ManagedCode写获取硬盘序列号的代码不能解决所有的问题,比如不能在非管理员的权限下使用,前几天Sunmast在他的Blog上发布了《如何得到硬盘序列号?.NET版本[C#]》,就是没有解决这个问题,用WMI也有很多问题。要想顺利获取硬盘的序列号,目前只能依靠非托管代码了。DiskId32是一个源码公开的C++程序,可以解决上述问题。由于代码比较底层,我对VC和
系统 2019-08-29 23:10:32 1927