glob模块说明:1、glob是python自己带的一个文件操作相关模块,用它可以查找符合自己目的的文件,就类似于Windows下的文件搜索,支持通配符操作*、?、[]这三个通配符,*代表0个或多个字符,?代表一个字符,[]匹配指定范围内的字符,如[0-9]匹配数字。glob.glob("字符串+通配符")该方法返回指定路径所有匹配的文件的列表,该方法需要一个参数用来指定匹配的路径字符串(本字符串可以为绝对路径也可以为相对路径),其返回的文件名只包括当前目
系统 2019-09-27 17:52:15 2122
拉勾网爬虫解析拉勾网网站:在拉勾网上输入关键词后我们可以得到相应的岗位信息(这里以Python为例),我们先获取到网站中所有的城市信息,再通过城市信息遍历爬取全国的Python职位信息。在数据包的Headers中我们可以得到网页头的相关信息,如网页URL、请求方法、Cookies信息、用户代理等相关信息。获取所有城市:classCrawlLaGou(object):def__init__(self):#使用session保存cookies信息self.la
系统 2019-09-27 17:52:08 2122
原文链接:https://blog.csdn.net/Anwel/article/details/79967261非常使用的方法:(亲测有效果)importpymysql#xlrd为python中读取excel的库,支持.xls和.xlsx文件#importxlrd#openpyxl库支持.xlsx文件的读写fromopenpyxl.reader.excelimportload_workbookfrombuiltinsimportint#cur是数据库的游
系统 2019-09-27 17:51:55 2122
全文共2955字,预计学习时长6分钟今天本文将介绍“Gridstudio”——一个基于网络的电子表格应用程序,集Python编程语言之大成。用Gridstudio着手解决的主要问题是散乱的工作流,这是进行数据科学项目,在例如Rstudio和Excel等多个工具间来回操作时所经历的。无数次导出CSV文件,行数过高导致应用程序窗口冻结,或是想要直截了当地做一些事(比如阅读一个JSON文件)……很多人都受够这些了。现存的工具无法提供高效产出的环境和相关的工作流。
系统 2019-09-27 17:51:04 2122
我们开始来谈谈python的爬虫。1,什么是爬虫:网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。互联网犹如一个大蜘蛛网,我们的爬虫就犹如一个蜘蛛,当在互联网遇到所需要的资源,我们就会爬取下来,即为爬虫是一个请求网站并且提取数据的自动化程序。2,下面我们来提到两个名词:1)请求,request即为我们的请求,当我们在浏览器内输入网址,敲击回车时,这时浏览器就会发送消息给该网址所在
系统 2019-09-27 17:50:56 2122
原文链接:https://blog.csdn.net/m0_37586991/article/details/81629421近期在写dataloader函数时,由于错用了extend和append,导致后面出现了bug。后面发现问题后,便将该问题记录下来防止重复出错。两个函数从功能上来看非常类似,但处理后的结果却完全不同,使用时需要特别注意。尤其是对多个的list进行合并时,append可以保持list的原始形式,extend则进行了拆分重组,将待添加的
系统 2019-09-27 17:50:26 2122
惭愧啊,今天写了个查找子串的Python程序被BS了…如果让你写一个程序检查字符串s2中是不是包含有s1。也许你会很直观的写下下面的代码:复制代码代码如下:#determinewhethers1isasubstringofs2defisSubstring1(s1,s2):tag=Falselen1=len(s1)len2=len(s2)foriinrange(0,len2):ifs2[i]==s1[0]:forjinrange(0,len1):ifs2[i
系统 2019-09-27 17:50:23 2122
一、线程与进程的介绍参考之前写的VC++的多线程与互斥对象:https://blog.csdn.net/Gordennizaicunzai/article/details/52268343二、python全局解析器锁(GIL)。python代码相对于其它语言在多线程效率上有个“先天性缺陷”——python有个虚拟机(又名解析器主循环)对代码进行执行控制,在解析器主循环中单位时间内只能有一个控制线在执行。意思是任意时刻只能有一个程序在运行,即使内存中有多个程
系统 2019-09-27 17:48:22 2122
题目描述给定n个字符串,请对n个字符串按照字典序排列。输入描述:输入第一行为一个正整数n(1≤n≤1000),下面n行为n个字符串(字符串长度≤100),字符串中只含有大小写字母。输出描述:数据输出n行,输出结果为按照字典序排列的字符串。示例1输入9captocatcardtwotooupboatboot输出boatbootcapcardcattotootwouppython3代码实现为:n=int(input())word=[]foriinrange(n
系统 2019-09-27 17:48:16 2122
如何把[1,5,6,[2,7,[3,[4,5,6]]]]变成[1,5,6,2,7,3,4,5,6]?思考:--for循环每次都遍历列表一层--把取出的单个值加入到新的列表中--把取出来的嵌套列表变成新的遍历列表,就需要在for循环外嵌套一个while循环--当取到最里面的列表嵌套时候,对最后一个值进行处理#!/usr/bin/python3__author__='beimenchuixue'__blog__='http://www.cnblogs.com/
系统 2019-09-27 17:48:10 2122