Python - 军军小站|张军博客
Python

Python信息抽取之乱码解决办法

Python信息抽取之乱码解决办法就事论事,直说自己遇到的情况,和我不一样的路过吧,一样的就看看吧信息抓取,用python,beautifulSoup,lxml,re,urllib2,urllib2去获取想要抽取的页面内容,然后使用lxml或者beautifulSoup进行解析,插入mysql具体的内容,好了貌似很简单很easy的样子,可是里面的恶心之处就来了,第一,国内开发网站的人在指定网站编码或者是保存网站源码的时候并没有考虑什么编码,反正一句话,一个

系统 2019-09-27 17:54:45 1950

Python

在Python中过滤Windows文件名中的非法字符方法

网上有三种写法:第一种(所有非法字符都不转义):defsetFileTitle(self,title):fileName=re.sub('[\/:*?"<>|]','-',title)#去掉非法字符self.file=open(fileName+".txt","w+")\非法字符必须转义,否则\/被解释为/第二种(所有非法字符都转义):defvalidateTitle(title):rstr=r"[\/\\\:\*\?\"\<\>\|]"#'/\:*?"<

系统 2019-09-27 17:54:39 1950

Python

python音频处理相关库

音频处理库—librosa官网:http://librosa.github.io/librosa/index.html一个免费、跨平台、开源的音频I/O库——PortAudio官网:http://www.portaudio.com/一个c++写的语音、音乐分析,合成,处理开源库——essentia官网:https://github.com/MTG/essentia

系统 2019-09-27 17:53:48 1950

Python

python爬虫学习教程,爬取网易云音乐!

运行环境我的运行环境如下:系统版本Windows10。Python版本Python3.5,推荐使用Anaconda这个科学计算版本,主要是因为它自带一个包管理工具,可以解决有些包安装错误的问题。去Anaconda官网,选择Python3.5版本,然后下载安装。IDE我使用的是PyCharm,是专门为Python开发的IDE。这是JetBrians的产品实战上面提到过,网易云音乐的网页跟普通的网页相比主要有两点不同:网页是js动态加载的使用了iframe框架

系统 2019-09-27 17:52:52 1950

Python

Python网络爬虫——http和https协议

一.HTTP协议1.官方概念:HTTP协议是HyperTextTransferProtocol(超文本传输协议)的缩写,是用于从万维网(WWW:WorldWideWeb)服务器传输超文本到本地浏览器的传送协议。(虽然童鞋们将这条概念都看烂了,但是也没办法,毕竟这就是HTTP的权威官方的概念解释,要想彻底理解,请客观目移下侧......)2.白话概念:HTTP协议就是服务器(Server)和客户端(Client)之间进行数据交互(相互传输数据)的一种形式。我

系统 2019-09-27 17:52:22 1950

Python

python全栈开发基础知识学习——Django框架(二)

Django框架(二)请求和响应对象HttpRequest对象HttpResponse对象本博文主要了解的是MTV模型中的View(视图),主要负责业务逻辑,并在适当的时候调用Model和Template。请求和响应对象Django使用请求和响应对象来通过系统传递状态。当请求页面时,Django创建一个HttpRequest包含有关请求的元数据的对象。然后Django加载适当的视图,将HttpRequest第一个参数传递给view函数。每个视图都负责返回一

系统 2019-09-27 17:49:51 1950

Python

程序员的七夕用30行代码让Python化身表白神器

转眼又到了咱们中国传统的情人节七夕了,今天笔者就带大家来领略一下用Python表白的方式。让程序员的恋人们感受一下IT人的浪漫。一、词云制作首先咱们可以用之前介绍过的wordcould包制作词云。wordcloud包安装十分简单。pip即可完成安装pipinstallwordclould然后需要制作一个背景图片,为了应急我用艺术字做了个七夕的图片,如果大家来不及直接图片另存为使用下图即可。具体制作的词云的代码如下:fromwordcloudimportWo

系统 2019-09-27 17:49:28 1950

Python

Python直接赋值、浅拷贝与深度拷贝实例分析

本文实例讲述了Python直接赋值、浅拷贝与深度拷贝。分享给大家供大家参考,具体如下:直接赋值:其实就是对象的引用(别名)。浅拷贝(copy):拷贝父对象,不会拷贝对象的内部的子对象。深拷贝(deepcopy):copy模块的deepcopy方法,完全拷贝了父对象及其子对象。字典浅拷贝实例实例>>>a={1:[1,2,3]}>>>b=a.copy()>>>a,b({1:[1,2,3]},{1:[1,2,3]})>>>a[1].append(4)>>>a,b

系统 2019-09-27 17:48:56 1950

Python

python+opencv调用摄像头视频图像处理

在做深度学习的时候,难免会用到摄像头采集图像。在这个就会用到python调用摄像头+opencv图像处理。视频图像的处理和单幅图片处理是一样的,视频就是很多单幅图像连续播放。每秒播放(采集)的图片数量叫帧率。importcv2#########图像读取部分cap=cv2.VideoCapture('2.wmv')#调用目录下的视频#cap=cv2.VideoCapture(0)#调用摄像头‘0’一般是打开电脑自带摄像头,‘1’是打开外部摄像头(只有一个摄像

系统 2019-09-27 17:48:52 1950

Python

Python实现全局变量的两个解决方法

本文针对Python的全局变量实现方法简述如下:先来看下面一段测试程序:count=0defFuc(count):printcountcount+=1foriinrange(0,10):Fuc(count)运行结果是:>>>0000000000很显然,这并不是我们想要的结果。针对这一问题的解决方法就是采用全局变量:globalaa=3defFuc():globalaprintaa=a+1if__name__=="__main__":globalaforii

系统 2019-09-27 17:48:00 1950

Python

python正则爬取某段子网站前20页段子(request库)过程解析

首先还是谷歌浏览器抓包对该网站数据进行分析,结果如下:该网站地址:http://www.budejie.com/text该网站数据都是通过html页面进行展示,网站url默认为第一页,http://www.budejie.com/text/2为第二页,以此类推对网站的内容段子所处位置进行分析,发现段子内容都是在一个a标签中坑还是有的,这是我第一次写的正则:content_list=re.findall(r'(.+?)',html_str)之后发现竟然匹配到

系统 2019-09-27 17:46:58 1950

Python

python笔记(lsit和tuple)

一:list和tuple的区别:list是可以增加,改变,删除元素的,是动态的,其存储的开销会比tuple较大一些,性能也会比tuple较差;tuple一旦被创建,就无法改变,无法增加,删除元素,如果使用某些方法打算改变tuple,其实是返回了一个新的tuple,tuple是静态的,其存储的开销比list小,比list更加轻量级。应用场景总结:如果元素是静态的,不变的话用tuple;如果需要频繁增加,删除,更改元素,使用list。二:一些常用代码:1:验证

系统 2019-09-27 17:45:34 1950

Python

Python-嵌套列表list的全面解析

一个3层嵌套列表mm=["a",["b","c",["inner"]]]需要解析为基本的数据项a,b,c,inner基本的取数据项方法:foriinm:printi这个只能取出第一层的a,和一个2层的嵌套列表["b","c",["inner"]]结合内置函数和判断可以继续解析这个2层列表foriinm:ifisinstance(i,list):forjini:printjelse:printi结果abc['inner']这个2层嵌套也分开了了,但里面的列表

系统 2019-09-27 17:38:25 1950

Python

吐血总结!100个Python面试问题集锦(上)

作者|Python语音识别来源|深度学习与python(ID:PythonDC)Python是目前编程领域最受欢迎的语言。在本文中,我将总结Python面试中最常见的100个问题。每道题都提供参考答案,希望能够帮助你在2019年求职面试中脱颖而出,找到一份高薪工作。这100道面试题涉及Python基础知识、Python编程、数据分析以及Python函数库等多个方面。Q1、Python中的列表和元组有什么区别?Q2、Python的主要功能是什么?Python

系统 2019-09-27 17:57:13 1949

Python

Python中文件I/O高效操作处理的技巧分享

如何读写文本文件?实际案例某文本文件编码格式已直(如UTF-8,GBK,BIG5),在python2.x和python3.x中分别如何读取这些文件?解决方案字符串的语义发生了变化:python2python3strbytesunicodestrpython2.x写入文件前对unicode编码,读入文件后对二进制字符串解码>>>f=open('py2.txt','w')>>>s=u'你好'>>>f.write(s.encode('gbk'))>>>f.clo

系统 2019-09-27 17:56:45 1949