Python - 军军小站|张军博客
Python

【Python爬虫】数据存储

数据存储1.存储至TXTa+为Python文件的读写模式,表示将对文件使用附加读写方式打开,如果该文件不存在,就会创建一个新文件。一般在读取文件的时候可以使用r方式,如果文件不存在,就会返回错误,而且无法向该文件中写入数据,这样就保证了读取文件的可靠性。综上所述,地址可以写成如下3种形式:(1)withopen('C:\\you\desktop\\title.txt',"a+")asf:(2)withopen(r'C:\you\desktop\title.

系统 2019-09-27 17:56:15 2298

Python

win10 pip install openslide-python后,虽然

症状pipinstallopenslide-python后,虽然在pycharm里importopenslide不报错,但是程序运行时,报错:找不到指定模块解决方案添加以下步骤:下载并解压二进制文件到downloadopenslide下载二进制文件并解压配置环境变量解压后,把对应的bin和lib添加到环境变量即可,我的是:

系统 2019-09-27 17:54:36 2298

Python

python弹框二之tkinter.messagebox

前面写过python弹框的ctypes.windll.user32方法:https://blog.csdn.net/Gordennizaicunzai/article/details/78966694该方法调用windows系统的user32组件,不是纯python方法,且wser32的MessageBoxA使用不当会出现乱码,不是很好用。这里介绍pythonic的弹框——tkinter.messagebox。NAMEtkinter.messageboxD

系统 2019-09-27 17:52:52 2298

Python

python h5py 操作 —— 以cifar数据集为例

本文要做的是如何把cifar-10数据集创建并写入hdf5文件中,以介绍python操作HDF类文件的常用方法1、从官网下载数据集cifar-10:cifar官网(注意下载python版的)下载完后要先解压,不能直接上代码;Linux下解压:tar-zxvf压缩包名.tar.gz#适用于.tar.gz文件unzipfilename.zip#适用于zip文件解压后看到下面情况:然后才能上以下代码来读取数据文件:importcPickleaspickledef

系统 2019-09-27 17:51:49 2298

Python

python 装饰函数 和 闭包 基础总结。

一、装饰函数(1)概念:装饰器本质上是一个Python函数或类,它可以让其他函数或类在不需要做任何代码修改的前提下增加额外功能,装饰器的返回值也是一个函数/类对象。它经常用于有切面需求的场景,比如:插入日志、性能测试、事务处理、缓存、权限校验等场景,装饰器是解决这类问题的绝佳设计。有了装饰器,我们就可以抽离出大量与函数功能本身无关的雷同代码到装饰器中并继续重用。概括的讲,装饰器的作用就是为已经存在的对象添加额外的功能。使用方法:先定义一个装饰器(帽子)再定

系统 2019-09-27 17:55:30 2297

Python

Python简单的数据分析:词云分析周杰伦《晴天》

直接上代码实现效果wordcloud还提供了命令行版wordcloud-cli,一行命令即可。下面进行歌词的情感分析情感分析结果s1=SnowNLP(s.sentences[0])s1.sentiments0.8849970682062196#正向情感#分析好不容易又能再多爱一天s1=SnowNLP(s.sentences[-2])s1.sentiments0.21646625648493734#这个情绪就比较负面了

系统 2019-09-27 17:48:32 2297

Python

【机器学习】隐马尔可夫模型及其三个基本问题(四)状态序列预测算法及python

【机器学习】隐马尔可夫模型及其三个基本问题(四)状态序列预测算法及python实现一、维特比算法二、python实现参考资料隐马尔可夫模型状态序列预测问题是指给定模型λ=[A,B,∏]\lambda=\left[{A,B,\prod}\right]λ=[A,B,∏]和观测序列X={x1,x2,⋯,xn}X=\left\{{{x_1},{x_2},\cdots,{x_n}}\right\}X={x1​,x2​,⋯,xn​},求最可能出现的对应状态序列。本篇博

系统 2019-09-27 17:47:13 2297

Python

Python函数中的可变长参数详解

一、Python函数中的参数1、使用python的函数时,有参数类别,比如位置参数、关键字参数、可变长参数2、位置参数、关键字参数很好理解,关键是可变长参数经常能见到,但是一直没有搞懂是什么意思二、可变长参数1、一个星号:函数可以接收任意个数的参数,只需要在形参前面加一个*(星号),一个星号形参的函数会把多个位置参数值当成元祖的形式传入,也就是传入的多个参数值可以在函数内部进行元祖遍历deflength_param(a,*args):print("a=",

系统 2019-09-27 17:45:33 2297

Python

Python配置文件处理的方法教程

前言在平时的工程中,我们在构建工程时,常常需要用到配置文件,用来配置项目的一些信息,比如数据库,请求网址,文件夹,线程、进程数等信息,这样就可以方便我们通过修改配置文件中的参数来很好地完成整个项目的功能修改或开发。配置文件一般区别于Python代码,会单独存放在一个文件夹中,方便管理,常见的配置文件格式有.conf,.ini,.yaml等。本文使用Python中的configparser模块来处理conf、ini配置文件。首先需要安装configparse

系统 2019-09-27 17:57:19 2296

Python

Python 通过打码平台实现验证码的实现

在爬虫时,经常遇到登录需要验证码的情况,简单的验证码可以自己解决,复制的验证码需要借助机器学习,有一定的难度。还有一个简单的方案就是采用付费的打码平台。比如R若快(http://www.ruokuai.com/client),还有云打码平台(http://www.yundama.com/price.html)下面以R若快为例介绍打码平台的思路:R若快平台需要注册两个用户,一个是普通用户,一个开发者用户,1、首先验证码截图,就是截取网站上登录页面的验证码图片

系统 2019-09-27 17:56:53 2296

Python

python中对list去重的多种方法

今天遇到一个问题,在同事随意的提示下,用了itertools.groupby这个函数。不过这个东西最终还是没用上。问题就是对一个list中的新闻id进行去重,去重之后要保证顺序不变。直观方法最简单的思路就是:复制代码代码如下:ids=[1,2,3,3,4,2,3,4,5,6,1]news_ids=[]foridinids:ifidnotinnews_ids:news_ids.append(id)printnews_ids这样也可行,但是看起来不够爽。用se

系统 2019-09-27 17:56:46 2296

Python

我给曾经暗恋的高中女同学,用Python实现了她飞机上刷抖音

点击上方“何俊林”,马上关注,每天早上8:50准时推送真爱,请置顶或星标背景昨天一个曾经暗恋的高中同学,她突然找到我说,要去美国深造,原来是因为去美国在飞机上时间特别长,平时是个抖音迷,一天不刷抖音就没法活,考虑到去美国的飞机上没有网络,又想刷抖音,看我平时经常看见我分享技术相关,所以问了下我,有没办法,可以正常满足她刷抖音,这TM,都是别人家媳妇了,我本来不想搭理的。但是看在曾经暗恋过她,人家又要出国了,这个小小的愿望那自然要满足。于是我第一想到就是用P

系统 2019-09-27 17:52:11 2296

Python

浅谈Python_Openpyxl使用(最全总结)

Python_Openpyxl1.安装pipinstallopenpyxl2.打开文件①创建fromopenpyxlimportWorkbook#实例化wb=Workbook()#激活worksheetws=wb.active②打开已有>>>fromopenpyxlimportload_workbook>>>wb2=load_workbook('文件名称.xlsx')3.储存数据#方式一:数据可以直接分配到单元格中(可以输入公式)ws['A1']=42#方

系统 2019-09-27 17:51:21 2296

Python

python下PyGame的下载与安装过程及遇到问题

1.去官网下载PyGame注意:要下载对应版本的包官网地址:http://www.pygame.org/download.shtml其中,如果python为以下版本:python3.4:http://www.lfd.uci.edu/~gohlke/pythonlibs/#pygamepython3.5,3.6:https://pypi.python.org/pypi/Pygame(cp36就是python3.6的意思)2..exe文件直接安装.whl文件启

系统 2019-09-27 17:51:11 2296

Python

python代码覆盖率(下)--- coverage.py api

前言使用pytest-cov无法统计用api调用服务的测试脚本所覆盖率,但大部分的项目基本也是使用api调用。所以我们额外需要使用coverage.pyapi来统计。当你安装pytest-cov时,已经默认安装了coverage这个库。服务启动要想扫描到代码,必须在服务启动的时候要插入coverage相关配置。我这边是flask启动的,所以在flask启动的代码上添加,如下:if__name__=='__main__':cov=Coverage()cov.

系统 2019-09-27 17:48:14 2296