- 军军小站|张军博客
拥有Python标签的文章
Python

使用python在本地电脑上快速处理数据

大数据一般是在“云”上玩的,但“云”都是要钱的,而且数据上上下下的也比较麻烦。所以,在本地电脑上快速处理数据的技能还是要的。pandas在比赛中学到的一个工具,本地可以在亿级别的数据上进行聚合等操作。内部的数据包括:•Series:一维数组,每个元素有一个标签•DataFrame:二维表格,可以看做Series的集合•Panel:三维数据数据的初始化我们可以通过构造函数来初始化,从下面的代码中可以想象得到数据是样子:frompandasimportSeri

系统 2019-09-27 17:55:02 2103

Python

Python循环中else,break和continue的用法实例详解

本文实例讲述了Python循环中else,break和continue的用法。分享给大家供大家参考,具体如下:在看Python的文档的时候看到了for和while语句和C语言中有一个最大的区别―可以有一个可选的else语句。这个语句的执行触发机制让我不大明白,通过代码测试才了解了什么情况下触发else语句。“凡存在,皆合理”,Python的设计者肯定是有他的目的,现在咱们来探究一番。以for语句为例,开发环境Python3.4。Python循环中的else

系统 2019-09-27 17:54:43 2103

Python

Python实现的简单发送邮件脚本分享

近来有些东西需要监控报警发邮件,然后在网上找了点材料,自己写了一个简单发送邮件的脚本,主要就是运用python的smtplib模块,分享给大家看一下:复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-#导入smtplib和MIMETextimportsmtplib,sysfromemail.mime.textimportMIMETextdefsend_mail(sub,content):############

系统 2019-09-27 17:54:42 2103

Python

Python面向对象编程——组合与重用性

Python面向对象编程——组合与重用性组合与重用性软件重用的重要方式除了继承之外还有另外一种方式,即组合。组合指的是,在一个类中以另外一个类的对象作为数据属性,称为类的组合。>>>classEquip:#武器装备类...deffire(self):...print('releaseFireskill')...>>>classRiven:#英雄Riven的类,一个英雄需要有装备,因而需要组合Equip类...camp='Noxus'...def__init

系统 2019-09-27 17:53:46 2103

Python

python获取多线程及子线程的返回值

最近有个需求,用多线程比较合适,但是我需要每个线程的返回值,这就需要我在threading.Thread的基础上进行封装importthreadingclassMyThread(threading.Thread):def__init__(self,func,args=()):super(MyThread,self).__init__()self.func=funcself.args=argsdefrun(self):self.result=self.fun

系统 2019-09-27 17:53:22 2103

Python

python爬虫案例

今天为大家整理了32个Python爬虫项目。整理的原因是,爬虫入门简单快速,也非常适合新入门的小伙伴培养信心。所有链接指向GitHub,祝大家玩的愉快~O(∩_∩)OWechatSogou[1]-微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。DouBanSpider[2]-豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选

系统 2019-09-27 17:52:24 2103

Python

Python中解析JSON并同时进行自定义编码处理实例

在对文件内容或字符串进行JSON反序列化(deserialize)时,由于原始内容编码问题,可能需要对反序列化后的内容进行编码处理(如将unicode对象转换为str)。在Python中,一种方式是先使用json.load或json.loads反序列化得到dict对象,然后对这个dict对象进行编码处理。但其实在json.load与json.loads中,有可选参数object_hook。通过使用此参数,可以对反序列化得到的dict直接进行处理,并使用处理

系统 2019-09-27 17:52:23 2103

Python

一个基于python的抽取文章关键短语的工具

应用场景在很多关键词提取任务中,使用tfidf等方法提取得到的仅仅是若干零碎词汇。这样的零碎词汇无法真正的表达文章的原本含义,我们并不想要它。例如:>>>text='朝鲜确认金正恩出访俄罗斯将与普京举行会谈...'>>>keywords=['俄罗斯','朝鲜','普京','金正恩','俄方']在很多时候,我们往往需要更细化的短语描述,来作为文本的关键信息展示。这样的需求在生成词云、提供摘要阅读、关键信息检索等任务中都非常重要。例如:>>>phrases=[

系统 2019-09-27 17:52:22 2103

Python

Python3爬虫模拟新浪微博登录(2019-8-3)最新

目录Python3爬虫模拟新浪微博登录过程分析遇到的坑关于第一步,账号和密码加密登录请求post数据包装关于登录后如跳转到主页面其他模块执行结果Python3爬虫模拟新浪微博登录初学Python3小白一枚,若有错误请不吝赐教过程分析整个过程从填写数据到跳转到主页一共经历了七个步骤:1.在登陆前,输入账号结束,失去输入框焦点,浏览器会发送两个请求,分别请求了登陆前加密密码所需的servertime、nonce、pubkey(图中对应3)2.第二个ajax请求

系统 2019-09-27 17:51:23 2103

Python

Python3快速入门(十四)——Pandas数据读取

Python3快速入门(十四)——Pandas数据读取一、DataFrameIO1、CSV文件pandas.read_csv(filepath_or_buffer,na_values='NAN',parse_dates=['LastUpdate'])从CSV文件中读取数据并创建一个DataFrame对象,na_vlaues用于设置缺失值形式,parse_dates用于将指定的列解析成时间日期格式。dataframe.to_csv("xxx.csv",mod

系统 2019-09-27 17:50:45 2103

Python

随机森林算法python实现

随机森林算法python实现瞎BB代码导入数据切分训练集测试集找到最有用的几个属性根据上面的代码更改属性参数组合遍历找最优随机森林样本数据瞎BB1.实现根据样本数据(用眼距离distance、最长持续用眼时长duration、总用眼时长total_time、户外运动时长outdoor、用眼角度angle、健康环境光照用眼比例proportion)判别是否需要近视预警2.样本实在太少,结果还行,原理都是一样的代码导入数据importpandaspatient

系统 2019-09-27 17:50:10 2103

Python

Python shutil模块--文件拷贝与权限操作

目录基础部分shutil.copyfileobj(file1,file2):shutil.copyfile(file1,file2):其他shutil.copymode(file1,file2):shutil.copystat(file1,file2):shutil.copy(file1,file2):shutil.copy2(file1,file2):shutil.copytree(源目录,目标目录):shutil.rmtree(目标目录):shutil

系统 2019-09-27 17:49:32 2103

Python

用Python将Excel数据导入到SQL Server的例子

使用环境:Win10x64Python:3.6.4SqlServer:2008R2因为近期需要将excel导入到SQLServer,但是使用的是其他语言,闲来无事就尝试着用python进行导入,速度还是挺快的,1w多条数据,也只用了1s多,代码也比较简单,就不多解释了。用到的库有xlrd(用来处理excel),pymssql(用来连接使用sqlserver)importxlrdimportpymssqlimportdatetime#连接本地sqlserve

系统 2019-09-27 17:48:59 2103

Python

关于Python 的简单栅格图像边界提取方法

在GIS中,栅格属性里有关于栅格自身的信息,背景(nodatavalue)对于识别一张图像的边界像元尤为重要,我们目的只要把每行每列中的第一次出现不是nodata的像元和最后一次出现nodata的前一个像元就可以了。对于栅格,可以用ArcPy中的RasterToNumpyArray函数将将栅格转成numpy数组,然后就可以按照所想读取出每行列中首尾像元。以下是部分代码提取边界像元的核心算法,其实是很简单的一个思路(假设0是nodatavalue)。a=[[

系统 2019-09-27 17:47:41 2103

Python

python中临时文件及文件夹使用

python中临时文件及文件夹使用文章目录python中临时文件及文件夹使用一、简介二、临时文件夹2.1获取临时文件夹2.2生成临时文件夹三、临时文件3.1生成不自动删除(关闭时)的临时文件3.2生成自动删除的临时文件一、简介这里介绍python中临时文件及文件夹使用。使用的是tempfile包(安装:pipinstalltempfile),参考地址是https://docs.python.org/3/library/tempfile.html。二、临时文

系统 2019-09-27 17:45:37 2103