转眼又到了咱们中国传统的情人节七夕了,今天笔者就带大家来领略一下用Python表白的方式。让程序员的恋人们感受一下IT人的浪漫。一、词云制作首先咱们可以用之前介绍过的wordcould包制作词云。wordcloud包安装十分简单。pip即可完成安装pipinstallwordcloud然后需要制作一个背景图片,为了应急我用艺术字做了个七夕的图片,如果大家来不及直接图片另存为使用下图即可。具体制作的词云的代码如下:fromwordcloudimportWor
系统 2019-09-27 17:49:41 1820
一般来说,用pandas处理小于100兆的数据,性能不是问题。当用pandas来处理100兆至几个G的数据时,将会比较耗时,同时会导致程序因内存不足而运行失败。当然,像Spark这类的工具能够胜任处理100G至几个T的大数据集,但要想充分发挥这些工具的优势,通常需要比较贵的硬件设备。而且,这些工具不像pandas那样具有丰富的进行高质量数据清洗、探索和分析的特性。对于中等规模的数据,我们的愿望是尽量让pandas继续发挥其优势,而不是换用其他工具。本文我们
系统 2019-09-27 17:49:29 1820
废话不多说,直接上代码吧!importthreadingimportosclassFind(threading.Thread):#搜索数据的线程类def__init__(self,datalist,startIndex,endIndex,searchstr,savefile):#datalist要搜索的内容列表,startIndex列表搜索范围的开始下标,searchstr要搜索的内容threading.Thread.__init__(self)self.
系统 2019-09-27 17:49:21 1820
异常:当Python检测到⼀个错误时,解释器就⽆法继续执⾏了,会出现⼀些错误的提示,这就是所谓的"异常"。看如下示例:print('-----test--1---')open('123.txt','r')print('-----test--2---')打开⼀个不存在的⽂件123.txt,当找不到123.txt⽂件时,就会抛出给我们⼀个IOError类型的错误,Nosuchfileordirectory:123.txt(没有123.txt这样的⽂件或⽬录)异
系统 2019-09-27 17:48:33 1820
matplotlib是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。它的文档相当完备,并且Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。这篇我们用matplotlib从构造最简单的bar一步一步向复杂的bar前行。什么是最简单的bar,看如下语句你就知
系统 2019-09-27 17:48:15 1820
log日志监测程序运行:可以1⃣️Linux重定向将python运行报错记录到log日志中,2⃣️或者用python内置的logging模块。但是在用logging模块时,try...except...可以捕获到可预见/考虑到的异常,用logging记录到log日志文件中,但是在对于未知异常或导致程序退出时的情形无法记录到log日志中,用Linux的重定向可以捕捉到。现在到问题时我不想用Linux系统提供的重定向方法,我需要捕获python运行中未知的异常
系统 2019-09-27 17:48:09 1820
fileno()方法返回所使用的底层实现,要求从操作系统I/O操作的整数文件描述符。语法以下是fileno()方法的语法:fileObject.fileno();参数NA返回值此方法返回整数文件描述符。例子下面的例子显示fileno()方法的使用。#!/usr/bin/python#Openafilefo=open("foo.txt","wb")print"Nameofthefile:",fo.namefid=fo.fileno()print"FileDe
系统 2019-09-27 17:46:29 1820
文章目录一.爬虫简介二.简单爬虫架构三.URL管理器3.1url管理器应具有的最小功能:3.2实现方式四.网页下载器4.1urllib简单的获取一个网页。4.2使用Request4.3添加特殊情景的处理五.网页解析器5.1安装beautifulsoup45.2beautifulsoup语法5.3示例代码:六.完整实例6.1分析目标为什么是轻量级爬虫?因为复杂的爬虫需要考虑的场景和问题非常的多,比如有些网页需要登录后才能访问、而有些网页使用javascrip
系统 2019-09-27 17:46:04 1820
推导式是Python中很强大的、很受欢迎的特性,具有语言简洁,速度快等优点。推导式包括:1.列表推导式2.字典推导式3.集合推导式嵌套列表推导式NOTE:字典和集合推导是最近才加入到Python的(Python2.7和Python3.1以上版).下面简要介绍下:【列表推导式】列表推导能非常简洁的构造一个新列表:只用一条简洁的表达式即可对得到的元素进行转换变形其基本格式如下:复制代码代码如下:[exprforvalueincollectionifcondit
系统 2019-09-27 17:45:56 1820
刚来这个公司,熟悉了环境,老大就开始让我做一个迁移、修改代码的工作,我想说的是,这种工作真没劲~~,看别人的代码、改别人的代码、这里改个变量、那里改个文件名・・・・・・,都是些没技术含量、很繁琐的事情,不过通过迁移代码顺便熟悉下环境也好。扯了这么多,说说今天的主题吧――代码编码格式改变,由于某些原因,需要将代码从A机房迁移到B机房,这两个之间不能互相访问,但是历史原因导致A机房的代码全是utf8编码的,B机房要求是GBK编码,看看这个怎么解决。编码问题先说
系统 2019-09-27 17:45:49 1820