效果技术栈python3requestsredisechart源码地址https://github.com/MasakiOvO/...python需要安装的库requests,BeautifulSoup,redis,django思路两个程序。一个程序负责爬取用户关注和粉丝列表,并把用户名存入set另一个程序负责根据用户名获取详细信息,存入hash维护两个列表1.已爬用户2.未爬用户第一个程序的流程:当未爬set不为空时:执行如下操作:每次从未爬取列表中取出
系统 2019-09-27 17:55:04 2153
1、BinarySearch算法简介二分查找,它的时间复杂度是O(logn)。其核心思想有点类似分治思想。即每次都通过跟区间中的中间元素对比,将待查找的区间缩小为一半,直到找到要查找的元素,或者区间被缩小为0。但是二分查找的代码实现比较容易写错。你需要着重掌握它的三个容易出错的地方:循环退出条件、mid的取值,low和high的更新。二分查找虽然性能比较优秀,但应用场景也比较有限。底层必须依赖数组,并且还要求数据是有序的。对于较小规模的数据查找,我们直接使
系统 2019-09-27 17:54:58 2153
一、字符编码简史:美国:1963年ASCII(包含127个字符占1个字节)中国:1980年GB2312(收录7445个汉字,包括6763个汉字和682个其它符号)1993年GB13000(收录20902个汉字)1995年GBK1.0(收录21003个汉字)2000年GB18030(收录70244个汉字)世界:1991年unicode(‘万国码'也就统一编码,通常占2字节,复杂的汉字占4字节)UTF-8(可变长的字符编码)二、python中的编码解码应用Py
系统 2019-09-27 17:53:49 2153
前言我们所说的加密方式,都是对二进制编码的格式进行加密的,对应到Python中,则是我们的Bytes。所以当我们在Python中进行加密操作的时候,要确保我们操作的是Bytes,否则就会报错。将字符串和Bytes互相转换可以使用encode()和decode()方法。如下所示:#方法中不传参数则是以默认的utf-8编码进行转换In[1]:'南北'.encode()Out[1]:b'\xe5\x8d\x97\xe5\x8c\x97'In[2]:b'\xe5\
系统 2019-09-27 17:52:59 2153
目录一、插入排序二、冒泡排序三、快排(递归)四、选择排序生成一个长度为10的范围在0~20的随机数组importrandomtemp_list=[]whileTrue:num=random.randint(0,20)ifnumnotintemp_list:temp_list.append(num)iflen(temp_list)==10:breakprinttemp_list一、插入排序definsert(list):length=len(list)for
系统 2019-09-27 17:51:37 2153
变量与赋值在Python中,一切皆为对象,对象通过「变量名」引用,「变量名」更确切的叫法是「名字」,好比我们每个人都有自己的名字一样,咱们通过名字来代指某个人,代码里面通过名字来指代某个对象。变量赋值就是给对象绑定一个名字,赋值并不会拷贝对象。好比我们出生的时候父母就要给我们取一个名字一样,给人取个绰号并不来多出一个人来,只是多一个名字罢了。两个对象做比较有两种方式,分别是:is与==,is比较的是两个对象是否相同,通过对象的ID值可识别是否为相同对象,=
系统 2019-09-27 17:51:31 2153
作者:伏草惟存来源:http://www.cnblogs.com/baiboy/p/nltk2.htmlPython的几个自然语言处理工具1.NLTK:NLTK在用Python处理自然语言的工具中处于领先的地位。它提供了WordNet这种方便处理词汇资源的借口,还有分类、分词、除茎、标注、语法分析、语义推理等类库。2.Pattern:Pattern的自然语言处理工具有词性标注工具(Part-Of-SpeechTagger),N元搜索(n-gramsearc
系统 2019-09-27 17:51:09 2153
今天我们讲一下用Python写的GUI小程序。一个小闹钟(只是屏幕提示,没有声音哦)让我们先介绍这个闹钟如何奇葩。需要通过命令行启动。没有标题栏。没菜单。甚至没有关闭按钮。没有运行界面。看到这里想必大家要问了,何必去做一个这样弱爆了的程序呢。显然,教育意义大于其实际用处。像其他的模块一样,QT界面包是需要加载的。我们用到了命令行输入,所以,sys模块也是必须的。用到了时间,但是我们不需要使用time模块,我们用QT提供的QTime模块。让我们先写impor
系统 2019-09-27 17:50:44 2153
。。。。。。刚看到时,我有一点肤浅的吃惊:python都已经没了明确的数据类型概念,竟然还有类。好了,请忽略我的无知。下面我们来看知识点。类的定义首先是类的定义:classname:pass我们能看一下格式,首先是一个普通的class,然后是我们类的名字,冒号后则是类的具体内容。而这里的pass并不是我随便写的,而是有含义的。当我们创建了一个空的类或方法,并且一时半会不想设计它的内容,我们就需要为其加上一个pass来告诉编译器,这是一个空的类或函数。继承p
系统 2019-09-27 17:50:39 2153
今天我们来到了循环队列这一节,之前的文章中,我介绍过了用python自带的列表来实现队列,这是最简单的实现方法。但是,我们都知道,在列表中删除第一个元素和删除最后一个元素花费的时间代价是不一样的,删除列表的第一个元素,那么在它之后的所有元素都要进行移动。所以当列表特别长的时候,这个代价就比较明显了。我们本文介绍的循环队列可以避免这个问题,同样我们上篇文章提到的用链表实现的方法也可以避免。下面,我们来介绍循环队列。循坏队列循环队列,就是将普通的队列首尾连接起
系统 2019-09-27 17:50:25 2153