获取全站用户,理论来说从1个用户作为切入点就可以,我们需要爬取用户的关注列表,从关注列表不断的叠加下去。随便打开一个用户的个人中心绿色圆圈里面的都是我们想要采集到的信息。这个用户关注0人?那么你还需要继续找一个入口,这个用户一定要关注了别人。选择关注列表,是为了让数据有价值,因为关注者里面可能大量的小号或者不活跃的账号,价值不大。我选了这样一个入口页面,它关注了3个人,你也可以选择多一些的,这个没有太大影响!https://juejin.im/user/5
系统 2019-09-27 17:55:41 2363
字典的特点:以键值对的形式存在,无序排序;key必须唯一不重复,且不能使用可变对象声明一个字典d={}print(d)print(type(d))增:d[1]=‘a’d[2]=‘c’d[3]=‘b’print(d)d.update({4:‘z’})print(d)dict.setdefault(key,value),如果该key不存在,则在字典中插入这个键值对,并返回value;如果该key已存在,则返回字典中key对应的value,原字典不做更新d.se
系统 2019-09-27 17:54:56 2363
前言通常我们的python代码都是遵循PEP8的规范化格式,目的是为了保持代码的一致性、可读性。,这里给大家推荐几个常用的静态代码检查工具,大家可以酌情选择使用1.pylintPylint是一个Python静态代码分析工具,它可以查找编程错误,帮助强制执行编码标准,嗅探代码异味并提供简单的重构建议。它具有高度可配置性,具有特殊的编译指示来控制代码中的错误和警告,以及广泛的配置文件。也可以编写自己的插件来添加自己的检查或以某种方式扩展pylint。缺省情况下
系统 2019-09-27 17:54:07 2363
文件夹中文件数较多,每份文件较大的情况下,可以采用多进程读取文件最后附完整项目代码#单进程读取文件夹中的单份文件defread_data(path):start=time.time()withopen(path,'rb')asf:filename=pickle.load(f)end=time.time()print('Taskruns%0.2fseconds.'%((end-start)))returnfilename#向数据库插入数据definsert_
系统 2019-09-27 17:53:42 2363
无聊统计了下列表去重到底有多少种方法。下面小编给大家总结一下,具体内容详情如下;开发中对数组、列表去重是非常常见的需求,对一个list中的id进行去重,有下面几种方法,前面两种方法不能保证顺序,后面两种方法可以保持原来的顺序。下面的代码都在Python3下测试通过,Python2下请自行测试1.使用set的特型,python的set和其他语言类似,是一个无序不重复元素集orgList=[1,0,3,7,7,5]#list()方法是把字符串str或元组转成数
系统 2019-09-27 17:53:06 2363
遇到很多初学者的盆友,来问python环境安装的问题。。因此,这篇文章就诞生了。。因个人是windows的环境,所以本文只讲windows环境下的python安装。作为初用python的盆友,强烈建议只在电脑上装一个python版本就好了,不然就进了各种坑里了。第一步:下载和安装python-3.4.4amd.msi可以去官方网站下载,也可以从网盘下载:链接:https://www.jb51.net/softs/415931.html双击此文件,一路安装下
系统 2019-09-27 17:52:18 2363
ubutnu16.04搭建深度学习环境:python3+keras+tensflow一、硬件信息查看cpu型号查看显卡型号查看系统版本二、软件安装2.1安装anaconda32.2安装keras2.3设置GPU支持2.3.1安装驱动2.3.2安装CUDA2.3.3安装cuDNN4.安装tensorflow-gpu5.安装keras一、硬件信息深度学习需要训练模型,一块英伟达的显卡必不可少。初学者,资金不太充裕,就买了一块navidaRTX系列显卡。查看cp
系统 2019-09-27 17:50:25 2363
Python资源大全中文版我想很多程序员应该记得GitHub上有一个Awesome-XXX系列的资源整理。awesome-python是vinta发起维护的Python资源列表,内容包括:Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等。由伯乐在线持续更新。Awesome系列虽然挺全,但基本只对收录的资源做了极为简要的介绍,如果有更详细的中文介绍,对相应开发者的帮助会更大。这也是
系统 2019-09-27 17:49:41 2363
利用python-docx模块,写批量生日邀请函有关python-docx的使用方法,可以参考官方的API文档。这里使用了其中的一些基本功能,来完成一个简单的任务:为参加聚会的好友,每人写一个word文档邀请函。邀请函也很简单,如下图:下面是代码:importdocxfromdocx.enum.textimportWD_PARAGRAPH_ALIGNMENT#引入文字的位置样式fromdocx.sharedimportPt#设置字体#从guest.txt文
系统 2019-09-27 17:47:40 2363
现在是好时机来指出Django和URL配置背后的哲学:松耦合原则。简单的说,松耦合是一个重要的保证互换性的软件开发方法。Django的URL配置就是一个很好的例子。在Django的应用程序中,URL的定义和视图函数之间是松耦合的,换句话说,决定URL返回哪个视图函数和实现这个视图函数是在两个不同的地方。这使得开发人员可以修改一块而不会影响另一块。例如,考虑一下current_datetime视图。如果我们想把它的URL从原来的/time/改变到/curre
系统 2019-09-27 17:37:39 2363