- 军军小站|张军博客
搜索到与相关的文章
Python

python爬虫———多线程threading模块爬取抖音用户信息

爬虫背景:由于原来的数据库中有1.5亿左右的用户id,但是其中有1.2亿的用户资料是不完整的(没有粉丝数量,点赞数量等,算是无用数据),现在老板要求将这些没有资料的用户更新信息,咋办?刚开始的想法是使用主从模式+scrapy爬取,但是写着写着觉得麻烦(写python的都很懒,scrapy还是比较臃肿的),然后突然想到,python中的多线程,处理爬虫这种存在大量io的操作时,多线程是非常有用的,而且省服务器资源(其他的爬虫也在服务器,能省一点是一点,毕竟是

系统 2019-09-27 17:52:29 2206

Python

python3.4+pycharm 环境安装及使用方法

遇到很多初学者的盆友,来问python环境安装的问题。。因此,这篇文章就诞生了。。因个人是windows的环境,所以本文只讲windows环境下的python安装。作为初用python的盆友,强烈建议只在电脑上装一个python版本就好了,不然就进了各种坑里了。第一步:下载和安装python-3.4.4amd.msi可以去官方网站下载,也可以从网盘下载:链接:https://www.jb51.net/softs/415931.html双击此文件,一路安装下

系统 2019-09-27 17:52:18 2206

Python

小小的Python编程故事

现在Python的火热已经不是整个编程界的事情了,Python的火热已经蔓延到小学、大学课程,之前看新闻报道说青岛的小学生课程里都开始设置Python的课程了,大学里由原来必考的VB也改成了Python。一时大家都掀起了学习了Python的热潮,而接踵而来的各种课程书籍的推荐,但是接踵而来的推荐也不能说看到推荐就购买,要选择合适的自己的书籍或者课程观看哦~今天就来为大家推荐一本适合孩子或者文科生所看的Python编程书籍!《小小的Python编程故事》,下

系统 2019-09-27 17:50:53 2206

Python

朴素贝叶斯法的参数估计——贝叶斯估计及其Python实现

统计学习方法——朴素贝叶斯法原理1.贝叶斯估计1.1为什么要用贝叶斯估计(极大似然的缺点)1.2贝叶斯估计原理贝叶斯估计的算法过程合极大似然估计的算法过程一模一样,代码也几乎一模一样,只是加了一个λ。2.Python代码defpriorProbability(labelList,Lambda):#加入一个lambdalabelSet=set(labelList)labelCountDict={}forlabelinlabelList:iflabelnoti

系统 2019-09-27 17:50:17 2206

Python

使用Python给头像戴上圣诞帽的图像操作过程解析

前言随着圣诞的到来,大家纷纷@官方微信给自己的头像加上一顶圣诞帽。当然这种事情用很多P图软件都可以做到。但是作为一个学习图像处理的技术人,还是觉得我们有必要写一个程序来做这件事情。而且这完全可以作为一个练手的小项目,工作量不大,而且很有意思。用到的工具OpenCV(毕竟我们主要的内容就是OpenCV...)dlib(dlib的人脸检测比OpenCV更好用,而且dlib有OpenCV没有的关键点检测。)用到的语言为Python。但是完全可以改成C++版本,时

系统 2019-09-27 17:49:23 2206

Java

C/C++、Java、Go、Python总结对比2-基本数据类型对比

既然要写代码,肯定少不了数据的操作,所以先来总结对比下不同语言的基本数据类型。c/c++、java、go、python的基本类型都有所差别,不过大部分常用的数据类型都是相同的,下面先讲常用的且相同的基本数据类型。基本类型|------数值型|-----整形(int)|-----双精度型(double)|-----字符型(char)|-----布尔型(boolean)需要注意的是,c中没有布尔类型,下面会进行讲解。下面分别看下5种语言对这4种数据类型的写法c

系统 2019-09-27 17:48:14 2206

Python

TensorFlow实战:SoftMax手写体MNIST识别(Python完整

今天这篇文章我们使用TensorFlow针对于手写体识别数据集MNIST搭建一个softmax的多分类模型。本文的程序主要分为两大模块,一个是对MNIST数据集的下载、解压、重构以及数据集的构建;另一个是构建softmax图及训练图。本程序主要是想去理解包含在这些代码里面的设计思想:TensorFlow工作流程和机器学习的基本概念。本文所使用的数据集和Python源代码都已经上传到我的GitHub(https://github.com/ml365/soft

系统 2019-09-27 17:48:13 2206

Python

Python实现决策树并且使用Graphviz可视化的例子

一、什么是决策树(decisiontree)――机器学习中的一个重要的分类算法决策树是一个类似于数据流程图的树结构:其中,每个内部节点表示一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或者类的分布,树的最顶层是根结点根据天气情况决定出游与否的案例二、决策树算法构建2.1决策树的核心思路特征选择:从训练数据的特征中选择一个特征作为当前节点的分裂标准(特征选择的标准不同产生了不同的特征决策树算法)。决策树生成:根据所选特征评估标准,从上至下递

系统 2019-09-27 17:47:26 2206

Python

Python中datetime常用时间处理方法

常用时间转换及处理函数:importdatetime#获取当前时间d1=datetime.datetime.now()printd1#当前时间加上半小时d2=d1+datetime.timedelta(hours=0.5)printd2#格式化字符串输出d3=d2.strftime('%Y-%m-%d%H:%M:%S')printd3#将字符串转化为时间类型d4=datetime.datetime.strptime(date,'%Y-%m-%d%H:%M:

系统 2019-09-27 17:46:46 2206

Python

python如何以表格形式打印输出的方法示例

好久不见,风水轮流转,我竟然写写写python了近日有个小需求,要求收集统计一些信息上报,并直接在后台控制台打印,写入日志为了美观,需要以表格形式展现数据,形如虽说可以用prettytable实现这个效果,不过还得安装这个库,需求比较简单就不考虑安装第三方依赖了,所以得自己写照着这个图,可以发现几个关键的实现点1.由数据项的各个属性,整理出表头2.计算每个属性对应的最大宽度,作为每列的宽度3.每列左右留一些空4.表头上下,以及数据项末尾添加一行--+--外

系统 2019-09-27 17:46:44 2206