- 军军小站|张军博客
搜索到与相关的文章
Python

使用Python爬了4400条淘宝商品数据,竟发现了这些“潜规则”

本文记录了笔者用Python爬取淘宝某商品的全过程,并对商品数据进行了挖掘与分析,最终得出结论。项目内容本案例选择>>商品类目:沙发;数量:共100页4400个商品;筛选条件:天猫、销量从高到低、价格500元以上。项目目的1.对商品标题进行文本分析词云可视化2.不同关键词word对应的sales的统计分析3.商品的价格分布情况分析4.商品的销量分布情况分析5.不同价格区间的商品的平均销量分布6.商品价格对销量的影响分析7.商品价格对销售额的影响分析8.不同

系统 2019-09-27 17:46:23 1789

Python

python-cookbook

PYTHON-COOKBOOK文章目录PYTHON-COOKBOOK一:数据结构和算法1、Heapq取出最大或最小的几个元素优先级队列2、字典多值字典字典排序字典列表排序字典共同点和不同点3、collections保留最后几个元素频率统计命名元组字典(映射)联合查找4、其他解压赋值去重且保持顺序切片分组一:数据结构和算法三个基本的写法:列表生成式字典生成式迭代器生成式1、Heapq取出最大或最小的几个元素#最大或者最小的n个元素importrandomfr

系统 2019-09-27 17:46:19 1789

Python

python for循环赋值方法

背景写代码的时候,你会发现你的代码越写越多。然而,功能需要也越来越多,然后你的冗余代码就多得不能再多了~~~怎么办,我太难了。那就寻求一些高级写法,一般的高级写法都是尽可能地短。另外,把重复的代码抽取出来,封装成函数,每次使用直接调函数即可。For循环赋值前提条件:我创建了一个road类,这个类里面有这些属性。我先初始化给road赋值,然后再把这些对象放到roadObjList集合里面。目标:从roadObjList集合里面取出每个road对象的objec

系统 2019-09-27 17:46:11 1789

Python

CentOS配置python操作

centos7.3安装python查看当前python情况[root@localhost/]#cd/[root@localhostbin]#cd/usr/bin[root@localhostbin]#lspython*pythonpython2python2.7[root@localhostbin]#ls-alpython*修改软连接[root@localhostbin]#mvpythonpython.bak开始做下载准备[root@localhostbi

系统 2019-09-27 17:45:46 1789

Python

python小案例_工作报告词云

一、《新时代中国特色社会主义》的词云1、直接上代码:importjieba,wordcloudf=open("./data/新时代中国特色社会主义.txt","r",encoding="utf-8")#打开文件t=f.read()#读取文件f.close()#关闭文件ls=jieba.lcut(t)#分词txt="".join(ls)#将分好的词用空格串起来#配置参数#width:指定词云对象生成图片的宽度,默认400像素#height:指定词云对象生成图

系统 2019-09-27 17:45:38 1789

Python

举例讲解Python程序与系统shell交互的方式

概述考虑这样一个问题,有hello.py脚本,输出”hello,world!”;有TestInput.py脚本,等待用户输入,然后打印用户输入的数据。那么,怎么样把hello.py输出内容发送给TestInput.py,最后TestInput.py打印接收到的”hello,world!”。下面我来逐步讲解一下shell的交互方式。hello.py代码如下:#!/usr/bin/pythonprint"hello,world!"TestInput.py代码如

系统 2019-09-27 17:38:38 1789

Python

详解Python中的文本处理

字符串--不可改变的序列如同大多数高级编程语言一样,变长字符串是Python中的基本类型。Python在“后台”分配内存以保存字符串(或其它值),程序员不必为此操心。Python还有一些其它高级语言没有的字符串处理功能。在Python中,字符串是“不可改变的序列”。尽管不能“按位置”修改字符串(如字节组),但程序可以引用字符串的元素或子序列,就象使用任何序列一样。Python使用灵活的“分片”操作来引用子序列,字符片段的格式类似于电子表格中一定范围的行或列

系统 2019-09-27 17:38:37 1789

Python

python生成器表达式和列表解析

绝大多数情况下,遍历一个集合都是为了对元素应用某个动作或是进行筛选。如果看过本文的第二部分,你应该还记得有内建函数map和filter提供了这些功能,但Python仍然为这些操作提供了语言级的支持。(x+1forxinlst)#生成器表达式,返回迭代器。外部的括号可在用于参数时省略。[x+1forxinlst]#列表解析,返回list如你所见,生成器表达式和列表解析(注:这里的翻译有很多种,比如列表展开、列表推导等等,指的是同一个意思)的区别很小,所以人们

系统 2019-09-27 17:38:27 1789

Python

C++/Php/Python/Shell 程序按行读取文件或者控制台的实现

写程序经常需要用到从文件或者标准输入中按行读取信息,这里汇总一下。方便使用1.C++读取文件#include#includeintmain(){constchar*in_file="input_file_name";constchar*out_file="output_file_name";FILE*p_in=fopen(in_file,"r");if(!p_in){printf("openfile%sfailed!!!",in_file);return-

系统 2019-09-27 17:38:25 1789

Python

Python 登录网站详解及实例

Python登录网站详解及实例对于大部分论坛,我们想要抓取其中的帖子分析,首先需要登录,否则无法查看。这是因为HTTP协议是一个无状态(Stateless)的协议,服务器如何知道当前请求连接的用户是否已经登录了呢?有两种方式:在URI中显式地使用SessionID;利用Cookie,大概过程是登录一个网站后会在本地保留一个Cookie,当继续浏览这个网站的时候,浏览器会把Cookie连同地址请求一起发送过去。Python提供了相当丰富的模块,所以对于这种网

系统 2019-09-27 17:38:24 1789