Python

用Python分析淘宝2000款避孕套,得出这些有趣的结论

到现在为止,我们的淘宝教程已经写到了第四篇,前三篇分别是:第一篇:Python模拟登录淘宝,详细讲解如何使用requests库登录淘宝pc端。第二篇:淘宝自动登录2.0,新增Cookies序列化,教大家如何将cookies保存起来。第三篇:Python爬取淘宝商品避孕套,教大家如何爬取淘宝pc端商品信息。今天,我们来看看淘宝系列的第四篇我们在上一篇的时候已经将淘宝数据爬取下来了,但是并没有做数据分析。所以今天这篇文章就是教大家如何去分析数据,得出一些有用的

系统 2019-09-27 17:50:12 2039

Python

自学成为Python大牛(上)

[外链图片转存中...(img-CUYTKo4b-1568552381026)]总章一.学习前言二.环境搭建三.Python的基本概念一.学习前言很多人在自学Python的时候,总是不知道如何学习,不知道该怎么学,今天看到框架,就想学flask或者其他框架,但是当学的时候又茫然了,不知道怎么学;想学Python,但是又不知道Python就业方向以及前景如何,小编给大家强力推荐一套Python学习方法,只要按照这个方法去学,那么,在和别人同时学习的时候,在同

系统 2019-09-27 17:50:02 2039

Python

python 提取文件指定列的方法示例

之前用featureCount处理得到结果,要提出第一列gene_id和readcount列,首先软件输出的第一行默认是你使用的命令行,没有用,用bash批量删掉。foriin`ls`;dosed-i'1d'$i;done删除当前文件夹下所有文件第一行。其实提出两列很简单,不过我受够了每次一个文件执行一次的烦。想搞成别的程序调用时命令行参数直接就行。第一次知道sys.argv这玩意,学到了。我设置了-i输入,-o输出这两个参数来判断输入输出文件个数,不过对

系统 2019-09-27 17:49:32 2039

Python

python基础面试题整理---从零开始 每天十题(03)

一、Q:用Python输出一个Fibonacci数列?(斐波那契额数列)A:我们先来看下代码#!/usr/bin/envpython#-*-coding:utf-8-*-deffib_recur(n):ifn<=1:returnnreturnfib_recur(n-1)+fib_recur(n-2)foriinrange(1,20):print(fib_recur(i),end="")我们来详细的看一下代码,我们知道斐波那契数据为1,1,2,3,5,8,1

系统 2019-09-27 17:49:20 2039

Python

译:selenium webdriver (python)

译:seleniumwebdriver(python)2013-06-1601:24虫师阅读(...)评论(...)编辑收藏如果翻译的很烂,原文档地址:http://docs.seleniumhq.org/docs/03_webdriver.jsp#firefox-driverseleniumwebdriver注:我们不断的更新这份文档,使这份文档更加正确和完善;这份文档相对来讲也是比较准确的。webdriver的简介硒2.0的主要新功能是集成的webdr

系统 2019-09-27 17:48:51 2039

Python

python 文本相似度计算

参考:python文本相似度计算原始语料格式:一个文件,一篇文章。#!/usr/bin/envpython#-*-coding:UTF-8-*-importjiebafromgensimimportcorpora,models,similaritiesimportcodecsdefcut_words(file):withopen(file,'r',encoding="utf-8")asf:text=f.read()words=jieba.lcut(text

系统 2019-09-27 17:48:40 2039

Python

python虚拟环境的安装和配置(virtualenv

一、为什么要安装虚拟环境情景一、项目A需要某个库的1.0版本,项目B需要这个库的2.0版本。如果没有安装虚拟环境,那么当你使用这两个项目时,你就需要来回的卸载安装了。情景二,项目A需要python2.7环境下运行,项目B需要在python3.6环境运行,如果使用虚拟环境可以分别为这两个项目配置不同的运行环境总的来说:virtualenv是一个创建隔绝的Python环境的工具,能为每一个python项目创建独立的,定制的环境二、安装步骤1、现在电脑上安装你需

系统 2019-09-27 17:47:45 2039

Python

Python字符串处理之count()方法的使用

count()方法返回出现在范围内串子数range[start,end]。可选参数的start和end都解释为片符号。语法以下是count()方法的语法:str.count(sub,start=0,end=len(string))参数sub--这是子串用来进行搜索。start--搜索从这一索引。第一个字符从0开始的索引。默认情况下搜索从0开始的索引。end--搜索从该索引结束。第一个字符从0开始的索引。默认情况下搜索结束的最后一个索引。返回值此方法返回集中

系统 2019-09-27 17:47:22 2039

Python

Python3内置模块之json编解码方法小结

概述Python3中我们利用内置模块json解码和编码JSON对象,JSON(JavaScriptObjectNotation)是指定RFC7159(废弃了RFC4627)和ECMA-404是一种轻量级数据交换格式,受JavaScript对象文字语法的启发(虽然它不是JavaScript1的严格子集)。下面为Python对象–>JSON对象的对照关系表。PythonJSONdictobjectlist,tuplearraystr,unicodestring

系统 2019-09-27 17:47:12 2039

Python

python urllib中的编码处理示例

复制代码代码如下:>>>importurllib>>>data='丽江'>>>printdata丽江>>>data'\xe4\xb8\xbd\xe6\xb1\x9f'>>>urllib.quote(data)'%E4%B8%BD%E6%B1%9F'那我们想转回去呢?复制代码代码如下:>>>urllib.unquote('%E4%B8%BD%E6%B1%9F')'\xe4\xb8\xbd\xe6\xb1\x9f'>>>printurllib.unquote(

系统 2019-09-27 17:47:11 2039

Python

Python判断文件和文件夹是否存在的方法

一、python判断文件和文件夹是否存在、创建文件夹复制代码代码如下:>>>importos>>>os.path.exists('d:/assist')True>>>os.path.exists('d:/assist/getTeacherList.py')True>>>os.path.isfile('d:/assist')False>>>os.path.isfile('d:/assist/getTeacherList.py')True>>>os.maked

系统 2019-09-27 17:47:00 2039

Python

详细讲解Python中的文件I/O操作

本章将覆盖所有在Python中使用的基本I/O功能。有关更多函数,请参考标准Python文档。打印到屏幕上:产生输出最简单的方法是使用print语句,可以通过用逗号分隔的零个或多个表达式。该函数将传递到一个字符串表达式,并将结果写到标准输出,如下所示:#!/usr/bin/pythonprint"Pythonisreallyagreatlanguage,","isn'tit?";这将产生结果输出在标准屏幕上,结果如下:Pythonisreallyagrea

系统 2019-09-27 17:46:33 2039

Python

使用Python爬了4400条淘宝商品数据,竟发现了这些“潜规则”

本文记录了笔者用Python爬取淘宝某商品的全过程,并对商品数据进行了挖掘与分析,最终得出结论。项目内容本案例选择>>商品类目:沙发;数量:共100页4400个商品;筛选条件:天猫、销量从高到低、价格500元以上。项目目的1.对商品标题进行文本分析词云可视化2.不同关键词word对应的sales的统计分析3.商品的价格分布情况分析4.商品的销量分布情况分析5.不同价格区间的商品的平均销量分布6.商品价格对销量的影响分析7.商品价格对销售额的影响分析8.不同

系统 2019-09-27 17:46:23 2039

Python

Python random生成随机数和range()和len()函数区别

用于生成一个指定范围内的整数。其中参数a是下限,参数b是上限,Python生成随机数print(random.randint(12,20))#生成的随机数n:12<=n<=20print(random.randint(20,20))#结果永远是20#print(random.randint(20,10))#该语句是错误的。print(random.randrange(1,100,2))#返回[1,100]之间的奇数19print(random.ranran

系统 2019-09-27 17:46:15 2039

Python

Python数据结构与算法(几种排序)小结

Python数据结构与算法(几种排序)数据结构与算法(Python)冒泡排序冒泡排序(英语:BubbleSort)是一种简单的排序算法。它重复地遍历要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。冒泡排序算法的运作如下:比较相邻的元素。如果第一个比第二个大(升序),就交换他们两个。对每一对相邻元素

系统 2019-09-27 17:45:58 2039