Python

Python定向爬虫,模拟新浪微博登录!

当我们试图从新浪微博抓取数据时,我们会发现网页上提示未登录,无法查看其他用户的信息。模拟登录是定向爬虫制作中一个必须克服的问题,只有这样才能爬取到更多的内容。实现微博登录的方法有很多,一般我们在模拟登录时首选WAP版。因为PC版网页源码中包括很多的js代码,提交的内容也更多,不适合机器模拟登录。我们实现微博登录的大体思路是这样的:用抓包工具把正常登录时要提交的字段都记录下来;模拟提交这些字段;判断是否登录成功;原理很简单,让我们一步一步来实现吧。一.抓包利

系统 2019-09-27 17:53:11 2456

Python

python 队列详解及实例代码

队列特性:先进先出(FIFO)――先进队列的元素先出队列。来源于我们生活中的队列(先排队的先办完事)。Queue模块最常与threading模块一起构成生产-消费者模型,提供了一个适用于多线程编程的先进先出的数据结构,即队列。该模块源码中包含5个类:其中,Empty和Full是两个异常类,当队列的Queue.get(block=0)或者调用get_nowait()时,如果队列为空,则抛EmptyException异常。同理,当队列的Queue.put(bl

系统 2019-09-27 17:37:55 2456

Python

Python--列表如何去掉最后一个元素

在Python3中列表数据类型的内置方法里有三种方法可以删除列表的最后一个元素(我所知道的):1、pop方法list=[1,2,3,4]list.pop()print(list)#[1,2,3]2、del方法list=[1,2,3,4]del(list[-1])print(list)#[1,2,3]3、切片list=[1,2,3,4]list=list[0:-1]print(list)#[1,2,3]总结:以上三种方法未在内存处理上进行测试,唯一区别,po

系统 2019-09-27 17:53:39 2455

Python

Python库Pandas《Pandas Cookbook》第03章 数据

这是书籍《PandasCookbook》书籍第03章的代码复现,所有代码运行在JupyterNotebook上,原讲解地址是:https://www.jianshu.com/p/05cb76788c80我上传代码的github地址是:https://github.com/Asunqingwen/PandasCookbook.gitgithub上有该书中用到的data,里面代码会不定期更新(因为工作原因,时间不定),直到本书学习完成!相比原讲解,会穿插一些自

系统 2019-09-27 17:53:04 2455

Python

Python随机函数库random的使用方法详解

前言众所周知,python拥有丰富的内置库,还支持众多的第三方库,被称为胶水语言,随机函数库random,就是python自带的标准库,他的用法极为广泛,除了生成比较简单的随机数外,还有很多功能。使用random库:importrandomrandom库主要函数:函数名说明用法random()生成一个0~1之间的随机浮点数,范围0<=n<1.0random.random()uniform(a,b)返回a,b之间的随机浮点数,范围[a,b]或[a,b),取决

系统 2019-09-27 17:51:33 2455

Python

USF MSDS501 计算数据科学中文讲义 1.2 Python 工具的初次

来源:ApacheCN『USFMSDS501计算数据科学中文讲义』翻译项目原文:AfirsttasteofPythontools译者:飞龙协议:CCBY-NC-SA4.0加载命令行应用启动Terminal.app(Mac)或任何bash终端,shell,它是UNIX风格的命令行提示符程序。你应该看到一个闪烁的光标和一个$提示符:$上面的$符号只是提示,终端正在等待您输入内容。执行命令后,您将再次看到$提示符。命令行是一个非常低级的接口,用于与计算机的操作系

系统 2019-09-27 17:51:22 2455

Python

在python中实现同行输入/接收多个数据的示例

在使用python去AC题时总会遇到这样的问题,题目要求同行输入一组数据,但是你使用input时却不能做到,导致不断的CE,这个时候怎么样来解决的这个问题呢?很简单,只需要使用input().split('')就可以了例如:最简单的求a+b的例子,写成下面的形式就可以单行输入两个数据了a,b=input().split('')#以空格为间隔符print(a+b)结果如下:注意input的输入机制,他是把所有输入都按照字符串输入的所以这样输出的a+b是按字符

系统 2019-09-27 17:48:19 2455

Python

python实现建造者模式

python实现建造者模式前言无论是在现实世界中还是在软件系统中,都存在一些复杂的对象,它们拥有多个组成部分,如汽车,它包括车轮、方向盘、发送机等各种部件。而对于大多数用户而言,无须知道这些部件的装配细节,也几乎不会使用单独某个部件,而是使用一辆完整的汽车,可以通过建造者模式对其进行设计与描述,建造者模式可以将部件和其组装过程分开,一步一步创建一个复杂的对象。用户只需要指定复杂对象的类型就可以得到该对象,而无须知道其内部的具体构造细节.介绍建造者模式(Bu

系统 2019-09-27 17:45:45 2455

Python

Linux下为不同版本python安装第三方库

问题背景目前的linux发行版上,有很多安装了两个版本的python。我的机器上默认的版本为python2.x。且在使用easy_install安装第三方库时,也默认安装到了2.x的版本上,在3.x版本下则无法import安装的库。环境:Kubuntu15.04解决方法安装python3-setuptools和easy_install3,并安装pip3sudoapt-getinstallpython3-setuptoolssudoeasy_install3

系统 2019-09-27 17:38:29 2455

Python

【Python】Windows 下使用 pyinstaller 对 keras

用到的几种主要的python包的版本(CPU)python:3.61、pyinstaller:3.3.1(打包成exe)2、tensorflow:1.4.0(深度学习框架)3、keras:2.0.8(模型时基于keras训练的)4、opencv-python:4.1.0.25(主要用于图像数据的读取与存储)5、numpy:1.15.0(主要用于图像数据的矩阵操作)6、h5py:2.9.0(打包的时候提醒需要这个包)……注:很多时候打包不成功,或者打包成功,

系统 2019-09-27 17:55:17 2454

Python

python之文件的读写和文件目录以及文件夹的操作实现代码

为了安全起见,最好还是给打开的文件对象指定一个名字,这样在完成操作之后可以迅速关闭文件,防止一些无用的文件对象占用内存。举个例子,对文本文件读取:file_object=open('thefile.txt')try:all_the_text=file_object.read()finally:file_object.close()Python读写文件实际操作的五大步骤一、打开文件Python读写文件在计算机语言中被广泛的应用,如果你想了解其应用的程序,以下

系统 2019-09-27 17:38:35 2454

Python

python 出现SyntaxError: non-keyword arg

python出现SyntaxError:non-keywordargafterkeywordarg错误解决办法前言:在Python中,这两个是python中的可变参数,*arg表示任意多个无名参数,类型为tuple,**kwargs表示关键字参数,为dict,使用时需将*arg放在**kwargs之前,否则会有“SyntaxError:non-keywordargafterkeywordarg”的语法错误deftest(*arg,**kwargs):pri

系统 2019-09-27 17:56:38 2453

Python

python的Image模块导入踩坑

最近在做pythonchallenge,做到16关的时候,需要导入Image模块成功通过setuptools安装okimportImage代码中直接这样导入,结果库里没有方法函数百度查了半天,发现都是这样导入的没问题。但我这样没法运行啊,最后无意间被我试出来了改成fromPILimportImage就可以了,心塞塞,很少做关于图像处理的,这次长教训,学习了很多

系统 2019-09-27 17:54:45 2453

Python

python3__深度学习__过拟合/欠拟合的处理

1.过拟合定义+处理1.1过拟合概述(低偏差,高方差)定义:过拟合简单的描述就是在训练集上的表现很好,但在未见过的测试集上的表现却较差。专业一点的定义就是:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h'也属于H,使得在训练样例上h的错误率小于h',但是在整个实例分布上h'比h的错误率小,那么则称假设h过度拟合训练数据。危害:一个过拟合的模型试图连“误差”都去解释,而实际上噪音是不需要解释的,这个解释的过程导致模型的泛化能力较差,模型在预测集上

系统 2019-09-27 17:51:55 2453