Python - 军军小站|张军博客
Python

编写Python脚本来获取Google搜索结果的示例

前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童鞋不要再走弯路。1.搜索引擎的选取选择一个好的搜索引擎意味着你能够得到更准确的搜索结果。我用过的搜索引擎有四种:Google、Bing、Baidu、Yahoo!。作为程序员,我首选Google。但当我看见我最爱的Google返回给我的全是一堆的js代码,根本没我想要的搜索结果。于是我转而投向了Bing的阵营,在用过一段

系统 2019-09-27 17:48:21 1798

Python

Python实现的百度站长自动URL提交小工具

URL提交是百度提供的一个站长工具,用于给站长提供手工收录某些URL的接口,但是该接口有验证码识别部分,比较难弄。所以编写了如下程序进行验证码自动识别:主要思路获取多个验证码,提交到http://lab.ocrking.com/进行多次识别,然后计算每个验证码图片识别出来的字母或数字进行统计,得出统计率最高的即为验证码。复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-importrequestsimportt

系统 2019-09-27 17:48:10 1798

Python

什么是闭包及Python中的闭包

什么是闭包Objectsaredatawithmethodsattached.Closuresarefunctionswithdataattached.一般来说,我们都非常熟悉面向对象(OOD)语言中的对象的概念。所谓对象(Object),指的是附带相应方法的__数据__。那么相对而言,闭包(closure)指的则是附带相应数据的__函数__。换句话说,闭包函数能够引用一些并不在当前代码全局上下文中定义的变量。这些被引用的变量(称为自由变量)是在闭包函数被

系统 2019-09-27 17:48:00 1798

Python

Python从小白到攻城狮(2)——数据类型和变量

本系列Python文章基于Python3版本,关于python的安装和配置自行百度,这里不做详细介绍。接下来将介绍Python基础——数据类型和变量。数据类型在Python中,能够直接处理的数据类型有以下几种:整型Python中可以处理任意大的整数,包括负整数。支持二进制(如0b100,换算成十进制是4)、八进制(0o100,换算成十进制是64)、十六进制(0x100,换算成十进制为256)的表示法。浮点型浮点数也就是小数,之所以称为浮点数,是因为按照科学

系统 2019-09-27 17:47:56 1798

Python

纯 Python 实现的 Google 批量翻译!

首先声明,没有什么不良动机,因为经常会用translate.google.cn,就想着用Python模拟网页提交实现文档的批量翻译。据说有API,可是要收费。生成TokenGoogle为防爬虫而生成token的代码是Javascript的,且是根据网站的TKK值和提交的文本动态生成。网上搜到的一段Python代码有点小Bug,且缺少动态获取TKK的步骤。最后还是对照Javascript代码自己改成Python了。方法很简单,先转成易懂的Javascript

系统 2019-09-27 17:47:50 1798

Python

pycharm使用正则表达式批量添加print括号完美从python2迁移...到python3

网络下载的python代码,版本参差,从python2.x迁移python3.x的过程中,存在print语法问题,即python2.x中print无括号,python3.x中print有括号。逐行添加括号未免效率过低,因此,可使用正则表达式的方法,提供解决方法。1、在pycharm编译器中,Ctrl+R调出替换功能框,勾选“Regex”,选择正则表达式替换方法2、从上到下,第一个搜索框输入print(.*?);?$正则表达式含义.匹配任意字符,除了换行符,

系统 2019-09-27 17:47:46 1798

Python

Python一行代码搞定炫酷可视化,你需要了解一下Cufflinks

作者:xiaoyu微信公众号:Python数据科学知乎:python数据分析师前言学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等。这些可视化库都有自己的特点,在实际应用中也广为大家使用。plotly、Boken等都是交互式的可视化工具,结合Jupyternotebook可以非常灵活方便地展现分析后的结果。虽然做出的效果非常的炫酷,比如pl

系统 2019-09-27 17:47:45 1798

Python

Python Threading 线程/互斥锁/死锁/GIL锁

导入线程包importthreading准备函数线程,传参数t1=threading.Thread(target=func,args=(args,))类继承线程,创建线程对象classMyThread(threading.Thread)defrun(self):passif__name__=="__main__":t=MyThread()t.start()线程共享全面变量,但在共享全局变量时会出现数据错误问题使用threading模块中的Lock类,添加互

系统 2019-09-27 17:47:40 1798

Python

Python中的random()方法的使用介绍

random()方法返回一个随机浮点数r,使得0是小于或等于r以及r小于1。语法以下是random()方法的语法:random()注意:此函数是无法直接访问的,所以我们需要导入random模块,然后我们需要使用random对象来调用这个函数。参数NA返回值此方法返回一个随机浮点数r,使得0是小于或等于r以及r小于1。例子下面的例子显示了random()方法的使用。#!/usr/bin/pythonimportrandom#Firstrandomnumber

系统 2019-09-27 17:47:35 1798

Python

Python实现扫描指定目录下的子目录及文件的方法

本文介绍了使用Python来扫描指定目录下的文件,或者匹配指定后缀和前缀的函数。步骤如下:如果要扫描指定目录下的文件,包括子目录,需要调用scan_files("/export/home/test/")如果要扫描指定目录下的特定后缀的文件(比如jar包),包括子目录,调用scan_files("/export/home/test/",postfix=".jar")如果要扫描指定目录下的特定前缀的文件(比如test_xxx.py),包括子目录,调用scan_

系统 2019-09-27 17:47:27 1798

Python

python的类方法和静态方法

本文实例讲述了python的类方法和静态方法。分享给大家供大家参考。具体分析如下:python没有和C++中static关键字,它的静态方法是怎样的呢?还有其它语言中少有的类方法又是神马?python中实现静态方法和类方法都是依赖于python的修饰器来实现的。复制代码代码如下:classMyClass:defmethod(self):print("method")@staticmethoddefstaticMethod():print("staticme

系统 2019-09-27 17:47:26 1798

Python

Python序列之list和tuple常用方法以及注意事项

sequence序列sequence(序列)是一组有顺序的对象的集合。序列可以包含一个或多个元素,也可以没有任何元素。我们之前所说的基本数据类型,都可以作为序列的对象。对象还可以是另一个序列。序列有两种:list(表)和tuple(元组)。list和tuple的主要区别在于,一旦建立,tuple的各个元素不可再变更,而list的各个元素可以再变更。List获得list元素的个数:复制代码代码如下:>>>lst=['更新慢','python',5.44,Fa

系统 2019-09-27 17:47:24 1798

Python

Python字符串处理之count()方法的使用

count()方法返回出现在范围内串子数range[start,end]。可选参数的start和end都解释为片符号。语法以下是count()方法的语法:str.count(sub,start=0,end=len(string))参数sub--这是子串用来进行搜索。start--搜索从这一索引。第一个字符从0开始的索引。默认情况下搜索从0开始的索引。end--搜索从该索引结束。第一个字符从0开始的索引。默认情况下搜索结束的最后一个索引。返回值此方法返回集中

系统 2019-09-27 17:47:22 1798

Python

python实现进程间通信简单实例

本文实例讲解了python实现两个程序之间通信的方法,具体方法如下:该实例采用socket实现,与socket网络编程不一样的是socket.socket(socket.AF_UNIX,socket.SOCK_STREAM)的第一个参数是socket.AF_UNIX而不是socket.AF_INET例中两个python程序s.py/c.py要先运行s.py基于fedora13/python2.6测试,成功实现!s.py代码如下:#!/usr/bin/env

系统 2019-09-27 17:47:14 1798

Python

python网络爬虫学习笔记之三 Selenium入门

抓取动态的网页内容主要有两种办法,一种是通过开发者工具找到动态内容的接口,然后分析接口的参数和返回值来爬取网站的数据。另外一种是通过模拟浏览器来抓取数据。python的Selenium库就可以通过代码来模拟浏览器抓取数据。一、概述运行Selenium需要依赖于Python的selenium库,以及浏览器对应驱动器(WebDriver)。安装selenium库pipinstallselenium项目地址:https://pypi.org/project/se

系统 2019-09-27 17:47:10 1798