- 军军小站|张军博客
搜索到与相关的文章
Python

Hadoop中的Python框架的使用指南

最近,我加入了Cloudera,在这之前,我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它很棒的科学计算栈来进行的。但ApacheHadoop的生态系统大部分都是用Java来实现的,也是为Java准备的,这让我很恼火。所以,我的头等大事变成了寻找一些Python可以用的Hadoop框架。在这篇文章里,我会把我个人对这些框架的一些无关科学的看法写下来,这些框架包括:Hadoop流mrjobdumbohadoopyp

系统 2019-09-27 17:48:52 1809

Python

python爬虫re模块

python爬虫1《1》什么是爬虫网络爬虫?网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。《2》爬虫的基本原理:我们把互联网比喻为一张大网,网络爬虫我们想象为网上的蜘蛛,网页与网页之间的连接我们理解为节点,爬虫就相当于是访问网页,获取网页的信息,又通过节点可以爬取另一个网站,然后不停的通过一个个节点即访问一个个网页,这样网站的数据就可以被我们获取下来了。《3》爬虫的分类:网络爬虫可分为通用爬虫和聚焦爬虫

系统 2019-09-27 17:48:45 1809

Python

浅谈Python3 numpy.ptp()最大值与最小值的差

numpy.ptp()是计算最大值与最小值差的函数,用法如下:importnumpyasnpa=np.array([np.random.randint(0,20,5),np.random.randint(0,20,5)])print('原始数据\n'a)print('对所有数据计算\n',a.ptp())print('axis=0,按行方向计算,即每列\n',a.ptp(axis=0))#按行方向计算,即每列print('axis=1,按列方向计算,即每行

系统 2019-09-27 17:48:43 1809

Python

python英语单词测试小程序代码实例

这篇文章主要介绍了python英语单词测试小程序代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下爬取了扇贝英语网,并制作了一个英语单词测试的小程序,还能生成错词本,一起来看下代码吧~importrequests#扇贝网爬虫,获取英语单词category_res=requests.get('https://www.shanbay.com/api/v1/vocabtest/category/?_=156

系统 2019-09-27 17:48:39 1809

Python

Python 编码规范(Google Python Style Guide)

Python风格规范(Google)本项目并非Google官方项目,而是由国内程序员凭热情创建和维护。如果你关注的是Google官方英文版,请移步GoogleStyleGuide以下代码中Yes表示推荐,No表示不推荐。分号不要在行尾加分号,也不要用分号将两条命令放在同一行。行长度每行不超过80个字符以下情况除外:长的导入模块语句注释里的URL不要使用反斜杠连接行。Python会将圆括号,中括号和花括号中的行隐式的连接起来,你可以利用这个特点.如果需要,你

系统 2019-09-27 17:48:09 1809

Python

Python生成随机验证码图片

思路:1、画一张白色的图片(大小为:200*50)2、逐个填充像素点,每个像素点随机3、往图片上写入字符字符随机生成字符的颜色是随机的字符的组成:大写字母、小写字母以及数字fromPILimportImage,ImageDraw,ImageFontimportnumpyasnpdefbgcolor():returnnp.random.randint(64,255),np.random.randint(64,255),np.random.randint(64

系统 2019-09-27 17:48:05 1809

Python

gearman的安装启动及python API使用实例

本文讲述了gearman的安装启动及pythonAPI使用实例,对于网站建设及服务器维护来说非常有用!一、概述:Gearman是一款非常优秀的任务分发框架,可以用于分布式计算。具体的gearmand服务的安装启动及gearman的python模块的安装以及简单示例如下:操作系统:rnel5.71.首先,我们需要安装gearmand,在centos和rhel环境下,我们只需运行以下命令:yuminstallgearmand-y注意:如果不希望通过yum的方式

系统 2019-09-27 17:47:44 1809

Python

经验拾忆(纯手工)=> Python正则全解详解

预编译importrere1=re.compile(r'元字符组成的正则规则')#元字符下面会说re1.方法()#方法下边也会说元字符:表示普通字符:.#除了\n外都可以匹配的到\d#只匹配纯数字0-9\D#和\d相反,除了数字全都匹配\s#只匹配空格\S#和\s相反,除了空格,全都匹配#我喜欢用[\s\S]*?匹配所有\w#只匹配纯数字或大小写字母或下划线\W#与\w恰好相反,除了纯数字、大小写字母、下划线全都匹配[]#[abcde]只要包含这个列表的字

系统 2019-09-27 17:46:42 1809

Python

一文完全掌握Python property属性以及实战中应用

初识property属性说道属性,我们马上想到实例属性、类属性等那么回顾一下类属性clsasProvice(object):country='china'defxxx(self):pass如上代码中country就是类属性,我们可以通过以下方式去设置值和获取值beijing=Probice()#调用实力方法beijing.xxx()#获取类属性my_country=beijing.country那么如果我们这个需要在这个country的值需要一些逻辑运算才

系统 2019-09-27 17:46:34 1809

Python

Python判断列表是否已排序的各种方法及其性能分析

声明本文基于Python2.7语言,给出判断列表是否已排序的多种方法,并在作者的WindowsXP主机(PentiumG6302.7GHz主频2GB内存)上对比和分析其性能表现。一.问题提出Haskell培训老师提出一个问题:如何判断列表是否已经排序?排序与否实际只是相邻元素间的某种二元关系,即a->a->Bool。所以第一步可以把二元组列表找出来;第二步是把这个函数作用于每个元组,然后用and操作。老师给出的实现代码如下:pairlst=ziplst(t

系统 2019-09-27 17:46:24 1809