- 军军小站|张军博客
搜索到与相关的文章
Python

python elasticsearch环境搭建详解

windows下载ziplinux下载tar下载地址:https://www.elastic.co/downloads/elasticsearch解压后运行:bin/elasticsearch(orbin\elasticsearch.batonWindows)检查是否成功:访问http://localhost:9200linux下不能以root用户运行,普通用户运行报错:java.nio.file.AccessDeniedException原因:当前用户没

系统 2019-09-27 17:54:44 1831

Python

详解Python用三种方式统计词频的方法

三种方法:①直接使用dict②使用defaultdict③使用Counterps:`int()`函数默认返回0①dicttext="I'mahandsomeboy!"frequency={}forwordintext.split():ifwordnotinfrequency:frequency[word]=1else:frequency[word]+=1②defaultdictimportcollectionsfrequency=collections.d

系统 2019-09-27 17:54:44 1831

Python

python获取文件后缀名及批量更新目录下文件后缀名的方法

本文实例讲述了python获取文件后缀名及批量更新目录下文件后缀名的方法。分享给大家供大家参考。具体实现方法如下:1.获取文件后缀名:复制代码代码如下:#!/usr/bin/pythonimportosdict={}ford,fd,flinos.walk('/home/ahda/Program/'):forfinfl:sufix=os.path.splitext(f)[1][1:]ifdict.has_key(sufix):dict[sufix]+=1el

系统 2019-09-27 17:54:31 1831

Python

python爬虫_自动获取seebug的poc实例

简单的写了一个爬取www.seebug.org上poc的小玩意儿~首先我们进行一定的抓包分析我们遇到的第一个问题就是seebug需要登录才能进行下载,这个很好处理,只需要抓取返回值200的页面,将我们的headers信息复制下来就行了(这里我就不放上我的headers信息了,不过headers里需要修改和注意的内容会在下文讲清楚)headers={'Host':******,'Connection':'close','Accept':******,'Use

系统 2019-09-27 17:54:11 1831

Python

使用python爬取微博数据打造一颗“心”

前言一年一度的虐狗节终于过去了,朋友圈各种晒,晒自拍,晒娃,晒美食,秀恩爱的。程序员在晒什么,程序员在加班。但是礼物还是少不了的,送什么好?作为程序员,我准备了一份特别的礼物,用以往发的微博数据打造一颗“爱心”,我想她一定会感动得哭了吧。哈哈准备工作有了想法之后就开始行动了,自然最先想到的就是用Python了,大体思路就是把微博数据爬下来,数据经过清洗加工后再进行分词处理,处理后的数据交给词云工具,配合科学计算工具和绘图工具制作成图像出来,涉及到的工具包有

系统 2019-09-27 17:53:34 1831

Python

菜鸟学习python:逻辑语句小结

今天学习了python的逻辑语句。感觉与其他语言不通,鲜明的特点是除了Ture和False,有时返回的是数值。简单小结如下:1、and(逻辑与)乘法性质:同时为真方为真,只要一假就是假。计算方法:遇假跳出,否则返回最后真(值)。2、or(逻辑或)加法性质:同时为假方为假,只要一真就是真。计算方法:遇真跳出,直接返回跳出真(值)。3、not(逻辑非)取反性质:结果总是Ture或False。最后,跳出返回的真值可能是非零的数值或是Ture,返回假(值)可能是F

系统 2019-09-27 17:52:38 1831

Python

Python可视化数据库Dash

Dash简介Dash是一个用于构建Web应用程序的Python数据可视化库。它基于PythonWeb框架Flask以及Javascript绘图库Plotly.js和用于构建用户界面的Javascript库React.js,所以它非常适合用于构建后端基于Flask,前端数据可视化的Web网页。因为Dash应用程序可以在Web浏览器中显示,所以可以将这些Dash应用程序部署到服务器,通过URL共享。Dash应用程序由两部分组成,第一部分是布局(Layout),

系统 2019-09-27 17:52:31 1831

Python

Python的MRO

Python的MRO即MethodResolutionOrder(方法解析顺序),也就是在Python中的类的继承顺序是怎样的。在Python2.3之前,MRO的实现是基于DFS的,而在Python2.3以后MRO的实现是基于C3算法(我这里两种算法的具体实现都不详述)。C3算法最早被提出是用于Lisp的,应用在Python中是为了解决原来基于深度优先搜索算法不满足本地优先级,和单调性的问题。本地优先级:指声明时父类的顺序,比如C(A,B),如果访问C类对

系统 2019-09-27 17:50:47 1831

Python

python PIL 给微信带参二维码添加有色log

客户要求将微信的带参二维码增加log,首次生成的时候log直接是个没颜色的,客户想要给点颜色看看,第一次生成图片如下生成的客户需要的原因是因为底图的数据通道和log的数据通道不同为L8像素黑白,log为RGB3x8位像素真彩通道一个图片可以包含一到多个数据通道,如果这些通道具有相同的维数和深度,Pil允许将这些通道进行叠加模式11位像素,黑和白,存成8位的像素L8位像素,黑白P8位像素,使用调色板映射到任何其他模式RGB3×8位像素,真彩RGBA4×8位像

系统 2019-09-27 17:48:30 1831

Python

用Python爬取需要登录的网站

最近我必须执行一项从一个需要登录的网站上爬取一些网页的操作。它没有我想象中那么简单,因此我决定为它写一个辅助教程。在本教程中,我们将从我们的bitbucket账户中爬取一个项目列表。教程中的代码可以从我的Github中找到。我们将会按照以下步骤进行:提取登录需要的详细信息执行站点登录爬取所需要的数据在本教程中,我使用了以下包(可以在requirements.txt中找到):requestslxml#步骤一:研究该网站打开登录页面进入以下页面“bitbuck

系统 2019-09-27 17:47:27 1831