Justnotes拿到一台干净的centos之后,初始化Python环境,一些命令和问题记录而已可以搞成脚本自动初始化,当然,用docker更好基础环境1.创建用户sudoaddusernewusersudopasswdnewuser#设置授权不需要输入密码sudo/usr/sbin/visudonewuserALL=NOPASSWD:ALL2.EPEL(FedoraExtraPackagesforEnterpriseLinuxrepository)参考文
系统 2019-09-27 17:51:15 2138
作者:伏草惟存来源:http://www.cnblogs.com/baiboy/p/nltk2.htmlPython的几个自然语言处理工具1.NLTK:NLTK在用Python处理自然语言的工具中处于领先的地位。它提供了WordNet这种方便处理词汇资源的借口,还有分类、分词、除茎、标注、语法分析、语义推理等类库。2.Pattern:Pattern的自然语言处理工具有词性标注工具(Part-Of-SpeechTagger),N元搜索(n-gramsearc
系统 2019-09-27 17:51:07 2138
爬虫即网络爬虫,英文是WebSpider。翻译过来就是网络上爬行的蜘蛛,如果把互联网看作一张大网,那么爬虫就是在大网上爬来爬去的蜘蛛,碰到想要的食物,就把他抓取出来。我们在浏览器中输入一个网址,敲击回车,看到网站的页面信息。这就是浏览器请求了网站的服务器,获取到网络资源。那么,爬虫也相当于模拟浏览器发送请求,获得到HTML代码。HTML代码里通常包含了标签和文字信息,我们就从中提取到我们想要的信息。通常爬虫是从某个网站的某个页面开始,爬取这个页面的内容,找
系统 2019-09-27 17:51:06 2138
Python解释器安装好Python3.x之后,我们可以使用文本文件去编写Python代码,编写完成后将扩展名改成.py结尾的文本文件。想要执行编写好的.py文件就需要用到Python解释器。解释器分为:CPython、Ipython、PyPy、Jython、IronPython等。目前我们常用的是CPython解释器,该解释器是用C语言开发的,所以叫CPython。在命令行下运行python其实就是启动CPython解释器。第一个程序HelloPytho
系统 2019-09-27 17:47:36 2138
1、安装sqlalchemypipinstallsqlalchemy2、导入必要的包及模块importsqlalchemyfromsqlalchemy.ext.declarativeimportdeclarative_basefromsqlalchemy.ormimportsessionmaker3、创建数据库连接实例#创建数据库连接实例(#"数据库类型+数据库模块://用户名:密码@主机/库名")db=sqlalchemy.create_engine("
系统 2019-09-27 17:47:28 2138
python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。基本接口:复制代码代码如下:pickle.dump(obj,file,[,protocol])注解:将对象obj保存到文件file中去。protocol为序列化使用的协议版本,0:ASCII协议,所序列化的对象使用可打印的ASCII
系统 2019-09-27 17:47:04 2138
原文链接:https://jinshuju.net/f/kb1Bcq图片来源于网络♚作者:贠云龙Blog:zhihu.com/people/yunlongyun本文主要讲解python中操作word的思路。一、Hello,world!使用win32com需要安装pypiwin32pipinstallpypiwin32推荐使用python的IDLE,交互方便1、如何新建文档fromwin32com.clientimportDispatchapp=Dispat
系统 2019-09-27 17:46:43 2138
一、持久化--shelve持久化工具(1)作用:类似字典,用kv对保存数据,存取方式类似于字典(2)例子:通过一下案例创建了一个数据库,第二个程序我们读取了数据库#使用shelve创建文件并使用importshelveshv=shelve.open(r"shv.db")shv["one"]=1shv["two"]=2shv.close()shv=shelve.open(r"shv.db")try:print(shv["one"])print(shv["th
系统 2019-09-27 17:45:48 2138
实例如下:#!/usr/bin/python#-*-coding:utf-8-*-importrandomclassCDispatch:def__init__(self,sum,count):self.sum=sumself.count=count#print'initheresum=',sum,',count=',countdef__del__(self):pass#print'rundeltheclass'defgetListInfo(self):li
系统 2019-09-27 17:45:27 2138
Python爬虫:一些常用的爬虫技巧总结爬虫在开发过程中也有很多复用的过程,这里总结一下,以后也能省些事情。1、基本抓取网页get方法importurllib2url"http://www.baidu.com"respons=urllib2.urlopen(url)printresponse.read()post方法importurllibimporturllib2url="http://abcde.com"form={'name':'abc','pass
系统 2019-09-27 17:38:00 2138
背景最近在写一个测试工具箱,里面有一个bug记录系统,因为后台我是用Django和MongoDB来实现的,就遇到了一个问题,要如何实现一个自增的字段。传统的关系型数据库要实现起来是非常容易,只要直接设置一个自增字段就行了,插入数据时不用管这个键值,只管自己处理的数据就行了,会自动实现自增的功能,但是非关系型数据库好像没有这个功能(或者我不知道)。百度之后发现都是MongoDB的设置方法,并不是我想要的。解决思路百度没有找到好的思路,那就只能自己解决了,我的
系统 2019-09-27 17:37:37 2138
一、正则表达式的特殊字符介绍正则表达式^匹配行首$匹配行尾.任意单个字符[]匹配包含在中括号中的任意字符[^]匹配包含在中括号中的字符之外的字符[-]匹配指定范围的任意单个字符?匹配之前项的1次或者0次+匹配之前项的1次或者多次*匹配之前项的0次或者多次{n}匹配之前项的n次{m,n}匹配之前项最大n次,最小m次{n,}配置之前项至少n次二、re模块的方法介绍1、匹配类方法a、findall方法#findall方法,该方法在字符串中查找模式匹配,将所有的匹
系统 2019-09-27 17:56:15 2137
.NET是一个微软的技术平台,致力于敏捷、快速开发和跨平台,可以用于开发C/S结构的软件(WinForm技术),如QQ、财务管理系统等;也可以用于开发B/S结构的网站,如门户网站、OA系统等。一个.NET应用是使用.NETFramework类库编写,运行于公共语言运行时CommonLanguageRuntime上的应用程序。.NETFramework组件是.NET应用开发环境的核心,负责程序的执行。微软推出.NET平台的重要原因:留住Windows程序员,
系统 2019-09-27 17:56:11 2137
在Python中存储数据到文件中时,简单的做法是调用open函数执行文件写入操作,但是这样做的话,当我们要重新读取文件内容时,就会出现类型不匹配的情况,因为读取的都是字符串的形式,所以还需要进行类型转换,这样不简洁。或者使用eval函数把字符串转换为对象,但是有时它过于强大,它会执行Python的任何表达式,甚至做出威胁系统正常工作的表达式,这样做不安全。如果想存储Python原生对象,但又无法信赖文件的数据来源,那么pickle模块会是个理想的选择。pi
系统 2019-09-27 17:55:55 2137
[TOC]代码示例支持平台:Centos6.3Python:2.7.14Github:https://github.com/baidu/CUP欢迎关注公众号进行技术互动和讨论:1.1踩坑案例今天的坑不仅包括裸用os.system还包括裸用相关的家族:os.popensubprocess家族subprocess.callsubprocess.Popensubprocess.runcommands家族(py2.6后已不推荐使用,depreciated.Py3删
系统 2019-09-27 17:55:48 2137