作者:伏草惟存来源:http://www.cnblogs.com/baiboy/p/nltk2.htmlPython的几个自然语言处理工具1.NLTK:NLTK在用Python处理自然语言的工具中处于领先的地位。它提供了WordNet这种方便处理词汇资源的借口,还有分类、分词、除茎、标注、语法分析、语义推理等类库。2.Pattern:Pattern的自然语言处理工具有词性标注工具(Part-Of-SpeechTagger),N元搜索(n-gramsearc
系统 2019-09-27 17:51:10 2383
除请求对象之外,还有一个session对象。它允许你在不同请求间存储特定用户的信息。它是在Cookies的基础上实现的,并且对Cookies进行密钥签名要使用会话,你需要设置一个密钥。设置:session['username']='xxx'删除:session.pop('username',None)fromflaskimportFlask,url_for,session'''遇到不懂的问题?Python学习交流群:821460695满足你的需求,资料都已
系统 2019-09-27 17:49:27 2383
在了解类和实例之前,需要先了解什么是面向对象,什么又是面向过程。面向过程是以过程为中心实现一步步操作(相互调用,类似流水线思想);面向对象是以事物为中心,某个事物可以拥有自己的多个行为,而另一个事物也可以拥有自己的多个行为。面向对象的基础:对象:没有具体的事物,只能说是一切皆对象。如人、汽车、国家,.......对象的属性和行为:这个对象有什么特征或者有什么行为方式。如人有身高、头发颜色等属性,人有睡觉、吃饭等行为类:将具有相同特征的属性和行为的对象抽象出
系统 2019-09-27 17:48:17 2383
__init__(self[,...])__init__和__new__组成python的构造器,但__init__更多的是负责初始化操作,相当于一个项目中的配置文件,__new__才是真正的构造函数,创建并返回一个实例对象,如果__new__只调用了一次,就会得到一个对象__new__(cls[,...])当继承一个不可修改的类,但又想去修改的时候,需要重写__new__方法>>>classCapstr(str):#str是一个不可修改的类def__ne
系统 2019-09-27 17:47:23 2383
在使用python做爬虫的过程中,有些页面的的部分数据是通过js异步加载的,js调用接口的请求中有时还带有些加密的参数很难破解无法使用requests这样的包直接爬取数据,因此需要借助seleniu来完成js的自动加载。通过selenium模拟浏览器的真是操作来获取页面中的所有请求,并且可以查找到一下页面上一些隐藏的元素,这些元素在html源码中无法看到,并且和能通过xpath和正则来捕获,因此需要使用selenium来查找隐藏元素,例如视频网站的播放按钮
系统 2019-09-27 17:57:29 2382
原文链接:https://gitbook.cn/m/mazi/activity/5d52baeaac15fd68e9f78297?utm_source=tw190815_501我毕业六年了,但与技术和Python相关的工作经验也就两年。今天我想跟大家分享自己转行的故事,希望能够鼓励那些跟我一样的朋友共同前行。我们将会聊到我个人的经历和入行故事,个人的技术成就,我2019年上半年和下半年的工作重点,讨论快速学习的方法,最后推荐一些学习资源。01个人简介和经历
系统 2019-09-27 17:56:14 2382
Sys.path指定用于模块搜索路径的字符串列表也可以通过sys模块的append方法在Python环境中增加搜索路径。Sys.path.append(‘/usr/bin/')/usr/lib64/python2.6python模块默认存放路径.pyc是一种二进制文件,是由py文件经过编译后生成的文件,加载的速度有所提高,且为加密文件,有利于保密。1:简单安全的方法,是在sys.path的某个目录下添加路径配置文件,最常见的就是在…/site-packag
系统 2019-09-27 17:55:58 2382
没啥说的,直接上代码。。。#!/usr/bin/envpython3#-*-coding:utf-8-*-importxlwtimporttimeimportrandombook=xlwt.Workbook(encoding='utf-8')sheet=book.add_sheet('sheet1',cell_overwrite_ok=True)row_col_list=[9,10]defset_title():title_kwgs={"colnum1":
系统 2019-09-27 17:54:59 2382
有时候我们需要把一些经典的东西收藏起来,时时回味,而Coursera上的一些课程无疑就是经典之作。Coursera中的大部分完结课程都提供了完整的配套教学资源,包括ppt,视频以及字幕等,离线下来后会非常便于学习。很明显,我们不会去一个文件一个文件的下载,只有傻子才那么干,程序员都是聪明人!那我们聪明人准备怎么办呢?当然是写一个脚本来批量下载了。首先我们需要分析一下手工下载的流程:登录自己的Coursera账户(有的课程需要我们登录并选课后才能看到相应的资
系统 2019-09-27 17:54:49 2382
Docker其实有两个重要的概念:"Docker客户端"和"Docker守护进程"Docker服务端提供了一系列RESTAPI(DockerRemoteAPI),当我们敲docker命令时实际上是通过API和Docker服务端进行交互的。我们可以自己编写Docker客户端,调用RESTAPI和Docker服务端进行交互。Docker官方提供了Python和Go的SDK,当然我们可以自己用熟悉的语言调用RESTAPI的方式。官方文档地址:https://do
系统 2019-09-27 17:54:20 2382
1.安装Python2.安装VScode3.在VScode中安装Python插件Ctrl+shift+X:Python/按喜好安装,其实装第一个或者第二个就可以了4.配置Python运行环境ctrl+shift+B://配置task.json{"version":"2.0.0","tasks":[{"label":"python","type":"shell","command":"python","args":["${file}"],"group":{"
系统 2019-09-27 17:53:49 2382
print("请输入一个数字:")num=int(input())ifnum%2==0:print("偶数")else:print("奇数")ifnum%3==0:print("被3整除")ifnum%5==0:print("被5整除")ifnum%7==0:print("被7整除")请输入一个数字:35奇数被5整除被7整除print("请输入一个数字:")num=int(input())ifnum%2==0:print("偶数")else:print("
系统 2019-09-27 17:50:52 2382
在Python中,很多对象都是可以通过for语句来直接遍历的,例如list、string、dict等等,这些对象都可以被称为可迭代对象。至于说哪些对象是可以被迭代访问的,就要了解一下迭代器相关的知识了。迭代器迭代器对象要求支持迭代器协议的对象,在Python中,支持迭代器协议就是实现对象的__iter__()和next()方法。其中__iter__()方法返回迭代器对象本身;next()方法返回容器的下一个元素,在结尾时引发StopIteration异常。
系统 2019-09-27 17:45:46 2382
Python时间日期转换在开发中是非常高频的一个操作,你经常会遇到需要将字符串转换成datetime或者是反过来将datetime转换成字符串。datetime分别提供了两个方法strptime和strftime,但是我们老是被这两个方法搞混,不知道哪个是字符串转datetime,哪个是datetime转字符串,每次都要去百度Google一下,或者跑去查个文档。其实,这两个方法可以稍微用点技巧把这两个方法记住,而且是永远的记住。strptimestrpti
系统 2019-09-27 17:38:34 2382
importrequestsimportreheaders={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/67.0.3396.99Safari/537.36'}data={'cate':'realtimehot'}try:r=requests.get('http://s.weibo.com/top/summary?',
系统 2019-09-27 17:57:08 2381