新人小菜鸟又来写博客啦!!!没人表示不开心~~(>_<)~~今天我来弄一个简单的关键词提取的代码文章内容关键词的提取分为三大步:(1)分词(2)去停用词(3)关键词提取分词方法有很多,我这里就选择常用的结巴jieba分词;去停用词,我用了一个停用词表。具体代码如下:importjiebaimportjieba.analyse#第一步:分词,这里使用结巴分词全模式text='''新闻,也叫消息,是指报纸、电台、电视台、互联网经常使用的记录社会、传播信息、反映
系统 2019-09-27 17:51:23 2061
模块Module定义包含一系列数据、函数、类的文件,通常以.py结尾。作用让一些相关的数据,函数,类有逻辑的组织在一起,使逻辑结构更加清晰。有利于多人合作开发。导入import1.语法:import模块名import模块名as别名2.作用:将某模块整体导入到当前模块中3.使用:模块名.成员fromimport1.语法:from模块名import成员名[as别名1]作用:将模块内的一个或多个成员导入到当前模块的作用域中。fromimport*1.语法:fro
系统 2019-09-27 17:51:00 2061
这里先解释一下几个概念-位置参数:按位置设置的参数,隐式用元组保存对应形参.平时我们用的大多数是按位置传参.比如有函数deffunc(a,b,c),调用func(1,2,3).即a=1,b=2,c=3-关键字参数:可以通过关键字设置参数,不用关心参数位置,隐式用字典保存形参.比如有函数deffunc(a,b,c),调用func(b=1,c=2,a=3),即a=3,b=1,c=2普通格式复制代码代码如下:deffunc(opt_args):...return
系统 2019-09-27 17:50:13 2061
在了解装饰器的之前一定要先了解函数作为参数传递,什么是函数内嵌,请参考我之前写的博客函数简介因为在python里面,函数也是对象,也可以作为参数进行传递.python装饰器本质也是一种特殊函数,它接收的参数是函数对象,然后动态地函数参数添加额外的功能,而不用修改原有的函数对象.python装饰器传入的参数是函数,返回的值也是函数!python装饰器思想有点类似设计模式的装饰模式,其意图是动态地给函数对象添加额外的功能.比如像增加日志打印的功能,有点面向切面
系统 2019-09-27 17:50:12 2061
python自动化批量生成前端的HTML可以大大减轻工作量下面演示两种生成HTML的方法方法一:使用webbrowser#coding:utf-8importwebbrowser#命名生成的htmlGEN_HTML="test.html"#打开文件,准备写入f=open(GEN_HTML,'w')#准备相关变量str1='mynameis:'str2='--MichaelAn--'#写入HTML界面中message="""%s%s"""%(str1,str
系统 2019-09-27 17:49:58 2061
预先设置数字变量age_of_test=25#这里设置为25,也可随意guess_age=int(input("guessage:"))ifguess_age==age_of_test:print("Yes,yougotit!")#判断正确后打印Yes,yougotit!并继续执行命令elifguess_age>age_of_test:print("thinksmaller...")#判断数字小于预定值时提示!else:print("thinkbigger
系统 2019-09-27 17:49:37 2061
一、Python介绍从我开始学习Python时我就决定维护一个经常使用的“窍门”列表。不论何时当我看到一段让我觉得“酷,这样也行!”的代码时(在一个例子中、在StackOverflow、在开源码软件中,等等),我会尝试它直到理解它,然后把它添加到列表中。这篇文章是清理过列表的一部分。如果你是一个有经验的Python程序员,尽管你可能已经知道一些,但你仍能发现一些你不知道的。如果你是一个正在学习Python的C、C++或Java程序员,或者刚开始学习编程,那
系统 2019-09-27 17:47:46 2061
如果给定的键在字典可用,has_key()方法返回true,否则返回false。语法以下是has_key()方法的语法:dict.has_key(key)参数key--这是要搜索在字典中的键。返回值此方法返回true,如果给定键在字典可用,否则返回false。例子下面的例子显示了has_key()方法的使用。#!/usr/bin/pythondict={'Name':'Zara','Age':7}print"Value:%s"%dict.has_key('
系统 2019-09-27 17:46:48 2061
1.从集合中取出最大或最小N个元素importheapqnums=[1,8,2,23,7,-4,18,23,42,37,2]print(heapq.nlargest(3,nums))#输出[42,37,23]print(heapq.nsmallest(3,nums))#输出[-4,1,2]也支持其他参数支持更为复杂的数据结构portfolio=[{'name':'IBM','shares':100,'price':91.1},{'name':'AAPL',
系统 2019-09-27 17:46:30 2061
django在一个项目的目录结构划分方面缺乏必要的规范,因此不同人的项目组织形式也千奇百怪,而且也很难说谁的做法就比较好。我根据自己的项目组织习惯,发布了一个项目dj-scaffold。前些天在reddit上为我的项目dj-scaffold打了个“广告”(见:http://redd.it/kw5d4)。不想评价甚糟,甚至差点被打成负分。其中更也人将这个项目说的一文不值。面对负面声音虽然会有些不爽,但其中的建设性意见还是需要听取的,至于那些纯属个人偏好部分就
系统 2019-09-27 17:46:10 2061
这次只演示了,如何在真实项目内用到BeautifulSoup库来解析网页,而新浪的新闻是ajax加载过来的数据,在这里我们只演示解析部分数据(具体反扒机制没做分析)。代码地址:https://gitee.com/dwyui/BeautifulSoup_xinlang.git。关于的爬虫的博客已经越来越多,使用到的技术也越来越多,后期我还会持续写下去,大概从几个角度去写,多线程爬取(提高效率),如何更好的做到爬取数据(破解反扒)。用redis管理多线程和代理
系统 2019-09-27 17:45:54 2061
1、文件上传(input标签)(1)html代码(form表单用post方法提交)表格(2)jq提交表单到后台$("#submitForm").click(function(){//alert($("#SelectBus").val());addNameForm();//因为是动态加载的表单内容,所以会用函数给所用标签符name值$.ajaxSetup({async:false});$("#picture_form").ajaxSubmit({resetF
系统 2019-09-27 17:38:37 2061
最近做项目见到别人写的一个分页控件不错,记录一下关于路径的问题。一、解决方案二、添加类库项目test三、添加引用System.Web四、test下添加类文件Pagination.cs五、test下添加样式文件Pagination.css(右键此文件--属性--生成操作--嵌入的资源)六、Pagination.cs文件下添加如下内容usingSystem;usingSystem.Text.RegularExpressions;usingSystem.Web;
系统 2019-08-29 22:29:40 2061
图像可能在生成、传输或者采集过程中夹带了噪声,去噪声是图像处理中常用的手法。通常去噪声用滤波的方法,比如中值滤波、均值滤波。但是那样的算法不适合用在处理字符这样目标狭长的图像中,因为在滤波的过程中很有可能会去掉字符本身的像素。一个采用的是去除杂点的方法来进行去噪声处理的。具体算法如下:扫描整个图像,当发现一个黑色点的时候,就考察和该黑色点间接或者直接相连接的黑色点的个数有多少,如果大于一定的值,那就说明该点不是离散点,否则就是离散点,把它去掉。在考察相连的
系统 2019-09-27 17:56:42 2060
最近在用python写接口的测试程序,期间用到解析字典获取某个key的value,由于多个接口返回的字典格式不是固定的并存在多层嵌套的情况。在字典的方法中也没有找到可直接达到目的的方法(也可能是我对字典的方法了解的不深的缘故),于是自己写了个程序。下面是代码#coding:utf-8importtypes#获取字典中的objkey对应的值,适用于字典嵌套#dict:字典#objkey:目标key#default:找不到时返回的默认值defdict_get(
系统 2019-09-27 17:55:32 2060