作者:LogM本文原载于https://segmentfault.com/u/logm/articles,不允许转载~1.源码来源TextRank4ZH源码:https://github.com/letiantian/TextRank4ZH.git本文对应的源码版本:committedon3Jul2018,fb1339620818a0b0c16f5613ebf54153faa41636TextRank论文地址:https://www.aclweb.org/
系统 2019-09-27 17:50:38 2051
最简单的网页取源(不用模拟浏览器的情况)1importrequests2defgetHTML(url):3try:4r=requests.get(url,timeout=30)5r.raise_for_status()6r.encoding='utf-8'7returnr.text8except:9return""10url="http://baidu.com"11print(getHTML(url))
系统 2019-09-27 17:50:19 2051
本文实例讲述了python批量图片处理。分享给大家供大家参考,具体如下:#!/usr/bin/python#coding:utf-8importosfromPILimportImage#源目录MyPath='C:/Users/Eric/Desktop/python_text/20161214/test_Image/'#输出目录OutPath='C:/Users/Eric/Desktop/python_text/20161214/outpath/'defpr
系统 2019-09-27 17:50:00 2051
一、安装一般使用cmd安装就可以手动安装通过下载方式django官方网站:https://www.djangoproject.com/python官方仓库:https://pypi.python.org/pypi/Django二、配置使用1、通过cmd新建一个项目,我是在桌面新建上面命令会在桌面新建pythonDjango文件夹,在里面会生成如下图两个文件manage.py:命令行工具,可以用多种方式与该django项目进行交互;在pythonDjango
系统 2019-09-27 17:49:45 2051
1.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。file_object=open('thefile.txt')try:all_the_text=file_object.read()finally:file_object.close()注:不能把open语句放在try块里,因为当打开文件出现异常时,文件对象file_object无法执行close()方法。2.读文件读文本
系统 2019-09-27 17:49:43 2051
文章目录遍历列表深入的了解循环在for循环中执行更多的操作在for循环后结束执行一些操作避免缩进错误忘记缩进忘记缩进额外的代码行不必要的缩进循环后不必要的缩进遗漏了冒号小插曲创建数值列表使用函数range()使用range()创建数字列表对数字列表执行简单的统计计算列表解析小插曲使用列表的一部分切片遍历切片复制列表小插曲元组定义元组遍历元组中的所有值修改元组变量小插曲设置代码格式格式指南缩进行长空行小插曲遍历列表通俗易懂地来说,遍历列表就是把你列表中的每个
系统 2019-09-27 17:48:49 2051
王者荣耀这么久了,还没上王者?哈哈哈,看过来,是不是对英雄理解的不够透彻呢,是不是还没有很好的为英雄分类呢,今天就来看看英雄分类技术栈一、EM聚类简介二、爬取网上的英雄初始属性值三、做成饼图EM聚类简介EM英文名是ExpectationMaximization,也叫最大期望算法。在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVari
系统 2019-09-27 17:48:38 2051
因为盘搜搜索出来的链接有很多已经失效了,影响找数据的效率,因此想到了用爬虫来过滤出有效的链接,顺便练练手~这是本次爬取的目标网址http://www.pansou.com,首先先搜索个python,之后打开开发者工具,可以发现这个链接下的json数据就是我们要爬取的数据了,把多余的参数去掉,剩下的链接格式为http://106.15.195.249:8011/search_new?q=python&p=1,q为搜索内容,p为页码以下是代码实现:import
系统 2019-09-27 17:48:14 2051
Shellshell获取文件最后修改时间的秒时间戳:stat-c%Y$path/$newest_logshell获取当前时间的秒时间戳:date+%s两个时间戳相减:timegap=$[$timestamp-$filetimestamp]将日期时间字符串转化为时间戳:date-d"2019-08-26"+%s将时间戳转化为日期时间字符串:date-d@1566748800获取n天前的日期时间:date-d"1dayago"+"%Y-%m-%d"获取n分钟前
系统 2019-09-27 17:48:12 2051
maketrans()方法返回的字符串intab每个字符映射到字符的字符串outtab相同位置的转换表。然后这个表被传递到translate()函数。注意:两个intab和outtab必须具有相同的长度。语法以下是maketrans()方法的语法:str.maketrans(intab,outtab]);参数intab--这是实际字符的字符串。outtab--这是相应的映射的字符的字符串。返回值此方法返回时使用转换表translate()函数。例子下面的例
系统 2019-09-27 17:47:11 2051