1.说明本篇主要针对在Ubuntu系统中,matplotlib显示不了中文的问题,尤其是在无法安装系统字体的情况下,解决Python绘图时中文显示的问题。2.在系统中安装字体$fc-list:lang=zh#查看中文字体名称及其安装路径,相对于英文字体,中文字体文件一般较大。如果无中文字体,可使用apt-get安装,具体方法如下:$apt-cachesearchfont|grepChinese#查看可安装的中文字体$sudoapt-getinstallfo
系统 2019-09-27 17:54:48 2147
原文链接:https://www.liaoxuefeng.com/wiki/1016959663602400/1017075323632896注:本篇博客是学习廖雪峰老师网站的摘抄,是为了方便以后的学习。如有侵权,请联系删除!联系邮箱:1103540209@qq.com文章目录1.字符编码2.Python的字符串3.格式化format()4.小结5.参考1.字符编码我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题。因为计算机
系统 2019-09-27 17:52:40 2147
问题:用两个栈来实现一个队列,完成队列的Push和Pop操作。分析:栈的特性是“先进后出”,队列为“先进先出”。思路:入队:直接把新元素压入stack1即可。出队:根据队列先进先出的性质,由于先进入队列的元素被压倒stack1的栈底,要想实现先入队列的先出队,需要将stack1中的元素逐个弹出并压入stack2,经过弹出和压入之后最先进入的元素就处于stack2的栈顶,有可以直接弹出。python实现代码:classSolution:def__init__
系统 2019-09-27 17:52:27 2147
阅读更多本文分享自6丁一的猫的博客,主要是python调用hanlp进行命名实体识别的方法介绍。以下为分享的全文。1、python与jdk版本位数一致2、pipinstalljpype1(python3.5)3、类库hanlp.jar包、模型data包、配置文件hanlp.properties放在一个新建目录4、修改hanlp.properties中root根目录,找到data代码调用如下:1|#coding:utf-82|'''3|Createdon20
系统 2019-09-27 17:52:23 2147
如下所示:importlogging#创建一个loggerlogger=logging.getLogger('mylogger')logger.setLevel(logging.DEBUG)#创建一个handler,用于写入日志文件fh=logging.FileHandler('test.log')fh.setLevel(logging.DEBUG)#再创建一个handler,用于输出到控制台ch=logging.StreamHandler()ch.set
系统 2019-09-27 17:51:25 2147
好书推荐、视频分享,公众号"读书ReadBook"与您一起进步下载地址……1、点击阅读原文或者地址https://ebooklist.mobi/2019/05/20/6465.html2、回复关键字11730直接获取下载链接,好书推荐、视频分享,公众号"读书ReadBook"与您一起进步图书简介……本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了
系统 2019-09-27 17:51:09 2147
这里给大家分享几个面试时遇到的趣味性比较浓厚的题目,答案呢也是个人的理解,不足的地方,还望大家指出!1、25匹马,有一条只能5匹马比赛的赛道,我们无法计时,只能看到马的排名,如何用最短的次数找出跑的最快的5匹马?这道题目的话最好的情况是7次,最坏的情况是10次。我们首先建立一个表格,先把25匹马分为如下的五组:每组进行比赛,假设第一组快慢顺序为A1、A2、A3、A4和A5,第二组依次类推。那么各组的第一分别是A1、B1、C1、D1、E1。在最好的情况下,先
系统 2019-09-27 17:50:54 2147
今天主要是来说一下怎么可视化来监控你的爬虫的状态。相信大家在跑爬虫的过程中,也会好奇自己养的爬虫一分钟可以爬多少页面,多大的数据量,当然查询的方式多种多样。今天我来讲一种可视化的方法。关于爬虫数据在mongodb里的版本我写了一个可以热更新配置的版本,即添加了新的爬虫配置以后,不用重启程序,即可获取刚刚添加的爬虫的状态数据。1.成品图这个是监控服务器网速的最后成果,显示的是下载与上传的网速,单位为M。爬虫的原理都是一样的,只不过将数据存到InfluxDB的
系统 2019-09-27 17:50:52 2147
(1)在校大学生。最好是数学或计算机相关专业,编程能力还可以的话,稍微看一下爬虫知识,主要涉及一门语言的爬虫库、html解析、内容存储等,复杂的还需要了解URL排重、模拟登录、验证码识别、多线程、代理、移动端抓取等。由于在校学生的工程经验比较少,建议找一些少量数据抓取的项目,而不要去接一些监控类的项目、或大规模抓取的项目。慢慢来,步子不要迈太大。(2)在职人员。如果你本身就是爬虫工程师,挣钱很简单。如果你不是,也不要紧。只要是做IT的,稍微学习一下爬虫应该
系统 2019-09-27 17:49:59 2147
字符串在Python中创建字符串对象非常容易。只要将所需的文本放入一对引号中,就完成了一个新字符串的创建(参见清单1)。如果稍加思考的话,您可能会感到有些困惑。毕竟,有两类可以使用的引号:单引号(')和双引号(")。幸运的是,Python再一次使这种问题迎刃而解。您可以使用任意一类引号来表示Python中的字符串,只要引号一致就行。如果字符串是以单引号开始,那么必须以单引号结束,反之亦然。如果不遵循这一规则,则会出现SyntaxError异常。清单1.在P
系统 2019-09-27 17:49:48 2147