近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录1.在正常情况下..可以用importchardetthischarset=chardet.detect(strs)["encoding"]来获取该文件或页面的编码方式或直接抓取页面的charset=xxxx来获取2.遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理.st
系统 2019-09-27 17:38:01 2145
一旦你创建一个Template对象,你可以用context来传递数据给它。一个context是一系列变量和它们值的集合。context在Django里表现为Context类,在django.template模块里。她的构造函数带有一个可选的参数:一个字典映射变量和它们的值。调用Template对象的render()方法并传递context来填充模板:>>>fromdjango.templateimportContext,Template>>>t=Templ
系统 2019-09-27 17:37:55 2145
提供视图配置选项如果你发布一个Django的应用,你的用户可能会希望配置上能有些自由度。这种情况下,为你认为用户可能希望改变的配置选项添加一些钩子到你的视图中会是一个很好的主意。你可以用额外URLconf参数实现。一个应用中比较常见的可供配置代码是模板名字:defmy_view(request,template_name):var=do_something()returnrender_to_response(template_name,{'var':var
系统 2019-09-27 17:37:44 2145
最近做一个的GUI,因为调用了os模块里的system方法,使用pyinstaller打包的时候选择不输出系统命令弹框,程序无法运行,要求要有系统命令框。在网上找到一个解决办法。使用subprocess.run()方法。这里有一个简单的例子:fromtimeimportsleepfromsubprocessimportrunforiinrange(10):sleep(1)run("tree",shell=True)#因为没有弹框,这部分用来验证程序是否执行
系统 2019-09-27 17:57:29 2144
一基本概念1并行和并发1并行,parallel同时做某些事,可以互不干扰的同一时刻做几件事如高速公路上的车道,同一时刻,可以有多个互不干扰的车运行在同一时刻,每条车道上可能同时有车辆在跑,是同时发生的概念2并发,concurrency也是同时做某事,但强调的是同一时段做了几件事。并行是可以解决并发问题的。2并发的解决1队列,缓冲区队列:排队就是队列,先进先出,解决了资源使用的问题。缓冲区:排程的队列,其实就是一个缓冲地带,就是缓冲区优先队列:对比较重要的事
系统 2019-09-27 17:57:11 2144
PythonMapMap会将一个函数映射到一个输入列表的所有元素上。Map的规范为:map(function_to_apply,list_of_inputs)大多数时候,我们需要将列表中的所有元素一个个传递给一个函数,并收集输出。例如:items=[1,2,3,4,5]squared=[]foriinitems:squared.append(i**2)使用Map的话,可以让我们以一种更加简便的方法解决这种问题。items=[1,2,3,4,5]square
系统 2019-09-27 17:56:54 2144
Python3.6执行pip3installtesserocrpillow,报错:error:MicrosoftVisualC++14.0isrequired.Getitwith"MicrosoftVisualC++BuildTools":http://landinghub.visualstudio.com/visual-cpp-build-tools解决办法:去下方链接下载匹配版本的whl文件https://github.com/simonfluecki
系统 2019-09-27 17:55:28 2144
爱漂泊人生Python常用库大全,看看有没有你需要的作者:史豹链接:https://www.zhihu.com/question/20501628/answer/223340838来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。环境管理管理Python版本和环境的工具p–非常简单的交互式python版本管理工具。pyenv–简单的Python版本管理工具。Vex–可以在虚拟环境中执行命令。virtualenv–创建独立Pyth
系统 2019-09-27 17:53:52 2144
定义返回单值defmy_abs(x):ifx>=0:returnxelse:return-x返回多值返回多值就是返回一个tupleimportmathdefmove(x,y,step,angle=0):nx=x+step*math.cos(angle)ny=y-step*math.sin(angle)returnnx,ny空函数defnop():pass指定默认参数必选参数在前,默认参数在后。默认参数需指向不可变对象(默认参数值在函数定义时被计算)defp
系统 2019-09-27 17:50:54 2144
一.概述首先需要先介绍一下无监督学习,所谓无监督学习,就是训练样本中的标记信息是位置的,目标是通过对无标记训练样本的学习来揭示数据的内在性质以及规律。通俗得说,就是根据数据的一些内在性质,找出其内在的规律。而这一类算法,应用最为广泛的就是“聚类”。聚类算法可以对数据进行数据归约,即在尽可能保证数据完整的前提下,减少数据的量级,以便后续处理。也可以对聚类数据结果直接应用或分析。而Kmeans算法可以说是聚类算法里面较为基础的一种算法。二.从样例开始我们现在在
系统 2019-09-27 17:50:00 2144
python基础学习笔记(十三)2013-05-2023:10虫师阅读(...)评论(...)编辑收藏re模块包含对正则表达式。本章会对re模块主要特征和正则表达式进行介绍。什么是正则表达式正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。换包话说,正则表达式’python’可以匹配字符串’python’。你可以用这种匹配行为搜索文本中的模式,并且用计算后有值并发特定模式,或都将文本进行分段。**通配符正则表达式可以匹配
系统 2019-09-27 17:48:48 2144
掷骰子骰子类#die.py骰子类模块fromrandomimportrandintclassDie():"""骰子类"""def__init__(self,num_sides=6):"""默认六面的骰子"""self.num_sides=num_sidesdefroll(self):"""掷骰子的方法"""returnrandint(1,self.num_sides)折线图掷骰子#die_visual_plot.py使用plot可视化骰子importmat
系统 2019-09-27 17:48:44 2144
题目描述给定n个字符串,请对n个字符串按照字典序排列。输入描述:输入第一行为一个正整数n(1≤n≤1000),下面n行为n个字符串(字符串长度≤100),字符串中只含有大小写字母。输出描述:数据输出n行,输出结果为按照字典序排列的字符串。示例1输入9captocatcardtwotooupboatboot输出boatbootcapcardcattotootwouppython3代码实现为:n=int(input())word=[]foriinrange(n
系统 2019-09-27 17:48:16 2144
最近开发一套接口,写个Python脚本,使用requests.session模拟一下登录.因为每次需要获取用户信息,登录需要带着session信息,所以所有请求需要带着session。请求使用post方式,请求参数类型为raw方式,参数为json类型。登录接口参数和结果如下:脚本如下:1.引入需要的第三方包#!/usr/bin/envpython3#-*-coding:utf-8-*-importrequests#importreimportjson#fr
系统 2019-09-27 17:47:31 2144
目录一、守护线程1.1详细解释1.2守护线程例11.3守护线程例2一、守护线程无论是进程还是线程,都遵循:守护xx会等待主xx运行完毕后被销毁。需要强调的是:运行完毕并非终止运行。对主进程来说,运行完毕指的是主进程代码运行完毕对主线程来说,运行完毕指的是主线程所在的进程内所有非守护线程统统运行完毕,主线程才算运行完毕1.1详细解释主进程在其代码结束后就已经算运行完毕了(守护进程在此时就被回收),然后主进程会一直等非守护的子进程都运行完毕后回收子进程的资源(
系统 2019-09-27 17:47:07 2144