原文链接:http://blog.fenlanli.com/articles/2019/08/21/1566381374515.htmlpython文件类型.py文件以.py为扩展名的文件是python代码源文件,可以直接看到代码,由python解释器执行。.pyc以.pyc为扩展名的文件是代码源文件经过编译后的文件。其执行速度比py文件快。进行简单编译,并未加密,反编译可以得到源代码。.pyw.pyw文件其本质上和.pyc文件是一质的。区别在于执行.py
系统 2019-09-27 17:53:42 2847
《python源码剖析》阅读笔记第一章python的内建对象python中一切都是对象。在PyIntObject中定义了很多函数指针,这些函数指针对应着类型对象所定义的操作。其中有三组非常重要的操作族,tp_as_number,tp_as_sequence,tp_as_mapping,分别对应着PyNumberMethods,PySequenceMethods,PyMappingMethods函数族,这三个函数都是分别定义着一个整数对象、序列对象、关联对象
系统 2019-09-27 17:47:16 2845
注释在python中的numpy.random.randint(a,b)用于生成一个指定范围内的c行d列的整数矩阵。其中参数a是下限,参数b是上限,生成的随机数矩阵n:a<=n<=b。前提是必须importnumpy,如果直接importrandom后调用random.randint()并且尝试输入size1参数,会出现以下错误:Traceback(mostrecentcalllast):File"Untitled2.py",line7,inrandom.
系统 2019-09-27 17:54:58 2843
在机器学习或者深度学习中,我们常常碰到一个问题是数据集的切分。比如在一个比赛中,举办方给我们的只是一个带标注的训练集和不带标注的测试集。其中训练集是用于训练,而测试集用于已训练模型上跑出一个结果,然后提交,然后举办方验证结果给出一个分数。但是我们在训练过程中,可能会出现过拟合等问题,会面临着算法和模型的选择,此时,验证集就显得很重要。通常,如果数据量充足,我们会从训练集中划分出一定比例的数据来作为验证集。每次划分数据集都手动写一个脚本,重复性太高,因此将此
系统 2019-09-27 17:54:53 2843
写了一段时间java切回写python偶尔会出现一些小麻烦,比如:在java中自定义对象变成json串很简单,调用一个方法就行,但同样的转换在python中却不太容易实现。在寻找python自定义对象转json串的过程中,接触到了猴子补丁这个东西,感觉还有点意思;本文先实现python自定义对象转json串,再简单谈一下猴子补丁。python自定义对象转json串python自带的json包不支持自定义对象转json串,在python中用json.dump
系统 2019-09-27 17:56:00 2841
在编程中我们往往会希望能够实现这样的操作:点击Button,选择了图片,然后在窗口中的Label处显示选到的图片。那么这时候就需要如下代码:fromtkinterimport*fromtkinter.filedialogimportaskopenfilenamedefchoosepic():path_=askopenfilename()path.set(path_)img_gif=Tkinter.PhotoImage(file='xxx.gif')l1.c
系统 2019-09-27 17:52:25 2839
生成词云主要使用了itchat、jieba、wordcloud这三个依赖库itchatitchat是一个开源的微信个人号接口,使用python调用微信从未如此简单。jieba“结巴”中文分词:做最好的Python中文分词组件wordcloud词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。相关的使用、API可以点击上面链接进行查看首先我们得安装这三个
系统 2019-09-27 17:46:24 2839
某位A同学发了我一张截图,问为何结果中出现了负数?看了图,我第一感觉就是数据溢出了。数据超出能表示的最大值,就会出现奇奇怪怪的结果。然后,他继续发了张图,内容是print(100000*208378),就是直接打印上图的E[0]*G[0],结果是20837800000,这是个正确的结果。所以新的问题是:如果说上图的数据溢出了,为何直接相乘的数却没有溢出?由于我一直忽视数据的表示规则(整型的上限是多少?),而且对Numpy了解不多,还错看了图中结果,误以为每
系统 2019-09-27 17:47:03 2835
正则表达式是一个特殊的字符序列,可以帮助您使用模式中保留的专门语法来匹配或查找其他字符串或字符串集。正则表达式在UNIX世界中被广泛使用。下面给大家介绍下Python使用正则表达式去除(过滤)HTML标签提取文字,具体代码如下所示:#-*-coding:utf-8-*-importre##过滤HTML中的标签#将HTML中标签等信息去掉#@paramhtmlstrHTML字符串.deffilter_tags(htmlstr):#先过滤CDATAre_cda
系统 2019-09-27 17:52:17 2834
coco数据集大概有8w张以上的图片,而且每幅图都有精确的边缘mask标注。后面后分享一个labelme标注的json或xml格式转二值图的源码(以备以后使用)而我现在在研究显著性目标检测,需要的是边缘mask的二值图像。搜了很久,并没有人做过这种工作,只能得到如下的掩膜图而我需要的图像为二值图,如下说下我的过程并附上代码:首先,coco数据集将所有的8w多张图片标注信息整合到一个json文件中,所以我们需要将单张图片标注信息json文件提取出来,以下是批
系统 2019-09-27 17:45:26 2833
中文文本中可能出现的标点符号来源比较复杂,通过匹配等手段对他们处理的时候需要格外小心,防止遗漏。以下为在下处理中文标点的时候采用的两种方法:中文标点集合比较常见标点有这些:!?。"#$%&'()*+,-/:;<=>@[\]^_`{|}~⦅⦆「」、、〃》「」『』【】〔〕〖〗〘〙〚〛〜��〟〰〾〿�C―‘'‛“”„‟…‧�n.调用zhon包的zhon.hanzi.punctuation函数即可得到这些中文标点。如果想用英文的标点,则可调用string包的str
系统 2019-09-27 17:51:12 2831
importosfile=open("a.txt","r")file_add=open("a.txt","r")content=file.read()content_add=file_add.read()pos=content.find("buildTypes")ifpos!=-1:content=content[:pos]+content_add+content[pos:]file=open("a.txt","w")file.write(content)
系统 2019-09-27 17:54:28 2829
求解给定数字的阶乘是非常简单的一件事,用Python来实现也是非常简单的,这里的问题是给你一堆连续数字,求解他们的阶乘总和,这里我一共想到了4种不同的实现方法来解决上述问题,并对其做了扩充,上面是连续数字的阶乘和,我给的方法只需要稍加修改同样可以求解不连续数字的阶乘和,下面是具体的实现:#!usr/bin/envpython#encoding:utf-8from__future__importdivision'''__Author__:沂水寒城功能:Pyt
系统 2019-09-27 17:53:10 2829
#简单的人工神经网络(ANN)设计```pythonimportnumpyasnpimportmatplotlib.pyplotasmpclassANNModel():def__init__(self):#随机初始化权重[-11)self.w0=2*np.random.random((2,4))-1self.w1=2*np.random.random((4,1))-1#学习率self.lrate=0.1#sigmiod函数defactive(self,x)
系统 2019-09-27 17:45:51 2827
需求就是把关卡内的代码稍作修改,将周杰伦前五页歌曲的歌词都爬取下来,结果就是全部展示打印出来。URL:https://y.qq.com/portal/search.html#page=1&searchid=1&remoteplace=txt.yqq.top&t=lyric&w=%E5%91%A8%E6%9D%B0%E4%BC%A6importrequestssinger=input('你想查询哪位歌手的名字?')foriinrange(1,6):res=r
系统 2019-09-27 17:53:41 2824