- 军军小站|张军博客
搜索到与相关的文章
Python

深入了解python中元类的相关知识

类也是对象在大多数编程语言中,类就是一组用来描述如何生成一个对象的代码段,在python中也是成立的。classObjectCreator:passmy_object=ObjectCreator()print(my_object)"""输出结果:<__main__.ObjectCreatorobjectat0x037DACD0>"""但是,python的类不止于此,类同样也是一种对象。classObjectCreator:pass上面的代码段将在内存中创建

系统 2019-09-27 17:57:17 1919

Python

Python提取文本tf、idf

"""python提取文本的tfidf特征"""importmathfromcollectionsimportCounter#1.语料库corpus=['thisisthefirstdocument','thisisthesecondseconddocument','andthethirdone','isthisthefirstdocument']#2.对语料进行分词word_list=[]foriinrange(len(corpus)):word_lis

系统 2019-09-27 17:57:10 1919

Python

使用Python正则表达式操作文本数据

来源|愿码(ChainDesk.CN)内容编辑愿码Slogan|连接每个程序员的故事网站|http://chaindesk.cn愿码愿景|打造全学科IT系统免费课程,助力小白用户、初级工程师0成本免费系统学习、低成本进阶,帮助BAT一线资深工程师成长并利用自身优势创造睡后收入。官方公众号|愿码|愿码服务号|区块链部落免费加入愿码全思维工程师社群|任一公众号回复“愿码”两个字获取入群二维码本文阅读时长:7min什么是正则表达式正则表达式,是简单地字符的序列,

系统 2019-09-27 17:57:04 1919

Python

Python—对字符编码的初步认识

字符编码Python主要识别文件内容,而不是关心拓展名—>解释器例:cmd中输入pythonxxx.txt也能运行显示文本内容字符—>(机器翻译)—>二进制字符如何对应特定数字的标准,这个标准就是字符编码。ASCIIGBKUnicodeUTF-8(UnicodeTransformaFormat)对于英文字符来说,1bytes中文字符,3bytes对于其他偏僻字符,更多的bytes存储>>>b=bytes('城市学院',encoding='utf-8')>>

系统 2019-09-27 17:56:43 1919

Python

Python 文件处理注意事项总结

Python文件处理注意事项总结文件处理在编程中是常见的操作,文件的打开,关闭,重命名,删除,追加,复制,随机读写非常容易理解和使用。需要注意的是文件的安全关闭,采用with语句轻松便捷:withopen(pathname,”r”)asmyfile:do_some_with(myfile)1.CSV的文件处理csv模块可以很好地处理csv文件,而Pandas模块则可以较好的处理大型的csv文件,还可以处理HTML等,并提供分块处理。2.XML的文件处理对于

系统 2019-09-27 17:56:11 1919

Python

浅谈python中的数字类型与处理工具

python中的数字类型工具python中为更高级的工作提供很多高级数字编程支持和对象,其中数字类型的完整工具包括:1.整数与浮点型,2.复数,3.固定精度十进制数,4.有理分数,5.集合,6.布尔类型7.无穷的整数精度8.各种数字内置函数及模块。基本数字类型python中提供了两种基本类型:整数(正整数金额负整数)和浮点数(注:带有小数部分的数字),其中python中我们可以使用多种进制的整数。并且整数可以用有无穷精度。整数的表现形式以十进制数字字符串写

系统 2019-09-27 17:54:10 1919

Python

python粘包问题及socket套接字编程详解

粘包问题TCP协议在传输过程中会出现数据粘包问题讲一下TCP和UDP的区别,都是传数据的协议,没有好坏之说,只是不同的应用需求可能会更好选择哪一个协议TCP:适合传输数量大,需要建立连接,会出现粘包问题,粘包问题可以解决,确定传入的长度,接收同样长度就可以保证一次性传输完UDP:适合传输数据量小,没有粘包,不需要连接,一次性传输,下一次就是新的数据,弊端就是数据丢失,不安全QQ是用什么协议呢?按理应该可以用UDP协议,但是实际用的是TCP协议,这是历史遗留

系统 2019-09-27 17:53:03 1919

Python

python网络爬虫——正则解析

-re.I#忽略大小写-re.M#多行匹配,将正则作用到源数据的每一行-re.S#单行匹配,将正则作用到整个源数据,输出一个整体字符串(包括换行符也打印)string='''fallinlovewithyouiloveyouverymuchilovesheiloveher'''#去除以i开头的每一行数据re.findall('^i.*',string,re.M)['iloveyouverymuch','iloveshe','iloveher']#匹配全部行

系统 2019-09-27 17:51:20 1919

Python

Python中尝试多线程编程的一个简明例子

综述多线程是程序设计中的一个重要方面,尤其是在服务器Deamon程序方面。无论何种系统,线程调度的开销都比传统的进程要快得多。Python可以方便地支持多线程。可以快速创建线程、互斥锁、信号量等等元素,支持线程读写同步互斥。美中不足的是,Python的运行在Python虚拟机上,创建的多线程可能是虚拟的线程,需要由Python虚拟机来轮询调度,这大大降低了Python多线程的可用性。希望高版本的Python可以解决这个问题,发挥多CPU的最大效率。网上有些

系统 2019-09-27 17:50:36 1919

Python

python2和python3实现在图片上加汉字的方法

python2和python3实现在图片上加汉字,最主要的区别还是内部编码方式不一样导致的,在代码上表现为些许的差别。理解了内部编码原理也就不会遇到这些问题了,以下代码是在WIN10系统上时测好用的。Python2在图片上加汉字代码实现#-*-coding:cp936-*-importcv2importnumpyasnpfromPILimportImage,ImageDraw,ImageFontdefID_2_Word(txt):tmp_ID=txt.sp

系统 2019-09-27 17:50:33 1919