- 军军小站|张军博客
搜索到与相关的文章
Python

python获取txt文件词向量过程详解

在读取https://github.com/Embedding/Chinese-Word-Vectors中的中文词向量时,选择了一个有3G多的txt文件,之前在做词向量时用的是word2vec,所以直接导入模型然后indexword即可。因为这是一个txt大文件,尝试了DataFrame,np.loadtxt等,都没有成功,其中主要遇到的问题是:如何读取完整的大文件,而不会出现内存不足memeryerror等问题将读取出来的文件,保存为npy文件根据词找到

系统 2019-09-27 17:47:39 2008

Python

python命名空间(namespace)简单介绍

命名空间:每一个作用域变量存储的位置,或者解释为存储作用域中变量的字典。作用:获取想查看某个作用域中的变量名、变量值。使用方法:locals()#当前命名空间1.效果图:2.代码a=10b=20#定义一个变量接收全局命名空间里的变量名、变量值global_namespace=locals()print(global_namespace)print('\n\n\n')defone():c=30d=40#定义一个变量接收局部命名空间里的变量名、变量值local

系统 2019-09-27 17:47:13 2008

Python

python-docx

基础使用1.创建一个document文档对象fromdocximportDocumentdocument=Document()2.向文档中添加段落添加一段话:paragraph=document.add_paragraph('Loremipsumdolorsitamet.')(调用后会返回一个Paragraphs段落对象的引用)可将上面返回的对象作为一个游标,在已有段落之前加入:prior_paragraph=paragraph.insert_paragr

系统 2019-09-27 17:46:12 2008

Python

Python注释详解

注释用于说明代码实现的功能、采用的算法、代码的编写者以及创建和修改的时间等信息。注释是代码的一部分,注释起到了对代码补充说明的作用。Python注释Python单行注释以#开头,单行注释可以作为单独的一行放在被注释的代码行之上,也可以放在语句或者表达式之后。#Giveyouachancetoletyouknowmeprint("Giveyouachancetoletyouknowme")say_what="thisisademo"#attheendofal

系统 2019-09-27 17:38:34 2008

Python

python 采集中文乱码问题的完美解决方法

近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录1.在正常情况下..可以用importchardetthischarset=chardet.detect(strs)["encoding"]来获取该文件或页面的编码方式或直接抓取页面的charset=xxxx来获取2.遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理.st

系统 2019-09-27 17:38:01 2008

Python

Python中Scrapy爬虫图片处理详解

下载图片下载图片有两种方式,一种是通过Requests模块发送get请求下载,另一种是使用Scrapy的ImagesPipeline图片管道类,这里主要讲后者。安装Scrapy时并没有安装图像处理依赖包Pillow,需手动安装否则运行爬虫出错。首先在settings.py中设置图片的存储路径:IMAGES_STORE='D:/'图片处理相关的选项还有:#图片最小高度和宽度设置,可以过滤太小的图片IMAGES_MIN_HEIGHT=110IMAGES_MIN

系统 2019-09-27 17:37:58 2008

Python

Python requests 处理返回的JSON格式数据

参考:JSON响应内容Requests中也有一个内置的JSON解码器,助你处理JSON数据:>>>importrequests>>>r=requests.get('https://api.github.com/events')>>>r.json()[{u'repository':{u'open_issues':0,u'url':'https://github.com/...如果JSON解码失败,r.json()就会抛出一个异常。例如,响应内容是401(Un

系统 2019-09-27 17:37:43 2008

Python

Python Tkinter GUI编程入门介绍

一、Tkinter介绍Tkinter是一个python模块,是一个调用Tcl/Tk的接口,它是一个跨平台的脚本图形界面接口。Tkinter不是唯一的python图形编程接口,但是是其中比较流行的一个。最大的特点是跨平台,缺点是性能不太好,执行速度慢。一般使用Tkinter的方法是:FromTkinterimport*或者:importTkinter两者的区别我们前面讲模块的时候已经说过了。二、Tkinter的使用先看一下GUI程序的开发,熟悉MFC的朋友应

系统 2019-09-27 17:37:37 2008

编程技术

网盘工具比较,以及自己开发的网盘工具[转]

从自己的观点看,网盘有这么几个好处:1.可以将重要文件备份到"云"上,防止硬盘崩溃造成数据丢失.对于google,microsoft提供的存储空间来说,他们的安全性,稳定性要远远高于自己的硬盘存储器.从这个角度来说,实际上是给自己的数据一个更安全的家.2.可以随时随地访问需要的文件.估计大家都有带着U盘、移动硬盘到处拷文件的经历,在家里写了某个文档,拿到公司再改改,又带回家……拷来拷去,最后哪个是最新的都分不清了.但有了网盘这类的工具,其实可以抛弃U盘.因

系统 2019-08-29 23:31:48 2008

编程技术

Extjs4---column布局

Column布局一般被称为列布局,这种布局的目的是为了创建一个多列的格式。其中每列的宽度,可以为其指定一个百分比或者是一个固定的宽度。Ext.application({name:'column',launch:function(){Ext.create('Ext.panel.Panel',{title:'column布局',width:500,height:300,x:30,y:50,//布局为c

系统 2019-08-29 23:20:07 2008