编程技术

【Lucene3.0 初窥】索引文件格式(4):dictionar

Terms数据磁盘文件存储细节从这篇开始,已经涉及到倒排索引表的信息存储问题了。我们都知道倒排索引表中的Dictionary有许多不同的terms组成,Lucene关于这些terms数据的存储,就放在磁盘的.tii和.tis文件中。★.tii词典索引文件.tis词典数据文件1、tii保存了tis中每隔IndexInterval个词的位置信息,这是为了加快对词典文件tii中词的查找速度具体结构如下:TermInfoIndex(.tii)-->TIVersio

系统 2019-08-29 21:59:40 1908

Python

python学习笔记之异常处理

try:print('1111')#1/0print('2222')#name#2+'3'#[][3]#{}['k']ret=int(input('number>>>'))print(ret*'*')exceptValueError:print('输入的数据类型有误')exceptException:print('你错了,老铁')else:print('没有异常的时候执行else中的代码')print('===========')deffunc():try

系统 2019-09-27 17:55:50 1907

Python

Python学习笔记之自定义函数用法详解

本文实例讲述了Python学习笔记之自定义函数用法。分享给大家供大家参考,具体如下:函数能提高应用的模块性,和代码的重复利用率。Python提供了许多内建函数,比如print()等。也可以创建用户自定义函数。函数定义函数定义的简单规则:函数代码块以def关键词开头,后接函数标识符名称和圆括号(),任何传入参数和自变量必须放在圆括号中间函数内容以冒号起始,并且缩进若有返回值,Return[expression]结束函数;不带return表达式相当于返回Non

系统 2019-09-27 17:55:25 1907

Python

python判断文件夹内是否存在指定后缀文件的实例

该代码主要是基于python实现判断指定文件夹下是否存在指定后缀的文件。代码如下:importosYour_Dir='你的文件夹/'Files=os.listdir(Your_Dir)forkinrange(len(Files)):#提取文件夹内所有文件的后缀Files[k]=os.path.splitext(Files[k])[1]Str2=['.wav','.mp3','.mp4']iflen(list(set(Str2).intersection(s

系统 2019-09-27 17:54:47 1907

Python

python脚本之一键移动自定格式文件方法实例

前言尝试用python语言写脚本是好的开始,证明我们有了自动化的思想,这对优秀的程序开发人员是很重要的,电子计算机本来就是要减少重复工作的。首先我们要用到python自带的一些包,python语言让人爱不释手的一点,就是它自带了许多简捷迅速的包,堪称攻坚手术刀,用到的包:os(操作系统相关库),shutil(高级的文件,文件夹,压缩包处理模块)。经典的开头#-*-coding:utf-8-*-importosimportshutilimportsystyp

系统 2019-09-27 17:54:28 1907

Python

安装 python virtualenv 虚拟环境

1.工具包安装pipinstallvirtualenv|sudoapt-getinstallpython-virtualenv2.创建虚拟环境#virtualenv/system_python_bin_path/your_virenv_local_pathvirtualenv-p/usr/bin/python2.7/usr_local_path#创建链接sudoln-sf/usr_local_path/bin/activatetf_activatesudo

系统 2019-09-27 17:54:23 1907

Python

利用python获取当前日期前后N天或N月日期的方法示例

前言最近因为工作原因,发现一个Python的时间组件,很好用分享出来!(忘记作者名字了,在这里先感谢了),下面话不多说,来一起看看详细的介绍吧。示例代码:#-*-coding:utf-8-*-'''获取当前日期前后N天或N月的日期'''fromtimeimportstrftime,localtimefromdatetimeimporttimedelta,dateimportcalendaryear=strftime("%Y",localtime())mon

系统 2019-09-27 17:54:18 1907

Python

Python标准库内置函数complex介绍

本函数可以使用参数real+imag*j方式创建一个复数。也可以转换一个字符串的数字为复数;或者转换一个数字为复数。如果第一个参数是字符串,第二个参数不用填写,会解释这个字符串且返回复数;不过,第二个参数不能输入字符串方式,否则会出错。real和imag参数可以输入数字,如果imag参数没有输入,默认它就是零值,这个函数就相当于int()或float()的功能。如果real和imag参数都输入零,这个函数就返回0j。有了这个函数,就可以很方便地把一个列表转

系统 2019-09-27 17:53:57 1907

Python

简单了解Python3里的一些新特性

概述到2020年,Python2的官方维护期就要结束了,越来越多的Python项目从Python2切换到了Python3。其实在实际工作中,很多伙伴都还是在用Python2的思维写Python3的代码。给大家总结一下Python3一些新的更方便的特性!希望你们看完后也能高效率的编写代码f-strings(3.6+)在Python里面,我们经常使用format函数来格式化字符串,例如:user="JaneDoe"action="buy"log_message

系统 2019-09-27 17:53:11 1907

Python

python实现中文繁体和中文简体之间的相互转换的代码

在学习过程中,把开发过程中重要的一些内容备份一下,下面内容是关于python实现中文繁体和中文简体之间的相互转换的内容,应该是对码农们有所好处。#转换繁体到简体line=Converter('zh-hans').convert(line.decode('utf-8'))line=line.encode('utf-8')#转换简体到繁体line=Converter('zh-hant').convert(line.decode('utf-8'))line=li

系统 2019-09-27 17:52:50 1907

Python

Python Web Flask源码解读(四)——全局变量

关于我一个有思想的程序猿,终身学习实践者,目前在一个创业团队任teamlead,技术栈涉及Android、Python、Java和Go,这个也是我们团队的主要技术栈。Github:https://github.com/hylinux1024微信公众号:终身开发者(angrycode)Flask中全局变量有current_app、request、g和session。不过需要注意的是虽然标题是写着全局变量,但实际上这些变量都跟当前请求的上下文环境有关,下面一起

系统 2019-09-27 17:52:40 1907

Python

Python语法分析之字符串格式化

前序Thereshouldbeone-andpreferablyonlyone-obviouswaytodoit.――――theZenofPython意译:Python提倡用一种,而且最好是只有一种方法来完成一件事虽然Python有以上的提倡,但却在字符串格式化方面,没有做到这一点。字符串格式化敲黑板,划重点:在Python中有至少三种常见方式实现字符串格式化:%-formatting格式(Python2.6以前,推荐输出时使用)str.format()格

系统 2019-09-27 17:52:21 1907

Python

Python3快速入门(七)——Python3正则表达式

Python3快速入门(七)——Python3正则表达式1、re模块简介re模块提供Perl风格的正则表达式模式,使Python语言拥有全部的正则表达式功能。2、正则表达式模式模式字符串使用特殊的语法来表示一个正则表达式:正则表达式模式中的字母和数字匹配同样的字符串;多数字母和数字前加一个反斜杠时会有不同的含义;标点符号通常有特殊的含义,只有被转义时才匹配自身;反斜杠本身需要使用反斜杠转义。^匹配字符串的开头$匹配字符串的末尾.匹配任意字符,除了换行符,当

系统 2019-09-27 17:51:33 1907

Python

python实现关键词提取的示例讲解

新人小菜鸟又来写博客啦!!!没人表示不开心~~(>_<)~~今天我来弄一个简单的关键词提取的代码文章内容关键词的提取分为三大步:(1)分词(2)去停用词(3)关键词提取分词方法有很多,我这里就选择常用的结巴jieba分词;去停用词,我用了一个停用词表。具体代码如下:importjiebaimportjieba.analyse#第一步:分词,这里使用结巴分词全模式text='''新闻,也叫消息,是指报纸、电台、电视台、互联网经常使用的记录社会、传播信息、反映

系统 2019-09-27 17:51:23 1907