编程技术

《Introduce to IR》索引创建

该系列文章是《AnIntroducetoInformationRetrieval》Chapter4的读书笔记。对于大规模数据的信息检索,倒排索引的建立其实并没有想象中的那么简单。在实际应用中,倒排索引的建立算法必须考虑到硬件的约束。可以这样说:计算机硬件的参数性能是促动IR系统的设计发展的决定因素。索引创建(Indexconstruction)要点:(1)介绍BSBI算法建立大规模数据的倒排索引(2)分布式索引的建立算法4.1硬件基础介绍下图是2007年典

系统 2019-08-29 21:59:49 2224

Python

Python K最近邻从原理到实现的方法

本来这篇文章是5月份写的,今天修改了一下内容,就成今天发表的了,CSDN这是出BUG了还是什么改规则了。。。引文:决策树和基于规则的分类器都是积极学习方法(eagerlearner)的例子,因为一旦训练数据可用,他们就开始学习从输入属性到类标号的映射模型。一个相反的策略是推迟对训练数据的建模,直到需要分类测试样例时再进行。采用这种策略的技术被称为消极学习法(lazylearner)。最近邻分类器就是这样的一种方法。注:KNN既可以用于分类,也可以用于回归。

系统 2019-09-27 17:56:08 2223

Python

python爬取京东商品评论--jsonpath方法

直接送上代码importurllib.requestimportjsonimportjsonpathimporttimeend_page=int(input('请输入爬取的结束页码:'))foriinrange(0,end_page+1):print('第%s页开始爬取------'%(i+1))url='https://sclub.jd.com/comment/productPageComments.action?callback=fetchJSON_c

系统 2019-09-27 17:54:07 2223

Python

python实现关闭第三方窗口的方法

背景最近在测试一款软件的关闭第三方窗口的功能,感觉实现应该挺简单的。所以就尝试了。由于说它的实现是靠c++实现的,本人对c++实在不在行,但是python的第三方库实际上是封装了一套win32的api的所以我们还是可以依靠python来实现这个的。实现直接贴代码吧很简单#-*-coding:utf-8-*-fromwin32guiimport*importwin32guiimportwin32confromtimeimportsleepdeffoo(hwn

系统 2019-09-27 17:53:51 2223

Python

python字符串Intern机制详解

字符串在Python中是最简单也是最常用的数据类型之一,在CPython中字符串的实现原理使用了一种叫做Intern(字符串驻留)的技术来提高字符串效率。究竟什么是intern机制,这种机制又是通过什么方式来提高字符串效率的呢?希望这篇文章能够抛砖引玉。先来看一段代码:>>>s3="hello!">>>s4="hello!">>>s3iss4False>>>id(s3)80325968L>>>id(s4)80326048Ls3和s4虽然值是一样的,但确确实

系统 2019-09-27 17:52:22 2223

Python

详解python websocket获取实时数据的几种常见链接方式

第一种,使用create_connection链接,需要pipinstallwebsocket-client(此方法不建议使用,链接不稳定,容易断,并且连接很耗时)importtimefromwebsocketimportcreate_connectionurl='wss://i.cg.net/wi/ws'whileTrue:#一直链接,直到连接上就退出循环time.sleep(2)try:ws=create_connection(url)print(ws

系统 2019-09-27 17:52:20 2223

Python

python程序异常崩溃时如何快速分析并解决问题

程序异常崩溃时会提供非常详细的错误信息,掌握正确的分析方法,就可以快速定位问题并解决问题,下面这段代码会引发异常导致程序终止deffunc_tet():func_sum('4',3)deffunc_sum(a,b):value=a+breturnvaluefunc_tet()运行这段程序,异常信息如下我将异常信息分为两部分,分析时,先关注最后一行绿色框内的信息,这里的信息明确的指明了异常的类型和异常的解释信息,这是我们分析问题的第一步,随着经验的积累,你很

系统 2019-09-27 17:52:03 2223

Python

Python 正则表达式匹配数字及字符串中的纯数字

Python正则表达式匹配数字电话号码:\d{3}-\d{8}|\d{4}-\d{7}QQ号:[1-9][0-9]{4,}中国邮政编码:[1-9]\d{5}(?!\d)身份证:\d{15}|\d{18}ip地址:\d+\.\d+\.\d+\.\d+[1-9]\d*正整数-[1-9]\d*负整数-?[1-9]\d*整数[1-9]\d*|0非负整数-[1-9]\d*|0非正整数[1-9]\d*\.\d*|0\.\d*[1-9]\d*$正浮点数-([1-9]\d

系统 2019-09-27 17:50:40 2223

Python

Python列表与元组的异同详解

前言“列表(list)与元组(tuple)两种数据类型有哪些区别”这个问题在初级程序员面试中经常碰到,超出面试官预期的答案往往能加不少印象分,也会给后续面试顺利进行提供一定帮助,这道题主要考察候选人对Python基本数据结构的掌握程度,属于简单类型的送分题,那么该如何来回答才不至于丢分?相同点:都是序列类型回答它们的区别之前,先来说说两者有什么相同之处。list与tuple都是序列类型的容器对象,可以存放任何类型的数据、支持切片、迭代等操作>>>foos=

系统 2019-09-27 17:50:39 2223

Python

解决python多行注释引发缩进错误的问题

如下所示:m_start=date+'09:00'm_end=date+'13:00'rsv_1={'act':'set_resv','dev_id':dev_id,'start':m_start,'end':m_end,}'''rsv_2={'_':'','act':'set_resv','dev_id':dev_id,'start':'2018-05-2113:00','end_time':'','kind_id':'','lab_id':'','me

系统 2019-09-27 17:49:35 2223

Python

Python中输出ASCII大文字、艺术字、字符字小技巧

复制代码代码如下:displaytextinlargeASCIIartfonts显示大ASCII艺术字体这种东西在源码声明或者软件初始化控制台打印时候很有用。例如下图:这是查看HTML源码中截图而来,看到这种字体的网站名称,很cool,下面就介绍一下Python中如何输出这种字符字。复制代码代码如下:$sudoapt-getinstallfiglet$figletorangleliu__________________||___|(_)__/_\|'__/

系统 2019-09-27 17:48:33 2223

Python

Python中列表元素的操作(追加、插入、删除、赋值、排序、拷贝)

一、列表元素的追加和插入append():追加一个元素到列表extend():列表拉伸,追加多个元素到列表insert():在指定索引处插入元素二、列表元素的删除pop(a):弹出列表中索引为a的元素,默认为列表最后一个元素pop()弹出的值可用变量接收remove():删除列表元素del:从内存种删除一个元素三、列表元素的重新赋值1、通过索引,重新赋值2、通过切片赋值四、列表元素的排序x.sort()#列表排序,默认按照ascii排序x.sort(rev

系统 2019-09-27 17:48:02 2223

Python

Python类中的魔法方法之 __slots__

在类中每次实例化一个对象都会生产一个字典来保存一个对象的所有的实例属性,这样非常的有用处,可以使我们任意的去设置新的属性。每次实例化一个对象python都会分配一个固定大小内存的字典来保存属性,如果对象很多的情况下会浪费内存空间。可通过__slots__方法告诉python不要使用字典,而且只给一个固定集合的属性分配空间classFoo(object):__slots__=("x","y","z")def__init__(self,x,y):self.x=

系统 2019-09-27 17:48:00 2223

Python

python的绘图工具matplotlib使用实例

matplotlib是功能十分强大的绘制二维图形的Python模块,它用Python语言实现了MATLAB画图函数的易用性,同时又有非常强大的可定制性。它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。它的文档相当完备,并且Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览、复制、粘贴一下,基本上都能搞定!实例代码如下:

系统 2019-09-27 17:47:56 2223

Python

Python3+Appium实现多台移动设备操作的方法

需求:连接本机的(两台安卓手机)或者本机安装的(安卓模拟器两个),实现同时安装本地apk包。demon.py特别说明:必须写udid才能实现同时对两台以上的移动设备操作。对deviceName中的值进行修改后是无法区分移动设备的,如果只修改deviceName的value就只能在同一台设备上进行安装了。下面代码只是基础介绍,扩展到框架中需要根据自己需求做;importosimportthreadingimportmultiprocessingfromapp

系统 2019-09-27 17:47:46 2223