拥有Python标签的文章
Python

Python搜索引擎实现原理和方法

如何在庞大的数据中高效的检索自己需要的东西?本篇内容介绍了Python做出一个大数据搜索引擎的原理和方法,以及中间进行数据分析的原理也给大家做了详细介绍。布隆过滤器(BloomFilter)第一步我们先要实现一个布隆过滤器。布隆过滤器是大数据领域的一个常见算法,它的目的是过滤掉那些不是目标的元素。也就是说如果一个要搜索的词并不存在与我的数据中,那么它可以以很快的速度返回目标不存在。让我们看看以下布隆过滤器的代码:classBloomfilter(objec

系统 2019-09-27 17:53:09 2370

Python

Python获取时间范围内日期列表和周列表的函数

Python获取时间范围内日期列表和周列表的函数1、获取日期列表#-*-coding=utf-8-*-importdatetimedefdateRange(beginDate,endDate):dates=[]dt=datetime.datetime.strptime(beginDate,"%Y-%m-%d")date=beginDate[:]whiledate<=endDate:dates.append(date)dt=dt+datetime.timed

系统 2019-09-27 17:50:42 2370

Python

一文了解 Elasticsearch 及其与 Python 的对接实现

原文链接:https://blog.csdn.net/wufaliang003/article/details/81368365什么是Elasticsearch想查数据就免不了搜索,搜索就离不开搜索引擎,百度、谷歌都是一个非常庞大复杂的搜索引擎,他们几乎索引了互联网上开放的所有网页和数据。然而对于我们自己的业务数据来说,肯定就没必要用这么复杂的技术了,如果我们想实现自己的搜索引擎,方便存储和检索,Elasticsearch就是不二选择,它是一个全文搜索引擎

系统 2019-09-27 17:50:20 2370

Python

Python学习:异常

文章目录异常的种类异常处理触发异常使用异常避免崩溃else代码块抛出异常处理ZeroDivisionError异常处理FileNotFoundError异常断言异常的种类在python中不同的异常可以用不同的类型(python中统一了类与类型,类型即类)去标识,一个异常标识一种错误常用异常AttributeError试图访问一个对象没有的属性,比如foo.x,但是foo没有属性xIOError输入/输出异常;基本上是无法打开文件ImportError无法引

系统 2019-09-27 17:49:48 2370

Python

python数据分析(2)Numpy库(1)

文章目录一:简介二:NumPy库组成介绍1.NumPy的组成2.NumPy优点3.数据结构和数据类型的区别(1)数据类型(2)数据结构4.NumPy数据类型三:NumPyndarray1.简介(1)大型数组集合(2)多维(3)相同类型(4)类似标量操作语法2.NumPy矩阵和数组区别3.shape,dtype,ndim4.生成ndarray(1)基础创建方法(2)其他方法5.ndarray的数据类型6.NumPy数组算术(1)向量化(2)相同尺寸数组算术操

系统 2019-09-27 17:47:43 2370

Python

python实现电子书翻页小程序

本文实例为大家分享了python实现电子书翻页的具体代码,供大家参考,具体内容如下1.题目:电子书翻页:(1)自动翻页:每次默认读三行,读完之后睡两秒,直到把所有内容全部读出来(2)手动翻页:输入N阅读下一页,输错提示重新输入,直到把所有内容全部读出来2.效果:电子书为:file/a.txt自动翻页:每隔两秒出现三行直到a.txt里面的所有内容都显示出来手动翻页:输入N显示三行,输错则提示重新再输直到a.txt的所有内容全部显示出来3.思路:(1)先确定好

系统 2019-09-27 17:46:42 2370

Python

5.决策树特征重要性判别算法python实现

特征重要性算法项目链接:https://github.com/Wchenguang/gglearn/blob/master/DecisionTree/李航机器学习讲解/FeatureImportance.ipynb信息增益法公式熵的定义:属性yyy的熵,表示特征的不确定性:P(Y=yj)=pj,i=1,2,⋯,nP\left(Y=y_{j}\right)=p_{j},\quadi=1,2,\cdots,nP(Y=yj​)=pj​,i=1,2,⋯,nH(Y)

系统 2019-09-27 17:46:24 2370

Python

python2.7的编码问题与解决方法

前言Python的编码问题基本是每个新手都会遇到的坎,但只要完全掌握了就跳过了这个坑,万变不离其中,下面给大家整理了在python2.7遇到的编码问题,下面来一起看看吧。一、直接在python文件内修改系统编码默认的编码格式是ascii,我们可以直接修改为utf-8importsysreload(sys)sys.setdefaultencoding('utf-8')二、在输入输出的时候,修改编码格式#解码为GBK,再次编码为UTF-8html_doc=un

系统 2019-09-27 17:37:58 2370

Python

基于sklearn的线性分类器logistics(对数几率回归)Python

基于sklearn的线性分类器logistics(对数几率回归)Python实现声明:本人小白,文章作为自己的学习参考资料,供大家学习交流本文章referto作者:月见樽链接:https://www.jianshu.com/p/f9cb59dc99ec来源:简书作者:周志华书名:《机器学习》出版社:清华大学出版社感谢此文章及书籍原创者如有侵犯您的知识产权和版权问题,请通知本人,本人会即时做出处理并删除文章Email:louhergetup@gmail.co

系统 2019-09-27 17:57:32 2369

Python

python求最大值,不使用内置函数的实现方法

利用python进行求解,求解的要求是不能使用python内部封装好的函数例如:maxway1:deffindmax(data,n):ifn==1:returndata[0]else:maxi=data[0]foriindata[1:]:ifmaxicoderesult:34way2:defgetMax(arr):foriinrange(0,len(arr)):forjinrange(i+1,len(arr)):first=int(arr[i])secon

系统 2019-09-27 17:56:54 2369

Python

python选取特定列 pandas iloc,loc,icol的使用详解(列

df是一个dataframe,列名为ABCD具体值如下:ABCD0ss小红81aa小明d4ff6ak小紫7dataframe里的属性是不定的,空值默认为NA。一、选取标签为A和C的列,并且选完类型还是dataframedf=df.loc[:,['A','C']]df=df.iloc[:,[0,2]]二、选取标签为C并且只取前两行,选完类型还是dataframedf=df.loc[0:2,['A','C']]df=df.iloc[0:2,[0,2]]聪明的朋

系统 2019-09-27 17:50:07 2369

Python

Python的引包机制 / 模块的搜索顺序

Python的引包机制/模块的搜索顺序1、当前目录下有没有该***.py2、python安装目录下面去找“**\Python36\Lib”下有没有*.py3、环境变量path下面去找导入python工程下新建文件夹Case自定义testcase的模块:importsyssys.path.append(“\Case:”)#将该目录添加到系统变量path下fromCaseimporttestcasepython中每一个模块都有一个内置属性.__file__可以

系统 2019-09-27 17:55:21 2368

Python

Python函数参数匹配模型(下)

任意参数*当我们的函数接收参数为任意个,或者不能确定参数个数时,我们,可以利用*来定义任意数目的参数,这个函数调用时,其所有不匹配的位置参数会被赋值为元组,我们可以在函数利用循环或索引进行使用deff(*args):#直接打印元组参数print(args)print('-'*20)#循环打印元组参数[print(i)foriinargs]...#传递一个参数f(1)print('='*20)#传递5个参数f(1,2,3,4,5)示例结果:(1,)-----

系统 2019-09-27 17:55:16 2368

Python

Python爬虫 批量爬取下载抖音视频代码实例

这篇文章主要为大家详细介绍了python批量爬取下载抖音视频,具有一定的参考价值,感兴趣的小伙伴们可以参考一下项目源码展示:'''在学习过程中有什么不懂得可以加我的python学习交流扣扣qun,934109170群里有不错的学习教程、开发工具与电子书籍。与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内容。'''#-*-coding:utf-8-*-fromcontextlibimportclosingimportrequ

系统 2019-09-27 17:54:40 2368

Python

Python模拟登陆淘宝并统计淘宝消费情况的代码实例分享

支付宝十年账单上的数字有点吓人,但它统计的项目太多,只是想看看到底单纯在淘宝上支出了多少,于是写了段脚本,统计任意时间段淘宝订单的消费情况,看那结果其实在淘宝上我还是相当节约的说。脚本的主要工作是模拟了浏览器登录,解析“已买到的宝贝”页面以获得指定的订单及宝贝信息。用方法见代码或执行命令加参数-h,另外需要BeautifulSoup4支持,BeautifulSoup的官方项目列表页:https://www.crummy.com/software/Beaut

系统 2019-09-27 17:53:15 2368