Python - 军军小站|张军博客
Python

python Pandas如何对数据集随机抽样

摘要:有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。应用场景:我有10W行数据,每一行都11列的属性。现在,我们只需要随机抽取其中的2W行。实现方法很简单:利用Pandas库中的sample。DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None)n是要抽取

系统 2019-09-27 17:54:34 2290

Python

Python统计词蘋

#导入扩展库importre#正则表达式库importcollections#词频统计库importnumpyasnp#numpy数据处理库importjieba#结巴分词importwordcloud#词云展示库fromPILimportImage#图像处理库importmatplotlib.pyplotasplt#图像展示库#读取文件fn=open('c.csv')#打开文件string_data=fn.read()#读出整个文件fn.close()#

系统 2019-09-27 17:52:07 2290

Python

简化Python的Django框架代码的一些示例

尽管Django的流行和普及,一些开发者仍然认为她是一个过时的web开发框架,仅仅适合内容丰富的web程序。然而现在大多数web程序往往不是富内容的,这似乎让Django看起来不是最佳选择的web框架。那么让我们花点时间从现在的web开发实践中重新认识下她吧。简单清晰的Django一个web框架主要是帮助web程序生成核心的架构,以便在其他的项目中重用。Django正是以此为基础,快速构建web程序。Django的核心主要是WSGI程序,通过处理HTTP请

系统 2019-09-27 17:49:01 2290

Python

正则给header的冒号两边参数添加单引号(Python请求用)

正则给header的冒号两边参数添加单引号(Python请求用)直接从浏览器Chrome复制header值如下:Host:kyfw.12306.cnConnection:keep-alivePragma:no-cacheCache-Control:no-cacheAccept:*/*X-Requested-With:XMLHttpRequestIf-Modified-Since:0User-Agent:Mozilla/5.0(WindowsNT6.1;Wi

系统 2019-09-27 17:47:48 2290

Python

跟老齐学Python之一个免费的实验室

在学生时代,就羡慕实验室,老师在里面可以鼓捣各种有意思的东西。上大学的时候,终于有机会在实验室做大量实验了,因为我是物理系,并且,遇到了一位非常令我尊敬的老师――高老师,让我在他的实验室里面,把所有已经破旧损坏的实验仪器修理装配好,并且按照要求做好实验样例。经过一番折腾,才明白,要做好实验,不仅仅花费精力,还有不菲的设备成本呢。后来工作的时候,更感觉到实验设备费用之高昂,因此做实验的时候总要小心翼翼。再后来,终于发现原来计算机是一个最好的实验室。在这里做实

系统 2019-09-27 17:56:55 2289

Python

C/C++/Qt与 Python 混合编程(1):c/c++和 Qt 调用... 、嵌入python文件

1前言python是C写的,库也是C写的,不但python可以调用C写的库,C也能调用为python写的库,甚至调用python语句执行。嵌入为应用程序提供了用Python而不是C或c++实现应用程序的某些功能的能力。这可以用于许多目的;一个例子是允许用户通过用Python编写一些脚本来根据自己的需要定制应用程序。如果一些功能可以更容易地用Python编写,您也可以自己使用它。嵌入Python类似于扩展它,但并不完全如此。所不同的是,当你扩展Python应

系统 2019-09-27 17:56:34 2289

Python

【计算机体系结构】非线性流水线调度算法 C++ & Python

一、概述线性流水线与非线性流水线是CPU中指令处理流水线的一种分类标准。线性流水线很好理解,就是一条路走到黑的流水线;非线性流水线则不同,它可能存在前馈与反馈,每个部件可能使用一次或多次,它就没法像线性流水线那么一个一个部件按部就班的走。因此出现了一个问题,如果我第一个任务第二次使用部件A,第二个任务恰好第一次也使用部件A,这会怎么样?出现矛盾了,流水线卡住了。这不好,因此需要流水线调度算法来安排好每一个任务,在让它们不冲突的同时,最大可能提高流水线的效率

系统 2019-09-27 17:54:43 2289

Python

24式加速你的Python(小结)

一,分析代码运行时间第1式,测算代码运行时间平凡方法快捷方法(jupyter环境)第2式,测算代码多次运行平均时间平凡方法快捷方法(jupyter环境)第3式,按调用函数分析代码运行时间平凡方法快捷方法(jupyter环境)第4式,按行分析代码运行时间平凡方法快捷方法(jupyter环境)二,加速你的查找第5式,用set而非list进行查找低速方法高速方法第6式,用dict而非两个list进行匹配查找低速方法高速方法三,加速你的循环第7式,优先使用for循

系统 2019-09-27 17:52:26 2289

Python

Python脚本实现代码行数统计代码分享

之前用bash实现过(//www.jb51.net/article/61943.htm),不过那个不能在windows下使用,所以就写了个python版,也方便我以后使用……这里就不多介绍了,不懂的google下。实现代码复制代码代码如下:#!/usr/bin/python'''File:count.pyAuthor:MikeE-Mail:Mike_Zhang@live.com'''importsys,osextens=[".c",".cpp",".hpp

系统 2019-09-27 17:51:47 2289

Python

Python replace(),split(),strip(),join

1、replace()方法描述Pythonreplace()方法把字符串中的old(旧字符串)替换成new(新字符串),如果指定第三个参数max,则替换不超过max次。语法replace()方法语法:str.replace(old,new[,max])参数old–将被替换的子字符串。new–新字符串,用于替换old子字符串。max–可选字符串,替换不超过max次str="thisisstringexample....wow!!!thisisreallyst

系统 2019-09-27 17:46:12 2289

Python

使用GitHub和Python实现持续部署的方法

我们已经在Python运算中看到Python最基本的数学运算功能。此外,math包补充了更多的函数。当然,如果想要更加高级的数学功能,可以考虑选择标准库之外的numpy和scipy项目,它们不但支持数组和矩阵运算,还有丰富的数学和物理方程可供使用。此外,random包可以用来生成随机数。随机数不仅可以用于数学用途,还经常被嵌入到算法中,用以提高算法效率,并提高程序的安全性。math包math包主要处理数学相关的运算。math包定义了两个常数:复制代码代码如

系统 2019-09-27 17:38:01 2289

Python

通过实例浅析Python对比C语言的编程思想差异

我一直使用Python,用它处理各种数据科学项目。Python以易用闻名。有编码经验者学习数天就能上手(或有效使用它)。听起来很不错,不过,如果你既用Python,同时也是用其他语言,比如说C的话,或许会存在一些问题。给你举个我自己经历的例子吧。我精通命令式语言,如C和C++。对古老经典的语言如Lisp和Prolog能熟练使用。另外,我也用过Java,Javascript和PHP一段时间。(那么,学习)Python对我来讲不是很简单吗?事实上,只是看起来容

系统 2019-09-27 17:37:35 2289

Python

Python基于机器学习方法实现的电影推荐系统实例详解

推荐算法在互联网行业的应用非常广泛,今日头条、美团点评等都有个性化推荐,推荐算法抽象来讲,是一种对于内容满意度的拟合函数,涉及到用户特征和内容特征,作为模型训练所需维度的两大来源,而点击率,页面停留时间,评论或下单等都可以作为一个量化的Y值,这样就可以进行特征工程,构建出一个数据集,然后选择一个合适的监督学习算法进行训练,得到模型后,为客户推荐偏好的内容,如头条的话,就是咨询和文章,美团的就是生活服务内容。可选择的模型很多,如协同过滤,逻辑斯蒂回归,基于D

系统 2019-09-27 17:56:52 2288

Python

OpenCV-Python学习笔记(四):图像上的算术运算:图像加法、图像混合

1.图像加法可以使用函数cv2.add()将两幅图像进行加法运算,两幅图像的大小,类型必须一致。(注意:OpenCV中的加法与Numpy的加法是有所不同的。OpenCV的加法是一种饱和操作,而Numpy的加法是一种模操作。r如下所示。推荐使用OpenCV中的函数)importcv2importnumpyasnpx=np.uint8([250])y=np.uint8([10])print(cv2.add(x,y))#250+10=260=>255[[255]

系统 2019-09-27 17:53:26 2288

Python

《Python Qt GUI与数据可视化编程》第14章 Matplotlib

第14章Matplotlib数据可视化Matplotlib是Python中做数据绘图最常用的一个包,它提供了二维和三维绘图功能,能绘制曲线、直方图、柱状图、饼图、伪色图、等高线图、极坐标图、三维曲面、三维等高线等各种图,具有丰富的绘图定制功能,能在图中使用LaTeX标记输出数学符号和公式,生成具有出版品质的图。Matplotlib最初是仿照MATLAB的绘图功能开发的,matplotlib.pyplot模块提供了类似于MATLAB的指令式绘图功能,一般介绍

系统 2019-09-27 17:48:36 2288