Python - 军军小站|张军博客
Python

用Python实现数据预处理

作者:AfrozChakure翻译:疯狂的技术宅原文:https://towardsdatascience.co...未经允许严禁转载机器学习的核心是处理数据。你的机器学习工具应该与数据的质量一样好。本文涉及清理数据的各个步骤。你的数据需要经过几个步骤才能用于预测。数据预处理涉及的步骤:导入所需的库导入数据集处理缺失的数据。编码分类数据。将数据集拆分为测试集和训练集。特征缩放。那么让我们逐一学习这些步骤。步骤1:导入所需的库你先需要下载此数据集:Data.

系统 2019-09-27 17:57:12 2108

Python

跟老齐学Python之玩转字符串(1)

如果对自然语言分类,有很多中分法,比如英语、法语、汉语等,这种分法是最常见的。在语言学里面,也有对语言的分类方法,比如什么什么语系之类的。我这里提出一种分法,这种分法尚未得到广大人民群众和研究者的广泛认同,但是,我相信那句“真理是掌握在少数人的手里”,至少在这里可以用来给自己壮壮胆。我的分法:一种是语言中的两个元素(比如两个字)和在一起,出来一个新的元素(比如新的字);另外一种是两个元素和在一起,知识两个元素并列。比如“好”和“人”,两个元素和在一起是“好

系统 2019-09-27 17:56:57 2108

Python

Python基础之字典dict增删改查操作

字典的特点:以键值对的形式存在,无序排序;key必须唯一不重复,且不能使用可变对象声明一个字典d={}print(d)print(type(d))增:d[1]=‘a’d[2]=‘c’d[3]=‘b’print(d)d.update({4:‘z’})print(d)dict.setdefault(key,value),如果该key不存在,则在字典中插入这个键值对,并返回value;如果该key已存在,则返回字典中key对应的value,原字典不做更新d.se

系统 2019-09-27 17:54:56 2108

Python

SVD理论以及Python实现

SVD将一个矩阵分解为U,V(U,V均为列正交矩阵,即列向量直接内积为0),中间的矩阵为对角阵,元素为奇异值。A[m∗n]=U[m∗r]∗∑[r∗r]∗(V[n∗r])TA_{[m*n]}=U_{[m*r]}*\sum_{[r*r]}*(V_{[n*r]})^TA[m∗n]​=U[m∗r]​∗[r∗r]∑​∗(V[n∗r]​)TSVD计算方式A=U∗∑∗VTAT=V∗∑∗UTAAT=U∗∑∗VT∗V∗∑∗UTA=U*\sum*V^T\\A^T=V*\sum

系统 2019-09-27 17:52:40 2108

Python

有关python变量的6个概念,一次说透

1.变量不能独立存在在C++等语言中,变量的声明和赋值是可以分开的inta;a=343;而在python中却不行,在声明python变量的同时必须进行赋值操作a=343如果你直接使用一个不存在的变量,就会发生错误,NameError:name'b'isnotdefined2.变量是内存中数据的引用a=343这样代码被执行时,首先要在内存中创建出343这个对象,然后让a指向它,这便是引用。此后,我们在程序中使用变量a时,其实都是在使用343,python可以

系统 2019-09-27 17:51:55 2108

Python

Python编程中的文件操作攻略

open函数你必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的辅助方法才可以调用它进行读写。语法:fileobject=open(file_name[,access_mode][,buffering])各个参数的细节如下:file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这

系统 2019-09-27 17:45:46 2108

Python

十条建议帮你提高Python编程效率

程序员的时间很宝贵,Python这门语言虽然足够简单、优雅,但并不是说你使用Python编程,效率就一定会高。要想节省时间、提高效率,还是需要注意很多地方的。今天就与大家分享资深Python程序员总结的10点建议,帮助大家大幅节省开发时间。1.不使用分号使用分号在Python中是可选的:与其他面向对象语言不同,你不需要在每一条语句后面使用分号。这看起来很简单,似乎也节省不了多少时间;但一旦你的代码量扩展到数千号,这些分号就变得分心且没有必要键入。2.使用称

系统 2019-09-27 17:38:31 2108

Python

python对文件目录的操作方法实例总结

本文实例讲述了python对文件目录的操作方法。分享给大家供大家参考,具体如下:python可以很方便的对文件进行打开,读写操作,删除操作,也可以很方便的对文件夹进行遍历操作。总体说来,有如下几个方面:1.python遍历文件目录,当然可以递归2.python删除文件3.python对文件进行重命名操作4.python创建文件夹(多个层级创建)5.python删除文件夹(多个层级删除)6.python移动文件7.python查找文件8.得到文件夹的大小下面

系统 2019-09-27 17:57:25 2107

Python

来尝个鲜,Python3.8几大新功能体验,冲鸭!

继3.7版本之后Python再次发布了新版本,虽然新版本带来了不少调整,但是其中很大一部分都是对代码底层设计的修改,又或是typing、pickle等不常用的功能,对多数用户而言影响不大,今天我想重点聊一聊那些将对我们的代码编写产生较大影响的新功能。在体验开始前先说下准备工作,由于Python3.8还没有正式发布,因此通过Anaconda的多版本管理搭建Python3.8新环境的方法是行不通的,我的做法是到官网下载对应的最新版本后单独安装。为了避免与现有环

系统 2019-09-27 17:55:51 2107

Python

Python制作CSDN免积分下载器

CSDN免积分下载你懂的。1、输入资源地址如:http://download.csdn.net/download/gengqkun/41278082、输入验证码3、点击下载,会弹出浏览器下载。注:成功率在70-80%,界面很丑,请将就着用。复制代码代码如下:#-*-coding:utf-8-*-#python3.3.5importurllib.parse,urllib.request,http.cookiejar,io,webbrowserimporttk

系统 2019-09-27 17:51:40 2107

Python

基于python 微信小程序之获取已存在模板消息列表

前言:为了获取一定高级操作,如:微信模板消息(xiao,xin)推送,把消息推送给用户,或者是获取用户授权信息都需要用到accesstoken,有效期为两个小时?过了两个小时怎么办?重新获取,来,代码撸起走,啥女朋友没有?获取小程序对应的accesstokendefget_wx_token():url="https://api.weixin.qq.com/cgi-bin/token?"try:respone=requests.get(url,params=

系统 2019-09-27 17:51:16 2107

Python

python常用日期使用方法

#!/usr/bin/python3--coding:utf-8--“”"通过datetime和dateutil进行常用日期的获取如:今年,去年,明年当前季度本月,上月,去年同期,今年一月今天,昨天,明天,本周、本月、本季度、本年第一天,本周、本月、本季度、本年最后一天“”"importdatetime获取常用特定日期(如去年/季度/当月/本周/首日/)=======================================关于年(今年,去年,明年)

系统 2019-09-27 17:50:37 2107

Python

python的常见矩阵运算(小结)

python的numpy库提供矩阵运算的功能,因此我们在需要矩阵运算的时候,需要导入numpy的包。1.numpy的导入和使用fromnumpyimport*;#导入numpy的库函数importnumpyasnp;#这个方式使用numpy的函数时,需要以np.开头。2.矩阵的创建由一维或二维数据创建矩阵fromnumpyimport*;a1=array([1,2,3]);a1=mat(a1);创建常见的矩阵data1=mat(zeros((3,3)));

系统 2019-09-27 17:49:13 2107

Python

python智联招聘爬虫并导入到excel代码实例

这篇文章主要介绍了python智联招聘爬虫并导入到excel代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下写了一个智联招聘的爬虫,只要输入职位关键字,就能快速导出智联招聘上的数据,存在excel表里~importrequests,openpyxl#建立excel表joblist=[]wb=openpyxl.Workbook()sheet=wb.activesheet.title='智联招聘数据's

系统 2019-09-27 17:48:41 2107

Python

Python自用工具包PyTls

我们搞了个python的工具包PyTls。做这件事的初衷是发生了一个星期要用python同时开发3个项目的情况,我发现了两个现象:1.有很多定制化的需求是极度高频反复重写的;2.有很多功能之前写过,可能因为稍许复杂又忘了,再用的时候又要去Google。所以,拉着同组的一个实习生,一起维护了PyTls的这个项目,为的就是那句"lifeisshort,weneedpython"。所有的详细的测试demo都可以在我的git找到,PyTls的测试demos希望可以

系统 2019-09-27 17:54:40 2106