前言之前一直做大数据方向的工作,用spark、flink、hive等等处理数据居多,语言方面一般使用scala、java很少用到python,但是不得不说如果想要从事算法方向的工作还是必须得把python用熟练了。下面整理一下学习的流程。Python基础这个很简单,但很重要,推荐看一下这本书的基础部分主要掌握知识点:常用的数据结构及对应方法三种控制流的使用字符串的常用处理方法正则表达式的使用函数的编写Python数值计算工具Numpy尽管在python基础
系统 2019-09-27 17:52:07 2061
3.插入排序(简单插入排序)3.1算法思想如果有一个已经有序的数据序列,要求在这个已经排好的数据序列中插入一个数,但要求插入后此数据序列仍然有序,这个时候就要用到一种新的排序方法——插入排序法,插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而得到一个新的、长度增加1的有序数据。插入排序的基本思想是:每步将一个待排序的记录,按其关键码值的大小插入前面已经排序的文件中适当位置上,直到全部插入完为止。同样,这个算法不需要额外的存储空间,空间复杂
系统 2019-09-27 17:49:40 2061
博主写了一个智联招聘的爬虫,只要输入职位关键字,就能快速导出智联招聘上的数据,存在excel表里~importrequests,openpyxl#建立excel表joblist=[]wb=openpyxl.Workbook()sheet=wb.activesheet.title='智联招聘数据'sheet['A1']='职位名称'sheet['B1']='薪资'sheet['C1']='工作经验'#爬虫keyword=str(input('请输入查找职位的
系统 2019-09-27 17:49:32 2061
Kmean分类项目链接:https://github.com/Wchenguang/gglearn/blob/master/KmeansClassifier/讲解/KmeansClassifier.ipynb首先,随机确定K个初始点作为质心(不必是数据中的点)。然后将数据集中的每个点分配到一个簇中,具体来讲,就是为每个点找到距其最近的质心,并将其分配该质心所对应的簇.这一步完成之后,每个簇的质心更新为该簇所有点的平均值.重复上述过程直到数据集中的所有点都距
系统 2019-09-27 17:45:38 2061
如下所示:Python2.7.7(default,Jun32014,01:46:20)[GCC4.9.020140521(prerelease)]onlinux2Type"help","copyright","credits"or"license"formoreinformation.>>>quitUsequit()orCtrl-D(i.e.EOF)toexit>>>使用quit(),exit(),或者Ctrl-D退出命令行。以上这篇在linux的终端退出
系统 2019-09-27 17:38:30 2061
一、什么是星号变量最初,星号变量是用在函数的参数传递上的,在下面的实例中,单个星号代表这个位置接收任意多个非关键字参数,在函数的*b位置上将其转化成元组,而双星号代表这个位置接收任意多个关键字参数,在**b位置上将其转化成字典:#!/usr/bin/envpython#coding=utf-8#--------defone(a,*b):"""a是一个普通传入参数,*b是一个非关键字星号参数"""print(b)one(1,2,3,4,5,6)#------
系统 2019-09-27 17:38:23 2061
Python元字典字典(dictionary)是除列表以外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。字典用"{}"标识。字典由索引(key)和它对应的值value组成。#!/usr/bin/python#-*-coding:UTF-8-*-dict={}dict['one']="Thisisone"dict[2]="Thisistwo"tin
系统 2019-09-27 17:38:19 2061
首先看一下super()函数的定义:super([type[,object-or-type]])Returna**proxyobject**thatdelegatesmethodcallstoa**parentorsibling**classoftype.返回一个代理对象,这个对象负责将方法调用分配给第一个参数的一个父类或者同辈的类去完成.parentorsiblingclass如何确定?第一个参数的__mro__属性决定了搜索的顺序,super指的的是M
系统 2019-09-27 17:37:59 2061
一旦你创建一个Template对象,你可以用context来传递数据给它。一个context是一系列变量和它们值的集合。context在Django里表现为Context类,在django.template模块里。她的构造函数带有一个可选的参数:一个字典映射变量和它们的值。调用Template对象的render()方法并传递context来填充模板:>>>fromdjango.templateimportContext,Template>>>t=Templ
系统 2019-09-27 17:37:55 2061
一年前,写了一篇博客”中国IT如何相信自己——从“百度”说起“,今天得到了进一步的证实,说明自己没有看错。一年来,百度在业绩、产品创新、资本市场、对世界的影响等
系统 2019-08-29 23:51:48 2061