第一章引言第二章预备知识第三章直接聚类法第四章K-means第五章DBSCAN第六章OPTICS第七章聚类分析的效果评测第八章数据尺度化问题作者:peghoty出处:http://blog.csdn.net/itplus/article/details/10089323欢迎转载/分享,但请务必声明文章出处.聚类算法初探(六)OPTICS
系统 2019-08-12 01:33:01 2241
分页很重要,面试会遇到。不妨再回顾总结一下。1.创建测试环境,(插入100万条数据大概耗时5分钟)。createdatabaseDBTestuseDBTest--创建测试表createtablepagetest(idintidentity(1,1)notnull,col01intnull,col02nvarchar(50)null,col03datetimenull)--1万记录集declare@iintset@i=0while(@i<10000)begi
系统 2019-08-12 01:32:47 2241
下午在用python将Linux的conf配置文件转化成字典dict时遇到了一个奇怪的问题,原先conf配置文件中没有注释行(以#开头的行),后来为了避免这种情况,添加了一个对以#开头的行删除的操作。实践结果颠覆了已有的认知,直接上代码示例。代码片段1#!/usr/bin/python#encoding:utf-8#-*-coding:utf8-*-importrelist_to_test=['#','#conf','NAME="Ubuntu"','VER
系统 2019-09-27 17:56:35 2240
说明:本文为博主原创文章,未经博主允许不得转载。如果代码有不懂的,欢迎与我探讨!邮箱:1103540209@qq.comgithub地址:https://github.com/wstchhwp文章目录1.Matplotlib基本概念2.Matplotlib三层结构容器层辅助显示层图像层总结3.plt的基本用法3.1Figure对象3.2plot的使用3.3如何在同一个figure内部设置多个图片3.4如何调整subplot的间距4.参考可视化是在整个数据挖
系统 2019-09-27 17:54:39 2240
任务在https://pastebin.com网站注册一个账号,利用python实现用户的自动登录和创建paste。该任务需要分成如下两步利用python实现:1.账号的自动登录2.paste的自动创建模拟账号登录模拟登录,需要知道登录的URL是什么,那么登录URL怎么去看呢。进入https://pastebin.com/之后,发现是以访客的身份进入的,点击身份图像的下拉中的LOGIN,进入登录页面,打开Chrome开发工具,选择Network,勾选Pre
系统 2019-09-27 17:53:31 2240
Python爬取豆瓣电影,最简单,最暴力,直接搞Api首先是api地址(地址去官网溜达一圈很容易就找到):requests.get('https://movie.douban.com/j/search_subjects?type=movie&tag={}&sort=recommend&page_limit={}&page_start=0'.format(tag,page)使用requests发送get请求拿到json数据(一次可以抓很多条,所以没必要循环抓
系统 2019-09-27 17:53:31 2240
简介python动态执行字符串代码片段(也可以是文件),一般会用到exec,eval。execexec_stmt::="exec"or_expr["in"expression[","expression]]注意:exec是一个语法声明,不是一个函数.也就是说和if,for一样.官方文档对于exec的解释ThisstatementsupportsdynamicexecutionofPythoncode.exec的第一个表达式可以是:1.代码字符串2.文件对象
系统 2019-09-27 17:53:01 2240
Python产生一个数值范围内的不重复的随机数,可以使用random模块中的random.sample函数,其用法如下:importrandomrandom.sample(population,k)函数从序列或集合population中返回一个长度为k的随机数列表,并且列表中的随机数元素之间是不重复的,如:>>>a=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]>>>a[1,2,3,4,5,6,7,
系统 2019-09-27 17:52:06 2240
模块是用类编写的,只有一个StringIO类,所以它的可用方法都在类中。此类中的大部分函数都与对文件的操作方法类似。例:复制代码代码如下:#coding=gbkimportStringIO,cStringIO,syss=StringIO.StringIO("JGoodisahandsomeboy")s.write("JGoodisahandsomeboy\r\n")s.write('okkkk中国')s.seek(0)prints.read()#最后4个字
系统 2019-09-27 17:50:39 2240
在python并行处理任务时要使用多线程还是多进程?说到这个话题,必须要提的GIL(GlobalInterpreterLock)全局解释锁,当Cpython每次执行字节码时都要先申请这个锁。那么问题就来了,如果使用多线程是比也会受到影响。多线程和多进程程序比较,哪个性能更高?还是拿一个实例运行来看看吧~#写一个简单的例子,计算100W个随机数的和8次,同时将分散到8个线程进行运算。#thread.py#!/usr/bin/envpythonimportra
系统 2019-09-27 17:48:57 2240