Python

python数据挖掘需要学的内容

1、Pandas库的操作Panda是数据分析特别重要的一个库,我们要掌握以下三点:・pandas分组计算;・pandas索引与多重索引;索引比较难,但是却是非常重要的・pandas多表操作与数据透视表2、numpy数值计算numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:・Numpyarray理解;・数组索引操作;・数组计算;・Broadcasting(线性代数里面的知识)3、数据可视化-ma

系统 2019-09-27 17:38:11 2492

编程技术

DTS开发记录(3)-- 连接与连接对

在DTS开发记录(2)--数据管道及插件一文中,我们介绍了数据管道,IDataPipeFactory的CreateDataPipe方法需要一个IConnection参数,这个参数就表示一个连接。publicIDataPipeCreateDataPipe(IConnectionconn)IConnection的定义如下://////IConnection用于表示到数据源或数据目标的连接///publicinterface

系统 2019-08-29 23:48:15 2492

编程技术

简评游戏人工智能相关的中文书(补遗)

赖勇浩(http://laiyonghao.com)今天介绍的全部是好书。windows游戏编程大师技巧(第二版)2004年2月第一版作者AndreLaMothe实在太牛了,早在九十年代初他写了一本《Samsteachyouselfgameprogrammingin21days》启发了无数激情的小孩,最终他们成为游戏开发行业的中坚力量,其中就包括了为本书作序的Andre的前同事,在dreamworks和EA工作过的RichardBenson。到现在,And

系统 2019-08-29 23:43:41 2492

编程技术

eclipse 启动

昨天给电脑重装系统,今天想用下eclipse,没想到下载个eclipse下来后,配置了环境变量,竟然不听话,启动不了,才发现我是使用eclipse的大白痴,虽然用安装JDK的方法可以解决,可是我不想再做只会使用eclipse的大白痴,看了错误,google,问题解决,开心。。。之前我也有个印象,eclipse可以设置启动参数。。。我google了一大堆参数,按要求把写到eclipse快捷图标右击目标里,自已加上启动参数-vmE:\Ben\jdks\jdk1

系统 2019-08-29 23:37:13 2492

编程技术

为DataGrid的自带分页添加首页、尾页及状态功能

DataGrid提供了分页功能,不过看上去功能有限,但是我们可以通过DataGrid的一些属性来获取状态以及增加首页、尾页功能按钮。这里没有使用DataGrid的自定义分页功能,如果在速度效率不是很讲究的情况下,由DataGrid自己管理分页还是不错的,付出的代价就是要把整个相关数据取出来后再删选指定页的数据。好处就是开发速度快,不需要写分页的存储过程。本文事例使用的是SqlServer中的Northwind数据库。运行界面如下:对于前台的显示界面,我放了

系统 2019-08-29 23:27:08 2492

编程技术

google svn

今天中午抽时间搞了一下Google的SVN,感觉非常好使!所以决定总结一下。在项目架起来的一刻,偶心中激动之情难以言表。以后偶搞的小东西终于有地方放啦!1.进入http://code.google.com/用Google帐户登录(推荐使用gmail邮箱)。然后点击>ProjectHosting2.进入>>http://code.google.com/hosting/然后点击>Createanewproject3.填入信息:写入项目名,描述,两个选择项(不太

系统 2019-08-29 23:25:19 2492

编程技术

存储过程 设置锁级别set transaction isolation

语法SETTRANSACTIONISOLATIONLEVEL{READUNCOMMITTED|READCOMMITTED|REPEATABLEREAD|SNAPSHOT|SERIALIZABLE}[;]备注一次只能设置一个隔离级别选项,而且设置的选项将一直对那个连接始终有效,直到显式更改该选项为止。事务中执行的所有读取操作都会在指定的隔离级别的规则下运行,除非语句的FROM子句中的表提示为表指定了其他锁定行为或版本控制行为。事务隔离级别定义了可为读取操作获

系统 2019-08-29 22:56:50 2492

Python

[Python]网络爬虫(八):糗事百科的网络爬虫(

项目内容:用Python写的糗事百科的网络爬虫。使用方法:新建一个Bug.py文件,然后将代码复制到里面后,双击运行。程序功能:在命令提示行中浏览糗事百科。原理解释:首先,先浏览一下糗事百科的主页:http://www.qiushibaike.com/hot/page/1可以看出来,链接中page/后面的数字就是对应的页码,记住这一点为以后的编写做准备。然后,右击查看页面源码:观察发现,每一个段子都用div标记,其中class必为content,title

系统 2019-08-29 22:54:15 2492

编程技术

Eclipse,myeclipse安装 配置Maven

原文地址:http://www.cnblogs.com/timeng/archive/2013/05/07/maven_install.htmlmyeclipse自带了maven插件,但是和原生插件还是有点不一样,本文介绍Maven的安装和配置,同样适用于eclipse。1.首先需要安装jdk,myeclipse(废话!)。然后到maven官网下载maven,http://maven.apache.org/download.html我下载的是3.0.52.

系统 2019-08-29 22:05:09 2492

编程技术

互联网的使用习惯新浪说了算吗?

引子海报网做了一个用户使用习惯测验,并撰文《软件的使用习惯微软说了算,互联网的使用习惯新浪说了算》,提出了几个有趣的结论:1:“我们精心设计的导航、标签云,在整个测试过程中,只有一个人曾经点击过一次。大家毫无例外的都是根据标题或图片来决定下一步点击哪里,而不会点击什么导航。”2:“不管苹果的软件在客观上多么典雅易用,如果用户按照Windows的使用习惯操作后不能得到同样的结果,用户就会产生挫折感,主观上得出的结论就是苹果不好用。而在互联网上,中国用户的使用

系统 2019-08-12 01:32:46 2492

编程技术

统计学习方法(三)——K近邻法

/*先把标题给写了、这样就能经常提醒自己*/1.k近邻算法k临近算法的过程,即对一个新的样本,找到特征空间中与其最近的k个样本,这k个样本多数属于某个类,就把这个新的样本也归为这个类。算法输入:训练数据集其中为样本的特征向量,为实例的类别,i=1,2,…,N;样本特征向量x(新样本);输出:样本x所属的类y。(1)根据给定的距离度量,在训练集T中找出与x最相邻的k个点,涵盖这k个点的邻域记作;(2)在中根据分类决策规则(如多数表决)决定x的类别y:(1)式

系统 2019-08-12 01:32:12 2492

Python

python实现微信自动回复机器人功能

一简单介绍wxpy基于itchat,使用了Web微信的通讯协议,,通过大量接口优化提升了模块的易用性,并进行丰富的功能扩展。实现了微信登录、收发消息、搜索好友、数据统计等功能。总而言之,可用来实现各种微信个人号的自动化操作。(http://wxpy.readthedocs.io/zh/latest/bot.html)安装:wxpy支持Python3.4-3.6,以及2.7版本pip3install-Uwxpy安装pillow模块pip3installpil

系统 2019-09-27 17:55:01 2491

Python

Python 分发包中添加额外文件的方法

在制作一个Python分发包时经常需要把一些文件添加到包中。最常见的例子是你希望通过pipinstall命令安装Python包时会在/etc/等目录下自动添加默认配置文件,由此可以让Python安装完成就可以工作,同时也可以给用户提供配置样例参考。参考InstallingAdditionalFiles如果使用setuptools,在setup.py文件中可以通过data_files配置项配置分发包的额外文件,格式为:(<安装位置>,[<文件1>,<文件2>

系统 2019-09-27 17:54:41 2491

Python

python中PS 图像调整算法原理之亮度调整

亮度调整非线性亮度调整:对于R,G,B三个通道,每个通道增加相同的增量。线性亮度调整:利用HSL颜色空间,通过只对其L(亮度)部分调整,可达到图像亮度的线性调整。但是,RGB和HSL颜色空间的转换很繁琐,一般还需要浮点数的运算,不仅增加了代码的复杂度,更重要的是要逐点将RGB转换为HSL,然后确定新的L值,再将HSL转换为RGB,运行速度可想而知是很慢的。要想提高图像亮度线性调整的速度,应该从三方面考虑,一是变浮点运算为整数运算,二是只提取HSL的L部分进

系统 2019-09-27 17:53:55 2491