原文:《BI项目笔记》增量ETL数据抽取的策略及方法增量抽取增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据。在ETL使用过程中。增量抽取较全量抽取应用更广。如何捕获变化的数据是增量抽取的关键。对捕获方法一般有两点要求:准确性,能够将业务系统中的变化数据按一定的频率准确地捕获到;性能,不能对业务系统造成太大的压力,影响现有业务。目前增量数据抽取中常用的捕获变化数据的方法有:a.触发器:在要抽取的表上建立需要的触发器,一般要建立插入、修改、删
系统 2019-08-12 01:32:01 2171
转自:https://www.cnblogs.com/kaibindirver/p/9436649.htmlhttps://github.com/GoverSky/HTMLTestRunner_cn/blob/master/README.md在原版的基础上进行扩展和改造报告汉化,错误日志selenium/appium截图截图功能根据测试结果,当结果为fail或error时自动截图截图方法在_TestResult的测试结果收集中,报告使用的截图全部保存为ba
系统 2019-09-27 17:57:25 2170
函数简介函数是组织好的,可重复使用的,用来实现,单一或相关联的功能函数能提高模块的利用行,和代码的重复利用率以及冗余,其实你已经使用了很多的Python函数,比如print()。但是你也可以自己创建函数,这种叫做自定义函数函数规则函数代码块必须以def关键字开头,后面为函数标识符名以及()任何传入的参数和自定变量必须放在圆括号中间。圆括号之间可以用来定义参数函数的第一行语句可以选择性的使用注释字符来表明函数的作用及说明函数的内容以冒号起始,并且必须缩
系统 2019-09-27 17:56:37 2170
官方文档解释:轴用来为超过一维的数组定义的属性,二维数据拥有两个轴:第0轴沿着行的垂直往下,第1轴沿着列的方向水平延伸。注意看,官方对于0和1的解释是轴,也就是坐标轴。而坐标轴是有方向的,所以千万不要用行和列的思维去想axis,因为行和列是没有方向的,这样想会在遇到不同的例子时感到困惑。根据官方的说法,1表示横轴,方向从左到右;0表示纵轴,方向从上到下。当axis=1时,数组的变化是横向的,而体现出来的是列的增加或者减少。其实axis的重点在于方向,而不是
系统 2019-09-27 17:56:03 2170
经过各种找,下面这个安装地址中的版本是最全的下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#pygame本机python版本然后在下载地址(https://www.lfd.uci.edu/~gohlke/pythonlibs/#pygame)找到cp37版本(这里的37就是3.7的意思)第一次:下载了【pygame-1.9.6-cp37-cp37m-win_amd64.whl】。结果安装的时候报错:【ERR
系统 2019-09-27 17:54:16 2170
在循环对象和函数对象中,我们了解了循环器(iterator)的功能。循环器是对象的容器,包含有多个对象。通过调用循环器的next()方法(__next__()方法,在Python3.x中),循环器将依次返回一个对象。直到所有的对象遍历穷尽,循环器将举出StopIteration错误。在foriiniterator结构中,循环器每次返回的对象将赋予给i,直到循环结束。使用iter()内置函数,我们可以将诸如表、字典等容器变为循环器。比如:复制代码代码如下:f
系统 2019-09-27 17:53:54 2170
Python3快速入门(十一)——Python3数据库操作一、mysql-connector驱动1、mysql-connector简介mysql-connector是MySQL官方提供的驱动器。使用pipenv进行包管理,安装命令如下:pipenvinstallmysql-connector2、mysql-connector常用接口mysql.connector.connect(*args,**kwargs)创建一个数据库连接,返回MySQLConnect
系统 2019-09-27 17:53:15 2170
在程序开发时候一套好的开发环境和工具栈,可以帮我们极大的提高开发的效率,避免把大量时间浪费在周边琐事上。本文以Python的为例,教大家如何快速打造优秀的Python的项目开发环境:内容涵盖了模块依赖管理,代码风格管理,调试测试管理和Git版本管理,使用githook做项目规范检查等。pipxPipx是一款跨平台的Python环境隔离管理工具,可以在支持在Linux,MacOS和Windows上运行.Pipx默认在是个人用户下建立虚拟Python环境,并以
系统 2019-09-27 17:51:53 2170
本篇博客总结一下Python采集SQLServer数据库服务器的磁盘使用信息,其实这里也是根据需求不断推进演化的一个历程,我们监控服务器的磁盘走了大概这样一个历程:1:使用SQLServer作业监控磁盘空间很久之前写过一篇博客“MSSQL监控磁盘空间告警”,后面对这个脚本进行过多次完善和优化,做成了一个模板。在每台SQLServer服务器上都部署了,确实也很实用。告警也很给力,但是缺点也非常明显。优点:1:自己动手DIY,在没有部署运维工具的前提下,确实能
系统 2019-09-27 17:49:08 2170
希尔排序思想:算法先将要排序的一组数按某个增量d分成若干组,每组中记录的下标相差d.对每组中全部元素进行排序,然后再用一个较小的增量对它进行,在每组中再进行排序。当增量减到1时,整个要排序的数被分成一组,排序完成。一般的初次取序列的一半为增量,以后每次减半,直到增量为1。defshell_sort(list):n=len(list)gap=n//2new_list=[]whilegap>1:foriinrange(gap):iflist[i]>list[i
系统 2019-09-27 17:48:17 2170