- 军军小站|张军博客
搜索到与相关的文章
各行各业

《BI项目笔记》增量ETL数据抽取的策略及方法

原文:《BI项目笔记》增量ETL数据抽取的策略及方法增量抽取增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据。在ETL使用过程中。增量抽取较全量抽取应用更广。如何捕获变化的数据是增量抽取的关键。对捕获方法一般有两点要求:准确性,能够将业务系统中的变化数据按一定的频率准确地捕获到;性能,不能对业务系统造成太大的压力,影响现有业务。目前增量数据抽取中常用的捕获变化数据的方法有:a.触发器:在要抽取的表上建立需要的触发器,一般要建立插入、修改、删

系统 2019-08-12 01:32:01 1964

Python

详解10个可以快速用Python进行数据分析的小技巧

一些小提示和小技巧可能是非常有用的,特别是在编程领域。有时候使用一点点黑客技术,既可以节省时间,还可能挽救“生命”。一个小小的快捷方式或附加组件有时真是天赐之物,并且可以成为真正的生产力助推器。所以,这里有一些小提示和小技巧,有些可能是新的,但我相信在下一个数据分析项目中会让你非常方便。Pandas中数据框数据的Profiling过程Profiling(分析器)是一个帮助我们理解数据的过程,而PandasProfiling是一个Python包,它可以简单快

系统 2019-09-27 17:57:26 1963

Python

Python中文件I/O高效操作处理的技巧分享

如何读写文本文件?实际案例某文本文件编码格式已直(如UTF-8,GBK,BIG5),在python2.x和python3.x中分别如何读取这些文件?解决方案字符串的语义发生了变化:python2python3strbytesunicodestrpython2.x写入文件前对unicode编码,读入文件后对二进制字符串解码>>>f=open('py2.txt','w')>>>s=u'你好'>>>f.write(s.encode('gbk'))>>>f.clo

系统 2019-09-27 17:56:45 1963

Python

常用终端命令(python虚拟环境+git)

常用终端命令(python虚拟环境+git)基础新建文件夹mkdir[文件夹名]新建文件touch[文件名]编辑文件vi[文件名]查看当前文件夹位置中的所有文件ls(-a/-all)-a:显示隐藏文件;-all:显示隐藏文件和属性python虚拟环境jupyternotebook添加虚拟环境变量(需要在该变量中)python-mipykernelinstall(--user)--name[环境名称]--display-name"[显示的名称]"#####查

系统 2019-09-27 17:56:37 1963

Python

Python 在OpenCV里实现仿射变换―坐标变换效果

在现实的图像操作软件中,经常碰到的不是给出放大多少倍,而是由用户在软件的界面上选择多大的区域,或者选择几个点,那么这样情况下,怎么样来计算出变换矩阵呢?从前面知道变换矩阵是2X3的矩阵,说明有六个未知数,又有中学的代数知识知道要解决六个未知数,那么方程组至少要联立三条方程,要准备三条方程的先决条件,就是要有三组坐标。因此,只要在用户选择的区域里找到三个不同点的坐标,就可以计算出变换矩阵。如果给出三组坐标[0,0],[200,0],[0,200],通过变换之

系统 2019-09-27 17:56:19 1963

Python

Python实现的爬取豆瓣电影信息功能案例

本文实例讲述了Python实现的爬取豆瓣电影信息功能。分享给大家供大家参考,具体如下:本案例的任务为,爬取豆瓣电影top250的电影信息(包括序号、电影名称、导演和主演、评分以及经典台词),并将信息作为字典形式保存进txt文件。这里只用到requests库,没有用到beautifulsoup库step1:首先获取每一页的源代码,用requests.get函数获取,为了防止请求错误,使用try...except..defgetpage(url):try:re

系统 2019-09-27 17:56:16 1963

Python

明白动态规划,Dijkstra方法的Python实现和问题的解决步骤

原作者:金子冴校阅:内野良一翻译:叶子原文链接目录什么是动态规划(DynamicProgramming)例题:用Dijkstra的方法解决最短路径问题(Python实现)使用动态规划解决问题的步骤参考什么是动态规划(DynamicProgramming)动态规划概要动态规划是一种解题手法的总称。它通过将一个无法解决的大问题分解成复数个小问题(也叫子问题),然后在解决这些小问题的基础之上来解决原始的大问题。通过使用动态规划,我们能将一部分在多项式时间内无法解

系统 2019-09-27 17:55:43 1963

Python

朴素贝叶斯算法的python实现方法

本文实例讲述了朴素贝叶斯算法的python实现方法。分享给大家供大家参考。具体实现方法如下:朴素贝叶斯算法优缺点优点:在数据较少的情况下依然有效,可以处理多类别问题缺点:对输入数据的准备方式敏感适用数据类型:标称型数据算法思想:比如我们想判断一个邮件是不是垃圾邮件,那么我们知道的是这个邮件中的词的分布,那么我们还要知道:垃圾邮件中某些词的出现是多少,就可以利用贝叶斯定理得到。朴素贝叶斯分类器中的一个假设是:每个特征同等重要函数loadDataSet()创建

系统 2019-09-27 17:54:25 1963

Python

安装anaconda出现This Python interpreter

安装anaconda后在命令行中出现ThisPythoninterpreterisinacondaenvironment,buttheenvironmenthasnotbeenactivated.Librariesmayfailtoload.Toactivatethisenvironmentpleaseseehttps://conda.io/activation解决方式使用终端或Anaconda提示符执行以下步骤。默认情况下,活动环境---您当前使用的环境

系统 2019-09-27 17:54:25 1963

Python

程序员!别再埋头学Python了!

原文链接:https://edu.csdn.net/bundled/detail/49?utm_source=wx0有人说,随着AI和大数据的兴起,Python变得越来越强了,它语言简洁、开发效率高、可移植性强,并且可以和其他编程语言(比如C++)轻松无缝衔接所以,很多程序员把Python当作第一语言来学习,单在和小伙伴们的沟通中,我发现了大部分小伙伴经常在基础部分就放弃了,原因无非是:1、基础相当薄弱型:最近在学爬虫,遇到一个知识点,钻研了2小时没出来,

系统 2019-09-27 17:54:12 1963