这节我们主要讲讲我的游戏交易数据分析项目的ETL(数据抽取、加载、转换)具体是怎么做的。先来讲下源系统吧,因为我们的交易主站的服务器不是架在公司的,因此不能直接从源系统直接抽取数据了。事实上我们已经存在一个简单的数据分析系统了,只不过这个是以前人家做的,没有采用sqlserver2005的BI平台来做,而是直接写winform程序来弄的。原来的数据抽取是主站那边提供导出的excel文件过来,然后到我们这边,导入到我们的分析库中去。好了,为了简便,事实上我只
系统 2019-08-12 01:33:11 2482
修改conf文件夹下面的server.xml的Engine里面的内容即可原始内容如下:……
系统 2019-08-12 01:33:00 2482
原文:SQLServer索引和表体系结构(包含列索引)包含列索引概述包含列索引也是非聚集索引,索引结构跟聚集索引结构是一样,有一点不同的地方就是包含列索引的非键列只存储在叶子节点;包含列索引的列分为键列和非键列,所谓的非键列就是INCLUDE中包含的列,至少需要有一个键列,且键列和非键列不允许重复,非键列最多允许1023列(也就是表的最多列-1),由于索引键列(不包括非键)必须遵守现有索引大小的限制(最大键列数为16,总索引键大小为900字节)的要求所以引
系统 2019-08-12 01:32:23 2482
概述日期和时间的相互转换可以利用Python内置模块time和datetime完成,且有多种方法供我们选择,当然转换时我们可以直接利用当前时间或指定的字符串格式的时间格式。获取当前时间转换我们可以利用内置模块datetime获取当前时间,然后将其转换为对应的时间戳。importdatetimeimporttime#获取当前时间dtime=datetime.datetime.now()un_time=time.mktime(dtime.timetuple()
系统 2019-09-27 17:57:40 2481
importbase64importskimage.ioimportmatplotlib.pyplotaspltdefbase64_to_rgb(base64_str):"""默认base64中的图像为rgb,直接转换成即可:parambase64::return:"""ifisinstance(base64_str,bytes):base64_str=base64_str.decode("utf-8")imgdata=base64.b64decode(b
系统 2019-09-27 17:54:57 2481
本文实例讲述了pythonflask框架实现传数据到js的方法。分享给大家供大家参考,具体如下:首先要清楚后台和前端交互所采用的数据格式。一般选JSON,因为和js完美贴合。后台返回的数据进行序列化在/homepageRecommend路由的view方法中返回序列化数据dict={"a":1,"b":2}importjsonjson.dumps(dict)2)fromflaskimportjsonifyjsonify(dict)#在调用jsonfiy有时会
系统 2019-09-27 17:53:56 2481
问题在python中使用matplotlib画图,里面的中文会显示乱码方块。解决方法这是由于matplotlib默认使用的字体中不包含中文字符引起的,可以通过将中文字符加入到默认字体中解决。前提:查找本地都有哪些中文字体打开matplotlib字体,默认为C:\Users\用户名\.matplotlib,打开fontList.json,查找中文字体如simHei,song,kai等,分别对应简体黑、宋体、楷体等。查找到之后,其对应的name字段值即为我们接
系统 2019-09-27 17:53:08 2481
福利当我们爬虫写好,入库,并成功展示出来,不知不觉就实现了一个小程序项目:宅宅生活收藏夹微信搜索小程序:宅宅生活收藏夹。欢迎大家使用。之前写到宅宅生活收藏夹的部署方法,见使用Flask,Nginx,Gunicorn,Supervisor完成网站部署。这次介绍一下如何抓取知乎答案,获取知乎美图。本文除Python相关库的使用外,还会涉及到mongo数据库的使用。因为宅宅生活收藏夹只是为了收集知乎钓鱼贴的图片,有针对性,所以不能通过获取知乎首页列表全面抓取。当
系统 2019-09-27 17:51:35 2481
python从字符串中提取数字使用正则表达式,用法如下:##总结##^匹配字符串的开始。##$匹配字符串的结尾。##\b匹配一个单词的边界。##\d匹配任意数字。##\D匹配任意非数字字符。##x?匹配一个可选的x字符(换言之,它匹配1次或者0次x字符)。##x*匹配0次或者多次x字符。##x+匹配1次或者多次x字符。##x{n,m}匹配x字符,至少n次,至多m次。##(a|b|c)要么匹配a,要么匹配b,要么匹配c。##(x)一般情况下表示一个记忆组(r
系统 2019-09-27 17:50:42 2481
在程序运行的过程中,所有的变量都是在内存中,比如,定义一个dict:d=dict(name='Bob',age=20,score=88)可以随时修改变量,比如把name改成'Bill',但是一旦程序结束,变量所占用的内存就被操作系统全部回收。如果没有把修改后的'Bill'存储到磁盘上,下次重新运行程序,变量又被初始化为'Bob'。我们把变量从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serializ
系统 2019-09-27 17:50:29 2481