指标的定义:在GoogelAnalytics中征对页面的一个分析有这么两项指标:跳出率(BounceRate)、退出率(ExitRate)如下图所示:该指标都可以用来表示离开网站的访问者数量,但两者的计算方法和征对的页面是完全不同的。跳出是征对访问者来到网站后的第一个页面,即登录页,访问者跳出的动作只有在这个页面上才会出现。退出是在网站上所有页面都可以出现,只要访问者离开网站就算一次退出,页访问者访问的最后一个页面就是退出页面如下图所示:GoogleAna
系统 2019-08-12 09:30:03 1905
1.安装10g:[oracle@styrac1~]$cd$ORACLE_HOME/rdbms/lib/[oracle@styrac1lib]$make-fins_rdbms.mk$ORACLE_HOME/rdbms/lib/bbed11g:拷贝10g的文件[oracle@styrac2lib]$mkdir/tmp/libtmp[oracle@styrac2lib]$mkdir/tmp/msgtmp[oracle@styrac2lib]$cp$ORACLE_
系统 2019-08-12 09:29:46 1905
概述在绝大部分的开发语言中与实际开发过程中,Dictionary扮演着举足轻重的角色。从我们的数据模型到服务器返回的参数到数据库的应用等等,Dictionary的身影无处不在。在Python中,Dictionary是一种可变的容器类型。所谓容器类型,就是我们放置数据的地方。不同于List的有序、操作时对数据类型统一性的要求较严格,Dictionary是一种可变的、不限存储对象、无序的数据模型。字典有着类似列表的高灵活度的特点,而与列表通过偏移索引的存取元素
系统 2019-09-27 17:56:59 1904
前言在K近邻的原始算法中,没有对K近邻的方法进行优化,还是遍历训练集,找到与输入实例最近的K个训练实例,统计他们的类别,以此作为输入实例类别的判断。具体的模型理论见:统计学习方法——K近邻法(原始方法)1.K近邻算法的实现在算法实现的过程中,利用的是欧氏距离进行点与点之间的距离度量。在进行数据运算的时候,没有利用numpy,而是利用Python中自带的list来进行数据的计算。defknn(x,dataSet,labels,k):distanceMemor
系统 2019-09-27 17:56:59 1904
字符编码Python主要识别文件内容,而不是关心拓展名—>解释器例:cmd中输入pythonxxx.txt也能运行显示文本内容字符—>(机器翻译)—>二进制字符如何对应特定数字的标准,这个标准就是字符编码。ASCIIGBKUnicodeUTF-8(UnicodeTransformaFormat)对于英文字符来说,1bytes中文字符,3bytes对于其他偏僻字符,更多的bytes存储>>>b=bytes('城市学院',encoding='utf-8')>>
系统 2019-09-27 17:56:43 1904
爬虫的概念:爬虫就是获取网页并提取和保存信息的自动化程序爬虫的分类:主要有四类:通用网络爬虫,聚焦网络爬虫,增量式网络爬虫,深层网络爬虫爬虫的流程:常见的几种爬虫问题:主要有五类:静态网页的爬取,Ajax数据的爬取,动态渲染页面爬取,验证码的识别,代理的使用常见的爬虫框架:pyspider框架,Scrapy框架分布式爬虫:在多台机器上运行爬虫程序爬虫的一些常用"库":解析库:lxml;BeautifulSoup;pyquery;tesserocr请求库:r
系统 2019-09-27 17:56:05 1904
安装pymysqlpipinstallpymysql使用pymysql使用数据查询语句查询一条数据fetchone()frompymysqlimport*conn=connect(host='127.0.0.1',port=3306,user='root',password='123456',database='itcast',charset='utf8')#创建游标c=conn.cursor()#执行sql语句c.execute("select*from
系统 2019-09-27 17:55:12 1904
windows下载ziplinux下载tar下载地址:https://www.elastic.co/downloads/elasticsearch解压后运行:bin/elasticsearch(orbin\elasticsearch.batonWindows)检查是否成功:访问http://localhost:9200linux下不能以root用户运行,普通用户运行报错:java.nio.file.AccessDeniedException原因:当前用户没
系统 2019-09-27 17:54:44 1904
这是我使用python写的第一个类(也算是学习面向对象语言以来正式写的第一个解耦的类),记录下改进的过程。分析需求最初,因为使用time模块显示日期时,每次都要设置时间字符串的格式,挺麻烦,但还是忍了。后来,在处理多线程任务时需要实现定时控制的功能,更麻烦,终于决定自己做一个解决这些问题的通用代码(虽然网上有现成的模块,但亲手编写这部分代码正好能锻炼一下我的面向对象编程)。分析框架刚开始,我计划做一个模仿时钟的抽象类,让它独立运行在一个线程中,让它提供显示
系统 2019-09-27 17:54:34 1904
最近碰巧需要用到pyecharts,但是实数门外汉,完全不懂怎么使用。网上找了一些教程和博客,不是CV大法,就是通篇代码,既没有代码里的注释,也没有文字解释。看了半天还是不知道各项属性是什么意思,怎么使用,到头来还要自己慢慢摸索。(以上纯属个人吐槽,并非贬低所有博主,也没有表示我写的就好。只是单纯觉得有一些博文语焉不详,并没有什么实际意义。同时告诫自己。)欢迎交流,喷子勿扰,侵权删除。回归正题pyecharts有一个官方API文档,几乎包揽了全部内容。便于
系统 2019-09-27 17:54:22 1904