搜索到与相关的文章
Python

【Python爬虫】MongoDB爬虫实践:爬取虎扑论坛

MongoDB爬虫实践:爬取虎扑论坛网站地址为:https://bbs.hupu.com/bxj1.网站分析首先,定位网页上帖子名称、帖子链接、作者、作者链接、创建时间、回复数目、浏览数目、最后回复用户、最后回复时间等信息的位置,之后,我们使用BeautifulSoup在网页中定位这些。数据所在的位置数据位置某帖子所有数据‘li’帖子名称divclass="titlelinkbox">a帖子链接divclass="titlelinkbox">a['href

系统 2019-09-27 17:55:14 2713

Python

Python 条形图与直方图有非常大的区别

区别:首先,条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数据型数据,我们初中学的就是条形统计图,很显然有没有当初那种感觉?(身高-年龄条形统计图)在坐标上画出每个年龄对应的频数。

系统 2019-09-27 17:54:48 2713

Python

Python中Threading用法详解

Python的threading模块松散地基于Java的threading模块。但现在线程没有优先级,没有线程组,不能被销毁、停止、暂停、开始和打断。JavaThread类的静态方法,被移植成了模块方法。mainthread:运行python程序的线程daemonthread守护线程,如果守护线程之外的线程都结束了。守护线程也会结束,并强行终止整个程序。不要在守护进程中进行资源相关操作。会导致资源不能正确的释放。在非守护进程中使用Event。Thread类

系统 2019-09-27 17:52:49 2713

Java

Java中浮点数的存储格式

当一个同事问我:Java中的double的取值范围是多少时,我一脸的茫然,除了知道浮点数由符号位、指数位和小数位组成之外,其它的一无所知。大学里《计算机组成》中学的东西也忘得一干二净。查了一些资料,并亲手写了些测试代码,总算弄明白了,在此做个笔记。1.三种存储格式Java遵循的是IEEE754规范。在这个规范里,提到了浮点数的三种类型:单精度、双精度和双精度扩展。这三种类型的浮点数的存储都由三部分组成:符号位、指数位和小数位组成,不同的是三者指数位和小数位

系统 2019-08-29 23:15:12 2713

编程技术

Bloom Filter 原理与应用

转自:http://blog.huang-wei.com/2010/11/02/bloom-filter/介绍BloomFilter是一种简单的节省空间的随机化的数据结构,支持用户查询的集合。一般我们使用STL的std::set,stdext::hash_set,std::set是用红黑树实现的,stdext::hash_set是用桶式哈希表。上述两种数据结构,都会需要保存原始数据信息,当数据量较大时,内存就会是个问题。如果应用场景中允许出现一定几率的误判

系统 2019-08-29 22:53:38 2713

Java

Errata in Effective Java Second Edition

onPage15Theexception’sdetailmethodshouldindicatewhichinvariantisviolated(Item63).IthinkitshouldbeTheexception’sdetailmessagesshouldindicatewhichinvariantisviolated(Item63).终于等到作者的回信了,小错误,无伤大雅,就怕我译本的如果错误。。。,就对不起了。。。附确认邮件:另一个我提交的被踢回

系统 2019-08-29 21:55:36 2713

Oracle

Oracle数据块的概念总结

Oracle数据内部的逻辑存储Oracle存储数据的最小粒度(finestlevelofgranularity)被称为数据块(datablock)(也叫做逻辑块(logicalblock),Oracle块(Oracleblock)或页(page))。一个数据块对应于磁盘上数个字节(byte)的物理数据库空间。处于数据块之上的逻辑数据库空间是数据扩展(extent)。数据扩展是为存储数据而分配的一组连续的数据块。位于数据扩展之上的逻辑数据库存储结构是段(se

系统 2019-08-12 09:30:13 2713

各行各业

Dxperience 7.3.3 简体中文本地化

注意:2007/11/2116点更新,之前下载的请重新下载,并且使用本地址的DXperience7.3.3(http://www.cnblogs.com/fosoyo/archive/2007/11/20/966330.html),否则会出现key不同。解压密码请在群里询问downloadThisisforforVisualStudio2005,2008在项目中加入附件中fosoyo.cnblogs.com.Localization.dll引用在MDI的M

系统 2019-08-12 09:27:42 2713

各行各业

Amazon Dynamo DB

如果做类似的应用,应该在协议上尽量兼容业界的著名实现,既方便抢用户,也可以避免一些可能的自创协议的问题。AmazonDynamoDB使用Json协议,格式还是比较简洁的,但是Json本身的处理可能比较耗费时间,特别是序列化/反序列化,Amazon选择这个也算是一个折中吧。http://docs.amazonwebservices.com/amazondynamodb/latest/developerguide/MakingHTTPRequests.html

系统 2019-08-12 09:27:38 2713