搜索到与相关的文章
Python

用Python统计瓦尔登湖的词频

在文本处理中,我们经常需要对文本中的单词出现频率做一个统计,本文以英文小说《瓦尔登湖》为例,统计一下作者最喜欢用什么单词,他们各自的出现频率如何。首先需要《瓦尔登湖》的文本:点击下载《瓦尔登湖》(https://pan.baidu.com/s/1o75GKZ4)思路分析:首先,要打开文件,把里面的内容写到字符串里面。接着,要对字符串进行分词,分割成独立的单词。最后,根据每个单词进行词频统计。把下载好的“Walden.txt”放到桌面,复制一下完整的路径名,

系统 2019-09-27 17:46:27 2387

Python

Python模拟百度登录实例详解

最近公司产品和百度贴吧合作搞活动,为了增加人气,打算做个自动签到的小程序。这个是测试登录的代码,写的比较随意,仅实现了登录并读取关注贴吧列表,下边的就比较简单。百度登录还是有点麻烦的,由于用的ssl,所以要先获取token,然后再登录,这个用finddle2分析下,还是比较好解决的。#-*-coding:utf8-*-importurllib2importurllibimportcookielibimportreimportbs4URL_BAIDU_IND

系统 2019-09-27 17:38:35 2387

编程技术

中国十大城市美女(经典套图)

NO.1大连美女豪放婉约漂亮指数:95东北女子向来以白面长身著称。大连美眉则无疑集东北女性的精华于一身。与江南女子相比,大连美眉也许婉约不够,但却多了一份豪气;与东北的其他内陆城市女人相比,大连美眉身上又多了一些清丽和雅致。记者打望:《幸福时光》、《金粉世家》、《白领公寓》等影视作品中的那个如天使般的女生董洁就是大连女孩子的典型代表。最近一次见到董洁是在上海电影节上,她穿着设计简单的牛仔裤,挎着一个大包,特别干练。NO.2重庆美女热情似火漂亮指数:94大约

系统 2019-08-29 23:23:42 2387

Tomcat

Tomcat6 配置多虚拟主机,多域名绑定一IP

搞了Tomcat6配置多虚拟主机很久,终于OK了。真是够吐血的,记录下来,方便以后查阅了。实现效果:http://localhost访问一个项目例如一个助学网。http://localhost1访问一个项目例如一个办公系统实现方案,需要修改两个地方一个是C:\WINDOWS\system32\drivers\etc\hosts文件,改为127.0.0.1localhost127.0.0.1localhost1另一个要改的就是server.xml,修改后如下

系统 2019-08-29 23:15:45 2387

编程技术

Google OAUTH + OpenID解决方案

【转】GoogleOAUTH+OpenID解决方案由农夫一号发表于三月15th,2012同系列文章,转载自GoogleOAUTH+OpenID解决方案,蓝色字是我加的注解或是着重提示。在前面已经介绍过OAuth与OpenID,这两种服务,Google都实现了。我们可以通过GoogleOAuth服务为Google用户的资源进行授权,如用户通过第三方软件调用GoogleOpenAPI操作用户的资源时,就需要用户对第三方软件授权;通过GoogleOpenID服务

系统 2019-08-29 23:06:38 2387

编程技术

OA开发笔记

OfficeAutomation,简称OA,是一种常见的办公管理系统。包括采购,销售,财务及人事和管理模块。我现在讲述的OA是根据讯盟软件的OA进行二次开发的OA。讯盟的OA是通过加密狗来加密的,我通过更换exe程序已经把OA的加密破解了。通过jad编译里面的Class文件,我可以修改其用户数的限制。里面的源代码多数是JSP的,做入门的时候做修改非常的容易,但安全性不够。里面的代码非常的杂乱,我花了很多时间才把代码看清楚。用户登陆:供应商要增加运费负担(卖

系统 2019-08-29 23:02:29 2387

编程技术

《将心注入》书摘

将心注入副标题:星巴克创始人,全球董事长霍华德.舒尔茨自述作者:[美]霍华德·舒尔茨/[美]多利·琼斯·扬译者:文敏[书摘1]星巴克的历史并不仅仅是一个发展和获胜的历程,它也是关于如何以不同方式来建立一个公司的故事。它完全不同于我父亲曾工作过的那种公司。它证明了一个以心灵为导向、以自然为灵魂的公司仍然可以赚钱。它表明了一个公司在保证它的股东们能长久赢利的同时,却不必牺牲它尊重员工的核心价值—皆因我们有一个领导团队,他们相信这样做是正确的,而且相信这是运作一

系统 2019-08-29 22:58:41 2387

SqlServer

SQLServer2005获取大数据集时内存不足的解决办法

今天在修改search的建立索引的程序的时候,发现了这个错误使用jdbc读取SQLServer2005的一个表全部记录,该表具有10W记录,结果发生以下错误:Java代码com.microsoft.sqlserver.jdbc.SQLServerException:系统内存不足。请对大型ResultSet使用服务器端游标:Javaheapspace。ResultSet大小:236,535,956。JVM总内存大小:312,213,504。atcom.mic

系统 2019-08-29 22:57:58 2387

编程技术

分享一个Winform下的分页控件

前两天有一个简单的C/S项目用到分页,因为是Winform下,没有现成的,自己也懒得写,就找了下,看到了ycmoon的一个控件http://www.cnblogs.com/ycmoon/archive/2010/01/07/1640689.html参考后,做了简化,只保留了分页的部分,主要是点击事件的Delegate,未做过多测试,有兴趣的朋友可以下载源码自行修改,如有好的建议,也可以给我反馈。3w@live.cn,效果如下:控件设计界面:设计时:运行时:

系统 2019-08-29 22:53:06 2387

编程技术

Lucene-2.2.0 源代码阅读学习(17)

根据Lucene-2.2.0源代码阅读学习(16)中对IndexFileDeleter类和CommitPoint类的源代码的阅读学习,在此进行总结:一个提交点所具有的信息如下所示:longgen;//下次提交索引段segments_N的版本Listfiles;//属于当前索引目录的索引段的一个列表StringsegmentsFileName;//一个索引段booleandeleted;//删除标志一个提交点具有的行为:1、通过getSegmentsFile

系统 2019-08-29 22:44:04 2387