搜索到与相关的文章
编程技术

数据清洗小工具及技巧

在做datamining,很重要的一部是对数据进行清洗,由于数据量巨大,我是分段从数据库中取出数据存成文本格式,最后再将所有的文本合并成一个大的文件,在文件合并的过程中,我用了一个小工具,Txtunit.exe,短小精悍,合并完之后会有一些空白行的出现,我们需要将这些空白行清除掉,做法参见emeditor删除空行-HOHO网页设计-51CTO技术博客主要是使用了一个匹配的正则^[\t]*\n数据清洗小工具及技巧

系统 2019-08-29 23:22:43 2771

Windows

使用Windows共享打印机进行打印

对于那些既有Windows电脑又有Ubuntu电脑但却只有一台打印机的用户,这篇博文向你展示如何在Windows中共享一个打印机,并允许Ubuntu使用它来打印。几乎所有的打印机都默认支持Windows系统。许多打印机生产商都为Windows生产打印机,但为包括Ubuntu在内的Linux系统生产的并不多。所以,假如你有一台支持Windows的打印机,你可以在Windows机器上分享它,然后让其它系统来使用它来打印。在几年之前,我遇到了这个问题,那时大多数

系统 2019-08-29 22:06:06 2771

PHP

PHP实现调用淘宝SDK开放接口返回天猫或淘宝商品

在淘宝开发平台申请到appkey及appsecret并在开放平台上的apptools在线测试成功以后,就可以在自己的项目中使用淘宝SDK来调用淘宝或天猫的商品详情了,包括标题、图片、价格等等所有信息都可已返回。1.整体思路:首先需要下载SDK工具包(我的是在个人中心->网站[左侧边栏]->查看->网站概况页面底部有下载链接)。将下载到的SDK工具包解压到某个目录下:然后在该目录下创建两个文件:index.php用于提交宝贝详情页链接和返回结果的显示,tao

系统 2019-08-12 09:29:48 2771

Tomcat

Tomcat 多端口 多应用

当你使用Tomcat作为WebServer的时候,是不是会想过这样的一个问题:如何利用Tomcat建立两个WebServer,同时侦听来自不同端口的请求呢?要实现这一点是很简单的。以下假设Tomcat安装在D:/Tomcat5.0目录下。Tomcat在启动的时候,都会从D:/Tomcat5.0/conf/server.xml中获得server启动的一些基本信息;在server.xml中,你会看到这个节点,如下所示:

系统 2019-08-12 01:33:58 2771

数据库相关

Outlook Add-in(COM加载项)技术指南(四)

OutlookAdd-in(COM加载项)技术指南RevisionHistory:VersionDateCreatorDescription1.0.0.12004-3-9郑昀草稿2.3.2.g_oForwardBHandler_Click事件这个按钮的名称是“转发”.这个对话框中的内容将根据您选中的上下文而定,更详细内容参见下面章节。简单的说,我们将根据您选中的项是邮件,还是便笺,或者日程,或者联系人,智能显示发送内容。“联系人列表”将从您的Outlook

系统 2019-08-12 01:33:51 2771

Python

最近写python的一点心得

所有的进程需要进行监管,都认为是不可靠的,可以使用supervised或是forever之类的进行外部程序的监管,如redis等,一旦down机要立刻重启,最好还有相关的发送邮件之类的对于自己写的程序,根据情况要在业务程序监管上,比如异常killed掉了,或是内在泄漏了outofmemory了,要时刻认为自己的程序会crash,时刻标记自己的信息,以便能断点续执行,特别是对一些扫数据库的任务,能接着那个点上,而不是重头再来,这个很重要最好这种情况的moni

系统 2019-08-12 01:32:21 2771

Python

Python面试准备(二)之 Python编码规范

编码规范什么是PEP8?答:PEP8通常会听别人提到,但是具体的指什么内容呢,简单介绍下。《PythonEnhancementProposal#8》(8号Python增强提案)又叫PEP8,他针对的Python代码格式而编订的风格指南。了解Python之禅么?答:通过importthis语句可以获取其具体的内容。它告诉大家如何写出高效整洁的代码。了解DocStrings么?答:DocStrings文档字符串是一个重要工具,用于解释文档程序,帮助你的程序文档

系统 2019-09-27 17:48:42 2770

编程技术

Memcached深入理解 – memcached究竟是如何运作

网上其实有很多文章说明了memcached是如何运作的,特别是底层的内存分配是如何运作的。我参考过很多资料,比较有启发意义的有几个:首先是官方的英文资料,虽然文章太多、很难看懂,我个人觉得说得也不是太清晰,不够直观(附上官方wiki地址)。还有git上memcached原作者的protocol.txt也值得一读,有时间的话,我会翻译一下。其次是mixi网站的核心技术人员写的5篇全面剖析,这5篇文章写得很实用,从各方面彻底解剖了memcached,可惜的是这

系统 2019-08-29 23:50:02 2770

编程技术

由家具偶然想到的

洗手间灯管光荣退休了,但是他的岗位又不可或缺,于是下午只好出去找一个新的长期合同工。在路上,遇到了一户人搬家,本也平平无奇,在这个有那么点镀了白银的地段,搬家的人从早到晚都没歇息过。但是,看到一个家具,让我陷入了沉思。这种家具很多人可能都见过:几根无缝钢管,几个连接板,十几个连接加固装置,OK,剩下的事情就是您自己发挥自己的主观能动性就可以了,爱怎么拼就怎么拼,像拼积木似的。全部拼完后,一看屋里:重金属风格,爽死了。如果还没有主观感受的可参考我用摄像头拍的

系统 2019-08-29 23:47:13 2770

SqlServer

SQL Server 2008中的代码安全(一):存储过程

SQLServer2008中SQL应用系列--目录索引最近对SQLServer2008的安全入门略作小结,以作备忘。本文涉及两个应用:存储过程加密和安全上下文。<一>存储过程加密其实,用了这十多年的SQLserver,我已经成了存储过程的忠实拥趸。在直接使用SQL语句还是存储过程来处理业务逻辑时,我基本会毫不犹豫地选择后者。理由如下:1、使用存储过程,至少在防非法注入(inject)方面提供更好的保护。至少,存储过程在执行前,首先会执行预编译,(如果由于非

系统 2019-08-29 23:09:50 2770