搜索到与相关的文章
各行各业

map/reduce多个field组合排序

年初领导让做一个检索热词的干预,也就是将统计用户搜索热词的结果,人工的指定其在排行榜中的位置。当然这任务比较恶心,咱只是个出来混饭碗的民工,不出格的事儿也可以忍了说技术。工作流程是收集用户的搜索日志,统计每个keyword在一天之中被搜索的次数,根据每个keyword的统计历史,使用数学方差得出它近期热度的评分,然后降序排序给出结果列表。(如果做的更细致可以在计算前加入语义分析的部分,这样能更好的分析出刚刚流行的网络用语,我没有做那么深,这里暂时不表)现在

系统 2019-08-12 09:27:35 2033

各行各业

wireshark总结

拖延了两个月的总结!下面的很大一部分来自其它博客。wireshark过滤器的区别捕捉过滤器(CaptureFilters):用于决定将什么样的信息记录在捕捉结果中。需要在开始捕捉前设置。在Capture->CaptureFilters中设置显示过滤器(DisplayFilters):在捕捉结果中进行详细查找。他们可以在得到捕捉结果后随意修改。两种过滤器的目的是不同的。捕捉过滤器是数据经过的第一层过滤器,它用于控制捕捉数据的数量,以避免产生过大的日志文件。显

系统 2019-08-12 09:27:02 2033

各行各业

汇编helloword

代码assumecs:code,ds:datadatasegmentmsgdb"helloworld"dataendscodesegmentstart:movax,datamovds,axmovbx,0b800hmoves,bxmovcx,11movah,01000010bmovsi,0movbx,0s:moval,ds:[si]moves:[bx],almoves:[bx+1],ahincsiaddbx,2loopsmovax,4c00hint21hco

系统 2019-08-12 09:26:59 2033

各行各业

学习GitHub

学习GitHub:GitHub教程:http://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000知乎-怎样使用GitHub:http://www.zhihu.com/question/20070065如何高效利用GitHub:http://www.yangzhiping.com/tech/github.html#q1学习GitHub

系统 2019-08-12 09:26:43 2033

各行各业

msn9强制更新(版本:14.0.8089.726)后的 2003

早上试了一下,msn开始强制更新了。不更新就无法登录,简直了。Win2003下面无法正常安装。解决办法就是找到MSI版本的安装程序,可惜MS本身不提供,只好自己找了。找个装过刚更新过MSN的xp系统的电脑,浏览c:\ProgramFiles\CommonFiles\WindowsLive\.cache\目录下看看最新日期的那几个文件夹,那里面就有了。祝各位顺利更新。纳米下载:http://www.namipan.com/d/MSN_20091118_14.

系统 2019-08-12 09:26:39 2033

Python

Python的定时器与线程池

定时器执行循环任务:知识储备Timer(interval,function,args=None,kwargs=None)interval===》时间间隔单位为sfunction===》定制执行的函数使用threading的Timer类start()为通用的开始执行方法cancel()为取消执行的方法普通单次定时执行fromthreadingimportTimerimporttime#普通单次定时器defhandle():print("普通单次定时器函数被执

系统 2019-09-27 17:56:59 2032

Python

用python记录运行pid,并在需要时kill掉它们的实例

我在跑爬虫程序的时候,由于爬虫程序的等待目标服务器返回数据的时间很长,而cpu占用很低,所以经常挂着代理一跑就跑好几百个。但是爬虫程序通常是写了死循环,或直到分配给该进程的任务都跑完才退出的。如果我们想中途结束掉这些任务,是没办法手工一个一个kill掉的。那么该如何结束这些进程呢?我的方法就是在运行爬虫进程时,记录该进程的Pid,然后在需要手动结束时,再用语句kill掉它们。foriin{1..100}donohuppythonNetEase_comms_

系统 2019-09-27 17:56:59 2032

Python

Python学习:partial() 偏函数

Python偏函数是通过functools模块被用户调用。偏函数partial应用函数在执行时,要带上所有必要的参数进行调用。但是,有时参数可以在函数被调用之前提前获知。这种情况下,一个函数有一个或多个参数预先就能用上,以便函数能用更少的参数进行调用。偏函数是将所要承载的函数作为partial()函数的第一个参数,原函数的各个参数依次作为partial()函数后续的参数,除非使用关键字参数。对于整数100,取得对于不同数m的100%m的余数。fromfun

系统 2019-09-27 17:56:32 2032

Python

用python进行数据分析:记录(一)

python数据分析记录用python进行数据分析:记录(一)主要记录一些语法语句的使用Seaborn的joinplot图无法显示pearson相关系数如何让sns.joinplot显示pearson相关系数:1.按自己的思路写的代码显示的图标没有rp系数的显示2.如图3.导入stats,写函数4.如图关于zip()函数和enumerate()函数zip()1.该函数用于将多个可迭代对象作为参数,依次将对象中对应的元素打包成一个个元组,然后返回由这些元组组

系统 2019-09-27 17:55:54 2032

Python

Python中的字符串切片(截取字符串)的详解

字符串索引示意图字符串切片也就是截取字符串,取子串Python中字符串切片方法字符串[开始索引:结束索引:步长]切取字符串为开始索引到结束索引-1内的字符串步长不指定时步长为1字符串[开始索引:结束索引]练习样例#1.截取2-5位置的字符num_str_1=num_str[2:6]print(num_str_1)#2.截取2-末尾的字符#当开始索引和结束索引为开始和结束时可以省略不写num_str_1=num_str[2:]print(num_str_1)

系统 2019-09-27 17:55:42 2032