搜索到与相关的文章
编程技术

数位之墙的主题式汇整和机器自动聚合

数位之墙的主题式汇整和机器自动聚合Zhengyun_ustc20070315发现数位之墙竟然在半年前曾经这么说过,呵呵,很像我们最开始谈起的概念,只不过不再是搜索引擎人员来做“搜罗”,而是机器自动生成的,从而发现所有热点,并进一步精耕细作为一个一个有趣的话题,继而串连起来形成专题。百度新闻、Google新闻的原理也就是这样。只不过,新闻的自然语言处理还是相对简单的,毕竟文字规整,内容聚焦性强,发散性弱。网民零散的语言则更发散,更无厘头,文字风格更迥异,所以

系统 2019-08-12 01:32:26 2566

各行各业

Subclipse 1.8.20 发布,Eclipse 的 SVN 插件

Subclipse1.8.20发布了,完整的改进内容请看:http://subclipse.tigris.org/subclipse_1.8.x/changes.htmlSubclipse是一个为EclipseIDE添加Subversion支持的项目。支持几乎所有版本的Eclipse。Eclipse的更新地址是:http://subclipse.tigris.org/update_1.6.xhttp://subclipse.tigris.org/updat

系统 2019-08-12 01:31:44 2566

Python

《Python数据分析与挖掘实战》笔记:Apriori算法代码与使用

Apriori代码importpandasaspd#自定义连接函数,用于实现L_{k-1}到C_k的连接defconnect_string(x,ms):"""x:频繁项集列表ms:连接符,这里用‘---’return:返回长度+1的频繁项集,即L_{k-1}到C_k的连接"""x=list(map(lambdai:sorted(i.split(ms)),x))#去除序列中的连接符,并将元素排列n=len(x[0])#每个频繁项集的长度为nr=[]forii

系统 2019-09-27 17:57:03 2565

Python

【Python】DataFrame的列标准化

这里分享DataFrame的列标准化以及对DataFrame分组之后列标准化。DataFrame的列标准化importpandasaspdimportnumpyasnpdf=pd.DataFrame(data={'A':[1,1,2,2,2],'B':[2,3,4,6,5],'C':[3,8,5,12,6]})dfdf.apply(lambdax:(x-np.min(x))/(np.max(x)-np.min(x)))3.DataFrame分组之后列标准化

系统 2019-09-27 17:56:06 2565

Python

python网络进程

多任务编程意义:充分利用计算机的资源提高程序的运行效率定义:通过应用程序利用计算机多个核心,达到同时执行多个任务的目的实施方案:多进程、多线程并行:多个计算机核心并行的同时处理多个任务并发:内核在多个任务间不断切换,达到好像内核在同时处理多个任务的运行效果进程:程序在计算机中运行一次的过程程序:是一个可执行文件,是静态的,占有磁盘,不占有计算机运行资源进程:进程是一个动态的过程描述,占有CPU内存等计算机资源的,有一定的生命周期*同一个程序的不同执行过程是

系统 2019-09-27 17:55:19 2565

Python

Python数据可视化编程实战:导入数据

1.从csv文件导入数据原理:with语句打开文件并绑定到对象f。不必担心在操作完资源后去关闭数据文件,with的上下文管理器会帮助处理。然后,csv.reader()方法返回reader对象,通过该对象遍历所读取文件的所有行。实验结果截图:2.从Excel中导入文件数据Excel文件可以转换成csv文件,然后通过上述的方法导入,但是如果想自动化地对大量文件进行数据管道处理(作为数据连续处理流程的一部分),那么手动把每个Excel文件转换成CSV文件的做法

系统 2019-09-27 17:55:11 2565

Python

在python中利用opencv简单做图片比对的方法

下面代码中利用了两种比对的方法,一对图片矩阵(mxm)求解特征值,通过比较特征值是否在一定的范围内,判断图片是否相同。二对图片矩阵(mxm)中1求和,通过比较sum和来比较图片。#-*-coding:utf-8-*-importcv2ascvimportnumpyasnpimportosfile_dir_a='C:\Users\wt\Desktop\data\image1\\'file_dir_b='C:\Users\wt\Desktop\data\ima

系统 2019-09-27 17:50:03 2565

Python

Python开发最牛逼的IDE:Pycharm的安装与使用!适合新手!

(其实其它的工具,例如eclipse也可以写,只不过比较麻烦,需要安装很多的插件,所以说pycharm是最牛逼的)pycharm,下载专业版的,不要汉化….下载完成后,直接啪啪啪傻瓜安装完成后,接下来就是使用了Python初学者有什么不懂的可以来问我,一起学习!如果你依然在编程的世界里迷茫,可以加入我们的Python学习扣qun:784758214,看看前辈们是如何学习的。交流经验。从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基

系统 2019-09-27 17:46:16 2565

编程技术

牛腩自制TXT文本分割工具

以前在博客园中看到某位朋友也发过一个分割工具的,不过那时自己不需要,也就没有收藏,今天自己需要把一个大的TXT文本文件分割成多份了,可又找不着那篇文章了,只好自己做了个简单的,效果如图:以下为下载地址:单文件下载:http://taotao.wsyren.com/download/txt_singlefile.rar源码下载:http://taotao.wsyren.com/download/txt_source.rar牛腩自制TXT文本分割工具

系统 2019-08-29 23:28:07 2565

编程技术

虚拟机新增硬盘空间

1.退出LINUX系统,在vmware启动界面中选择VM菜单下的Settings来增加磁盘,然后选择add,选择harddisk,点击Next。2.选中createanewvirtualdisk,点击下一步,选择scsi,继续下一步。选择好你要新增磁盘的大小,勾选Allocatealldiskspacenow立即分配空间,下一步,在你的硬盘上选择一个目录来创建,点击完成结束。这样,一个新增的空间就创建好了。www.2cto.com3.我们输入新增这块硬盘的

系统 2019-08-29 22:39:40 2565