利用统计进行中文分词与词性分析-IveelyLiu-博客园利用统计进行中文分词与词性分析今天,翻出了我以前在本科阶段写的一些论文,虽然有几篇没有发表。突然发现很多还是比较实用,虽然学术价值并不是很大,于是我重新整理了下,用最简单的方式,摘要了部分出来拼成此文,当然拼的原料都是自己的,本文适合初学者,如若转载,请著名版权。中文分词已经是老调重弹的话题了,传统的基于词库的分词技术应该是目前最基本的分词技术,在这里我不去深入挖掘,什么好什么不好的问题,今天我只想
系统 2019-08-12 01:31:59 2579
Google推出了牛逼的Python在线编辑器,以后协同项目代码就省心了,环境配置对于大多数人来说都是拦路虎,我们小白往往不知道:怎么正确的安装不知道选择什么怎么安装常用的第三方库。。。Google推出了一个在线的网站https://colab.research.google.com,这些问题现在已经不是问题了。而且Colab还有更多新奇的功能,绝对亮瞎我们的眼睛。下面跟着小编一起去看看吧一、新建云端notebook打开https://colab.rese
系统 2019-09-27 17:57:17 2578
好久没写技术相关的文章,这次写篇有意思的,关于一个有意思的游戏――QQ找茬,关于一种有意思的语言――Python,关于一个有意思的库――Qt。这是一个用于QQ大家来找茬(美女找茬)的辅助外挂,开发的原因是看到老爸天天在玩这个游戏,分数是惨不忍睹的负4000多。他玩游戏有他的乐趣,并不很在意输赢,我做这个也只是自我娱乐,顺便讨他个好,毕竟我们搞编程的实在难有机会在父辈面前露露手。本来是想写个很简单的东西,但由于过程中老爸的多次嘲讽,逼得我不得不尽力完善,最后
系统 2019-09-27 17:56:56 2578
推荐算法在互联网行业的应用非常广泛,今日头条、美团点评等都有个性化推荐,推荐算法抽象来讲,是一种对于内容满意度的拟合函数,涉及到用户特征和内容特征,作为模型训练所需维度的两大来源,而点击率,页面停留时间,评论或下单等都可以作为一个量化的Y值,这样就可以进行特征工程,构建出一个数据集,然后选择一个合适的监督学习算法进行训练,得到模型后,为客户推荐偏好的内容,如头条的话,就是咨询和文章,美团的就是生活服务内容。可选择的模型很多,如协同过滤,逻辑斯蒂回归,基于D
系统 2019-09-27 17:56:52 2578
多任务编程意义:充分利用计算机的资源提高程序的运行效率定义:通过应用程序利用计算机多个核心,达到同时执行多个任务的目的实施方案:多进程、多线程并行:多个计算机核心并行的同时处理多个任务并发:内核在多个任务间不断切换,达到好像内核在同时处理多个任务的运行效果进程:程序在计算机中运行一次的过程程序:是一个可执行文件,是静态的,占有磁盘,不占有计算机运行资源进程:进程是一个动态的过程描述,占有CPU内存等计算机资源的,有一定的生命周期*同一个程序的不同执行过程是
系统 2019-09-27 17:55:19 2578
代码:print([x[0]forxin[(a[i][0],a.append((a[i][1],a[i][0]+a[i][1])))forain([[1,1]],)foriinrange(100)]])视图:
系统 2019-09-27 17:53:23 2578
文章目录前言Github效果实现过程整体代码前言看电影的时候发现一个照片墙的功能,觉得这样生成照片挺好玩的,于是就动手用Python做了一下,觉得用来作照片纪念的效果可能会不错。Githubhttps://github.com/jiandi1027/photo.git效果实现过程1.获取图片文件夹的图片个数N,将底图拆分成XY块区域,且使X*Y(为了保证整体的协调,会舍弃几张图片,比如5张时可能只取22的4张图片)#打开图片base=Image.open(
系统 2019-09-27 17:50:27 2578
一.问题可以看到,猫眼网电影评分,票房等的数据在响应的html中并不是直接提供给你的。这里的xefcf,xef87等数据,是以‘特殊符号’的形式显示出来的。可以发现这里请求了一个woff字体文件,而xefcf,xef87等数据的规则就是在这其中的。所以我们只需要在请求这个网页的同时,截去这部分style,然后获得woff地址,将它下载到本地,进行解析,就可以实现对评分的解密了。但是再来看下面,当同一部电影的页面刷新时。这里的评分编码改变了,下面请求的wof
系统 2019-09-27 17:50:24 2578
Python中进程间共享数据,处理基本的queue,pipe和value+array外,还提供了更高层次的封装。使用multiprocessing.Manager可以简单地使用这些高级接口。Manager()返回的manager对象控制了一个server进程,此进程包含的python对象可以被其他的进程通过proxies来访问。从而达到多进程间数据通信且安全。Manager支持的类型有list,dict,Namespace,Lock,RLock,Semap
系统 2019-09-27 17:38:03 2578
检查Linux系统配置(内存、硬盘)神马的就不说,一般都是满足的,除非是哥们你用自己电脑搞着玩。。。安装oracle10g数据库1、下载oracle文件到/root目录并解压cd/rootwget–chttp://nadmin.haott.com/oracle_linux32.zip(此处我的安装包在另一台服务器上,故需下载到被安装的服务器)unzip./oracle_linux32.zip(解压)2、参数设置OS参数要求vi/etc/sysctl.con
系统 2019-08-29 23:16:28 2578