搜索到与相关的文章
Python

Python中文文本分句 sentence tokenize

由于nltk等都没有实现句子级别的tokenize,或者文本分句。这里使用python正则,快速实现一个,可以把文本分成若干个小句子。代码如下,如果你想要实现自己个性化的分句,例如只考虑“。!”等的分句,可以调整正则项,“|”代表或的意思。defsent_tokenize(x):sents_temp=re.split('(:|:|,|,|。|!|\!|\.|?|\?)',x)sents=[]foriinrange(len(sents_temp)//2):s

系统 2019-09-27 17:47:38 2615

Python

Python学习笔记之使用 python -m

0x00概述搭建FTP,或者是搭建网络文件系统,这些方法都能够实现Linux的目录共享。但是FTP和网络文件系统的功能都过于强大,因此它们都有一些不够方便的地方。比如你想快速共享Linux系统的某个目录给整个项目团队,还想在一分钟内做到,怎么办?很简单,使用SimpleHTTPServer。0x01使用各种Linux发行版通常都内置了Python,故使用此方法非常方便。在其它OS(比如Windows)此方法也有效,但是要麻烦一些,必须先搭建Python环境

系统 2019-09-27 17:46:50 2615

Python

完美解决python遍历删除字典里值为空的元素报错问题

exam={'math':'95','eng':'96','chn':'90','phy':'','chem':''}使用下列遍历的方法删除:1.foreinexam:2.ifexam[e]=='':3.delexam[e]结果出现下列错误,怎么解决:Traceback(mostrecentcalllast):File"Untitled.py",line3,inforeinexam:RuntimeError:dictionarychangedsizedur

系统 2019-09-27 17:38:14 2615

Python

python太阳花绘制

太阳花绘制‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬描述使用turtle库,绘制一个太阳花的图形,如下图所示:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬

系统 2019-09-27 17:32:55 2615

编程技术

pplication Fundamentals——应用程序基础知识

ApplicationFundamentals——应用程序基础知识Keyclasses——关键类ActivityServiceBroadcastReceiverContentProviderIntentInthisdocument——在这篇文章中ApplicationComponents——应用程序组件Activatingcomponents:intents——激活组件:意图Shuttingdowncomponents——关闭组件Themanifestfi

系统 2019-08-29 23:52:13 2615

Android

android 分辨率适配的方法

首先说明一点:这个方法不能说万能的,但是最起码它解决了分辨率跟密集度的关系,就是所有分辨率,只要传了第一次的参数,后面都不需要改动了,但是也引来一个问题,就是布局会因为图片资源小而失真,所以这也需要美工的同志多多配合的,废话不说,贴代码:第一步,先创建一个view信息的javabean类:packagecom.zte.layout.adapter;importandroid.view.View;/***存储View信息的JavaBean类**@author

系统 2019-08-29 23:20:44 2615

编程技术

head.s分析(11):关闭WATCHDOG

快乐虾http://blog.csdn.net/lights_joy/lights@hb165.com本文适用于ADIbf561DSPuclinux-2008r1.5-rc3(移植到vdsp5)VisualDSP++5.0(update5)欢迎转载,但请保留作者信息ENTRY(_real_start)[--sp]=reti;p0.l=lo(WDOGA_CTL);p0.h=hi(WDOGA_CTL);r0=0xAD6(z);w[p0]=r0;/*watchd

系统 2019-08-29 23:00:12 2615

编程技术

SWT图像处理入门

StandardWidgetToolkit(SWT,标准窗口小部件工具箱),是在Eclipse平台上使用的窗口小部件工具箱,它能向开发者提供和本机平台一致的用户界面和比较稳定的性能,也提供了强大的图像处理功能。本文首先介绍SWT封装的Image,ImageData等类,接着根据作者实际工作经验给出了一些常见图像处理的解决方法。

Java

Java新浪微博客户端开发第四步

这一步是对之前进行较大的改动。增加的类也比较多。包结构如下:0、Main:主函数入口1、MainDialog:主界面2、WeiboPanel:StatusPanel及CommentPanel的父类3、StatusPanel:所有有关“微博”的父类4、CommentPanel:所有有关“评论”的父类5、FriendTimeline:用于放置当前登录用户及其所关注用户的最新微博,继承自StatusPanel6、RepostTimeline:一条微博的“全部转发

系统 2019-08-29 22:42:51 2615

编程技术

便利的开发工具-log4cpp快速使用指南

简介:log4cpp是个基于LGPL的开源项目,是基于优秀的日志处理跟踪项目Java语言的log4j移植过来的。log4j介绍的文档很多,在java领域使用的也比较广泛,而这个功能强大的库对国内的C++语言开发人员却使用的不多。这里从开发人员使用的角度介绍这个库,使开发人员用最少的代价尽快掌握这种技术。下面先简单介绍一下这个项目的优点(也是log4j的优点),然后分原理,手动使用步骤,配置文件驱动方式使用步骤,其他考虑等方面进行讨论。以下讨论基于log4c

系统 2019-08-29 22:16:38 2615