阅读更多本文分享自6丁一的猫的博客,主要是python调用hanlp进行命名实体识别的方法介绍。以下为分享的全文。1、python与jdk版本位数一致2、pipinstalljpype1(python3.5)3、类库hanlp.jar包、模型data包、配置文件hanlp.properties放在一个新建目录4、修改hanlp.properties中root根目录,找到data代码调用如下:1|#coding:utf-82|'''3|Createdon20
系统 2019-09-27 17:52:21 2138
这是作者的系列网络安全自学教程,主要是关于网安工具和实践操作的在线笔记,特分享出来与博友共勉,希望您们喜欢,一起进步。上一篇文章分享了OllyDbg动态分析工具的基础用法,并简单讲解两个Crakeme逆向工程破解实战方法;本篇文章将介绍Chrome浏览器的Network功能,并解析下载快手视频,同时分享了一个Python解析Network链接的难题。希望对初学者有帮助,大神请飘过,谢谢各位看官!下载地址:https://github.com/eastmou
系统 2019-09-27 17:52:06 2138
Python产生一个数值范围内的不重复的随机数,可以使用random模块中的random.sample函数,其用法如下:importrandomrandom.sample(population,k)函数从序列或集合population中返回一个长度为k的随机数列表,并且列表中的随机数元素之间是不重复的,如:>>>a=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]>>>a[1,2,3,4,5,6,7,
系统 2019-09-27 17:52:06 2138
Python语言的初学者,特别是"惊奇者"(也就是那种第一眼就被毫无意义的某些特性吸引,之后持续说服自己的人)认为Python不需要C语言的for语句,因为他们能用优雅的Pythonfor来代替类C的for.Cpy的循环方式:复制代码代码如下:for(i=s;i}Python的循环方式:复制代码代码如下:foriinrange(num)[s:e:step]:最近,我写了一个循环100000000遍的代码,不幸的是(也正是所预计的),Python把机器内存吃
系统 2019-09-27 17:51:24 2138
阅读更多Python调用hanlp的方法此前有分享过,本篇文章分享自“逍遥自在017”的博客,个别处有修改,阅读时请注意!1.首先安装jpype首先各种坑,jdk和python版本位数必须一致,我用的是JPype1-py3版本号0.5.5.2、1.6jdk和Python3.5,win764位下亲测没问题。否则死翘翘,有可能虚拟机都无法启动:出错调试,原因已说;测试成功会有输出。下面启动虚拟机跑hanlp2.下载各种安装包使用自定义的HanLP——HanLP
系统 2019-09-27 17:50:20 2138
多态问起面向对象的三大特性,几乎每个人都能对答如流:封装、继承、多态。今天我们就要来说一说Python中的多态。所谓多态:就是指一个类实例的相同方法在不同情形有不同表现形式。多态机制使具有不同内部结构的对象可以共享相同的外部接口。这意味着,虽然针对不同对象的具体操作不同,但通过一个公共的类,它们(那些操作)可以通过相同的方式予以调用。我在《Python中的设计模式详解之:策略模式》一文中详细描述了策略模式的实现,而策略模式就是典型的多态应用。之前的代码我就
系统 2019-09-27 17:49:30 2138
1,MYSQL安装与使用相关:https://blog.csdn.net/qq_30336433/article/details/80037989navicat注册安装和激活(验证可行)PyMySQL是在Python3.x版本中用于连接MySQL服务器的一个库,Python2中则使用mysqldb。https://www.runoob.com/python3/python3-mysql.htmlPython3MySQL数据库连接-PyMySQL驱动http
系统 2019-09-27 17:49:21 2138
Pycharm没有内置的python解释器,需要我们自己下载python解释器。在很多python项目中,会导入第三方的模块,逐个去下载导入很不方便。我们通常使用Anaconda来管理python的项目环境,Anaconda自带python解释器,且提供了大量的第三方模块,引入第三方库很方便。Anaconda的安装如果未勾选第一个添加到Path环境变量中,后面需要手动在path环境变量中添加conda.exe所在目录的路径。红框圈出的是Anaconda核心
系统 2019-09-27 17:48:58 2138
核心代码:#!/usr/bin/envpython#-*-coding:utf-8-*-frombisectimportbisect_LIST1,_LIST2=[],[]_INIT=Falseip2int=lambdaip_str:reduce(lambdaa,b:(a<<8)+b,[int(i)foriinip_str.split('.')])def_init():global_LIST,_INITifnot_INIT:forlinopen('ipdat
系统 2019-09-27 17:48:36 2138
使用urllib2,太强大了试了下用代理登陆拉取cookie,跳转抓图片......文档:http://docs.python.org/library/urllib2.html直接上demo代码了包括:直接拉取,使用Reuqest(post/get),使用代理,cookie,跳转处理#!/usr/bin/python#-*-coding:utf-8-*-#urllib2_test.py#author:wklken#2012-03-17wklken@yeah
系统 2019-09-27 17:48:01 2138
高性能服务器TornadoPython的web框架名目繁多,各有千秋。正如光荣属于希腊,伟大属于罗马。Python的优雅结合WSGI的设计,让web框架接口实现千秋一统。WSGI把应用(Application)和服务器(Server)结合起来。Django和Flask都可以结合gunicon搭建部署应用。与django和flask不一样,tornado既可以是wsgi应用,也可以是wsgi服务。当然,选择tornado更多的考量源于其单进程单线程异步IO的
系统 2019-09-27 17:38:14 2138
Python中的sys模块极为基础而重要,它主要提供了一些给解释器使用(或由它维护)的变量,以及一些与解释器强交互的函数。本文将会频繁地使用该模块的getsizeof()方法,因此,我先简要介绍一下:该方法用于获取一个对象的字节大小(bytes)它只计算直接占用的内存,而不计算对象内所引用对象的内存这里有个直观的例子:importsysa=[1,2]b=[a,a]#即[[1,2],[1,2]]#a、b都只有两个元素,所以直接占用的大小相等sys.getsi
系统 2019-09-27 17:55:36 2137
原因1:导入包中没有__init__文件,无法被识别为python包原因2:在main主函数中使用了相对导入,Python是不支持常规相对导入形式(from..importxxx)原因1好解决,原因2解决方式如下:在main主函数中使用sys.path.append()进行导入:importosimportsyssys.path.append(os.path.abspath('../XXX'))importxxuif__name__=='__main__'
系统 2019-09-27 17:54:52 2137
Python之成为图像处理任务的最佳选择,是因为这一科学编程语言日益普及,并且其自身免费提供许多最先进的图像处理工具。本文主要介绍了一些简单易懂最常用的Python图像处理库。当今世界充满了各种数据,而图像是其中高的重要组成部分。然而,若想其有所应用,我们需要对这些图像进行处理。图像处理是分析和操纵数字图像的过程,旨在提高其质量或从中提取一些信息,然后将其用于某些方面。图像处理中的常见任务包括显示图像,基本操作(如裁剪、翻转、旋转等),图像分割,分类和特征
系统 2019-09-27 17:54:47 2137
学习器在测试集上的误差我们通常称作“泛化误差”。要想得到“泛化误差”首先得将数据集划分为训练集和测试集。那么怎么划分呢?常用的方法有两种,k折交叉验证法和自助法。介绍这两种方法的资料有很多。下面是k折交叉验证法的python实现。##一个简单的2折交叉验证fromsklearn.model_selectionimportKFoldimportnumpyasnpX=np.array([[1,2],[3,4],[1,3],[3,5]])Y=np.array([
系统 2019-09-27 17:54:40 2137