阅读更多分词工具的选择:现在对于中文分词,分词工具有很多种,比如说:jieba分词、thulac、SnowNLP等。在这篇文档中,笔者使用的jieba分词,并且基于python3环境,选择jieba分词的理由是其比较简单易学,容易上手,并且分词效果还很不错。分词前的准备:待分词的中文文档存放分词之后的结果文档中文停用词文档(用于去停用词,在网上可以找到很多)分词之后的结果呈现:图1去停用词和分词前的中文文档图2去停用词和分词之后的结果文档分词和去停用词代码
系统 2019-09-27 17:47:53 2516
第一就是教的和布置的作业难度不一样。python在课堂上学到的东西太基础。然而作业基本上在教义是不能直接找到公式照搬的(尤其是第五次作业文件处理要用到pandas和numpy),所以做作业只能自己去找那些对应的库学习。课上因为自己带的电脑,我觉得边讲边练也没有实际的效果。老师在上面操控屏幕。下面却在干自己的事情。建议:我觉得老师可以在课堂上多提问学生一些问题。就可以避免同学注意力分散其次,我们也是第一次用博客园提交作业,他可以让别人看到你的代码,我觉得这个
系统 2019-09-27 17:46:57 2516
一、函数list(1)定义:用打开的文件作为参数,把文件内的每一行内容作为一个元素(2)格式:list(文件)(3)例子:withopen(r"test01.txt",'r')asf:l=list(f)forlineinl:print(line)2.函数read(1)作用:按照字符进行读取文件内容(2)格式:文件.read(数字)如果数字缺省,那么代表把所有的字符全都读出来;如果里面含有数字那么代表一次性读取这么多字符(3)注意:允许输入参数读取几个字符,
系统 2019-09-27 17:45:50 2516
前言发布这篇Chat的初衷是想和各位一起分享一下动手来做聊天机器人的乐趣,因此本篇文章适合用于深度机器学习的研究和兴趣发展,因为从工业应用的角度来看使用百度、科大讯飞的API接口会更加的适合。在这篇文章中,希望和大家一起共同交流和探索动手实践的乐趣,当然也欢迎大神来做深度的探讨以及吐槽。这篇Chat的基础源代码来自互联网,我进行了综合优化和部分代码的重写,我也会在这边文章发布的同时将所有源代码上传到Git分享出来,这样在文章中我就不占用篇幅贴出全部的源代码
系统 2019-09-27 17:45:46 2516
first,wecanseetheproblem:Thisisastoryoffourboys-Chinku,Dinku,PinkuandTinku.Onedayallofthemdecidetosavetheirmoneyinabank.Theyselectabankcalled"LenaBank"Thebank'sspecialtyis:Ineverymonththemoneygetsdoubled.In2ndmonth,Chinkuwithdraws
系统 2019-08-29 23:52:41 2516
java范型简介一.简单认识java范型经常听人说“范型”,我一直不是太明白什么叫“范型”,今天就查阅了一些文章,给我的第一感觉就是之所以在java中用范型,就是为了让一些错误在编译阶段就可以暴露出来,而不用在运行阶段才抛出异常。下面给出一个简单例子来说明。/***//***没有利用范型的例子*/publicvoidexample1()...{ArrayListarray=newArrayList();array.add("thisisastring");
系统 2019-08-29 23:37:07 2516
安哥拉:angolaleadtheway,ourteamisourpeople(安哥拉领跑,我们全民皆兵)阿根廷:getup,argentinaareonthemove(起来,阿根廷在行动)澳大利亚:australia'ssocceroos-boundforglory(足球袋鼠-注定辉煌)巴西:vehiclemonitoredby180millionbrazilianhearts(被一亿八千万颗心关注的巴西战车)哥斯达黎加:ourarmyistheteam
系统 2019-08-29 23:17:27 2516
一)开发前准备工作,下载SQLiteExpert工具(SQLite的可视化工具),大家可以去搜一下二)工具准备好了,咱们开始开发吧先贴一下项目的目录结构:1.写一个获得创建修改数据库的工具类,这个类继承自SQLiteOpenHelperpackagecom.xiaobo.service;importandroid.content.Context;importandroid.database.sqlite.SQLiteDatabase;importandro
系统 2019-08-29 23:06:58 2516
--1)找到表中最大的ob_seq_id比如(100000)得到对应的objectId(500000),在cpdb.对应的比ob_seq_id大的则是新改变的,需要处理,一种是旧的数据,一种是新的数据--旧的数据是ob_seq_id>100000andobjectid<=500000的是旧数据ob_seq_id>100000andobjectid>500000的是新数据--处理方法,删除旧数据,统一将ob_seq_id>100000的插入。setANSI_
系统 2019-08-29 22:50:38 2516
今天帮同事看一个问题,程序初始化的时候要通过ocx控件下载一些东西到客户端,下载的地址是通过程序配置的。运行的时候提示“onlysupports'http'or'https'schemes”,看提示的url地址没有问题啊,把提示的那个url复制到IE的地址栏里回车,也可以访问啊,没有报错误!搞了一会,突然发现那个提示的URL串上是在端口号后面有一个空格,因为程序处理的时候不会对空格处理成“%20”,而在浏览器里IE会自动加的。所以程序发送这个URL的时候会
系统 2019-08-29 22:38:45 2516