每天下班回家有时间就写个小例子,一个月下来的成果,分享给大家学习~第一个1、2、3、4个数字,能组成多少个互不相同且无重复数字的三位数?都是多少?程序分析:可填在百位、十位、个位的数字都是1、2、3、4。组成所有的排列后再去掉不满足条件的排列。代码:如果你依然在编程的世界里迷茫,可以加入我们的Python学习扣qun:×××,看看前辈们是如何学习的!交流经验!自己是一名高级python开发工程师,从基础的python脚本到web开发、爬虫、django、数
系统 2019-09-27 17:48:38 2098
思路:1.读取所有文章标题;2.用“结巴分词”的工具包进行文章标题的词语分割;3.用“sklearn”的工具包计算Tf-idf(词频-逆文档率);4.得到满足关键词权重阈值的词结巴分词详见:结巴分词Githubsklearn详见:文本特征提取――4.2.3.4Tf-idf项加权importosimportjiebaimportsysfromsklearn.feature_extraction.textimportTfidfVectorizersys.pat
系统 2019-09-27 17:48:06 2098
可以和Haskell,Prolog一样做到模式匹配,建立逻辑推到规则,描述问题,得出答案。frompyDatalogimportpyDatalogpyDatalog.create_atoms('N,N1,X,Y,X0,X1,X2,X3,X4,X5,X6,X7')pyDatalog.create_atoms('ok,queens,next_queen,pred,pred2')size=8ok(X1,N,X2)<=(X1!=X2)&(X1!=X2+N)&(X1
系统 2019-09-27 17:47:49 2098
html页面一般都会指定一个编码,如何获取到是处理html页面的第一步,因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个:importrea=["",'','','','','','']b="
系统 2019-09-27 17:47:13 2098
例题:假设你获取了250部电影的时长(列表a中),希望统计出这些电影时长的分布状态(比如时长为100分钟到120分钟电影的数量,出现的频率)等信息,你应该如何呈现这些数据?一些概念及问题:把数据分为多少组进行统计组数要适当,太少会有较大的统计误差,太多规律不明显组数:将数据分组,共分为多少组组距:指每个小组的两个端点的距离组数:极差/组距,也就是(最大值-最小值)/组距频数分布直方图与频率分布直方图,hist()方法需增加参数normed注意:一般来说能够
系统 2019-09-27 17:47:12 2098
os.remove不能用来删除文件夹,否则拒绝访问。#-*-coding:utf-8-*-importosif__name__=="__main__":os.remove('D:\\test')运行结果:删除空目录:#-*-coding:utf-8-*-importosif__name__=="__main__":os.rmdir('D:\\test')如果目录不为空会报错,如下:删除目录(不论目录是否为空):#-*-coding:utf-8-*-impo
系统 2019-09-27 17:46:47 2098
刚刚在学习些测试报告的时候,出现一个路径的问题,找了很久的原因,竟然是少了一个反斜杠引起的,在此顺便记录一下正反斜杠的作用。在Python中,记录路径时有以下几种写法,如:(大家都知道\n是换行的意思)report_dir1=r‘C:\Local\Programs\Python\Python35\Lib\n_test'report_dir2=‘C:\\Local\\Programs\\Python\\Python35\\Lib\\n_test'report
系统 2019-09-27 17:46:07 2098
1.背景有时候,需要统计一段代码运行所用的时长,则可以用到下面的代码。2.代码示例#!/usr/bin/envpythonimportdatetimeimporttimestart_time=datetime.datetime.now()time.sleep(5)end_time=datetime.datetime.now()delta=end_time-start_timedelta_gmtime=time.gmtime(delta.total_seco
系统 2019-09-27 17:45:29 2098
具体内容如下:使用sorted将字典按照其value大小排序>>>record={'a':89,'b':86,'c':99,'d':100}>>>sorted(record.items(),key=lambdax:x[1])[('b',86),('a',89),('c',99),('d',100)]sorted第一个参数要可迭代,可以为tuple,list>>>items=[(1,'B'),(1,'A'),(2,'A'),(0,'B'),(0,'a')]>
系统 2019-09-27 17:38:00 2098
转载请注明作者(独孤尚良dugushangliang)出处:https://blog.csdn.net/dugushangliang/article/details/81557442'''理论上,除非a与b都是1,那么下面的代码,都应该执行if语句。而事实上并不是如此'''a,b=0,1ifnotaandb:print('测试')上述代码,判断的是if(nota)and(b),而不是ifnot(aandb)这个是作用域的问题。'''如果是下面这样,又是另一
系统 2019-09-27 17:32:55 2098