之前在excel里面分析log数据,简直日了*了。现在用python在处理日志数据.主要涉及matplotlib,open和循环的使用。日志内容大致如下2016-10-2121:07:59,787[7MainWindowForm]INFO:updatetime136.63142016-10-2121:07:59,908[7KinectServer]INFO:lClientSockets[0]elapsedtime16.2016-10-2121:07:59,
系统 2019-09-27 17:57:32 2108
转载自王晔的流水账http://wangye.org/blog/archives/629/代码上面应该没有什么问题,Python使用的是版本2.7,但是在运行的时候出现了异常错误UnicodeEncodeError:Traceback(mostrecentcalllast):File"makedb.py",line33,inmain()File"makedb.py",line30,inmainfp.write(row[1])UnicodeEncodeErr
系统 2019-09-27 17:08:14 2108
Python使用称为PythonPath的搜索路径来查找使用import语句导入代码的模块。大多数代码只会汇入已经默认路径上的模块,通过安装到Python的Python标准库的例子模块或模块点子,pipenv,畅达,或一些其他的包管理器。但是,在某些情况下,代码将依赖于通过在启动Python之前设置环境变量PYTHONPATH提供的不同路径,或者在导入模块之前在运行时修改sys.path。软件地址:https://www.macdown.com/mac/3
系统 2019-09-27 17:57:28 2107
摘要在上一篇文章,时间日期处理的入门里面,我们简单介绍了一下载pandas里对时间日期的简单操作。下面将补充一些常用方法。时间日期的比较假设我们有数据集df如下在对时间日期进行比较之前,要先转一下格式。转格式的时候用importpandasaspdpd.to_datetime()我们需要先对df中的date这一列转为时间格式。df['date']=pd.to_datetime(df['date'])转完后,我们可以输出数据集的数据类型来看看。printdf
系统 2019-09-27 17:53:58 2107
注:该代码为慕课网课程中老师讲解importpandasaspdimportnumpyasnpimportmath##计算信息熵defgetEntropy(s):#找到各个不同取值出现的次数ifnotisinstance(s,pd.core.series.Series):s=pd.Series(s)prt_ary=pd.groupby(s,by=s).count().values/float(len(s))return-(np.log2(prt_ary)*
系统 2019-09-27 17:56:29 2106
最近在做python的web开发(原谅我的多变,好东西总想都学着。。。node.js也是),不过过程中总遇到些问题,不管是web.py还是django,开发起来确实没用php方便,毕竟存在的时间比较短,很多不完善的地方。比如我在调试php中最常用的函数,var_dump,在python里找不到合适的替代函数。php中var_dump是一个特别有用的函数,它可以输出任何变量的值,不管你是一个对象还是一个数组,或者只是一个数。它总能用友好的方式输出,我调试的时
系统 2019-09-27 17:52:52 2106
安装PIL在Debian/UbuntuLinux下直接通过apt安装:$sudoapt-getinstallpython-imagingMac和其他版本的Linux可以直接使用easy_install或pip安装,安装前需要把编译环境装好:$sudoeasy_installPIL如果安装失败,根据提示先把缺失的包(比如openjpeg)装上。Windows平台就去PIL官方网站下载exe安装包。操作图像来看看最常见的图像缩放操作,只需三四行代码:impor
系统 2019-09-27 17:56:20 2103
1、简单kmeanimportnumpyasnpimportmatplotlib.pyplotaspltfromscipy.ioimportloadmatfromex71_findimportfindClosestCentroidsfromex71_computeimportcomputeClosestCentroidsdata=loadmat('ex7data2.mat')X=data['X']#实验K=3initial_centroids=np.arr
系统 2019-09-27 17:46:59 2103
1.最长公共子序列(LCS)1.1问题描述1.2思路利用动态规划。下一步就要找到状态之间的转换方程。因此可以根据这个方程来进行填表,以"helloworld"和“loop”为例:1.3Python代码defLCS(string1,string2):len1=len(string1)len2=len(string2)res=[[0foriinrange(len1+1)]forjinrange(len2+1)]foriinrange(1,len2+1):for
系统 2019-09-27 17:47:09 2101
一般情况下,使用pip命令安装即可:[root@dthost27~]#pipinstallmysql-python但是在实际工作环境中,往往会安装失败,这是因为系统缺少mysql的相关依赖组件。所以必须先安装mysql-devel类的包,而且必须要对应好mysql客户端的版本,即要安装好:[root@dthost27~]#rpm-ivhmysql-community-libs-5.7.23-1.el6.x86_64.rpmmysql-community-c
系统 2019-09-27 17:50:54 2100
国外的开源项目开展的是如火如荼,我们国内的当然也不甘落后。为了更好的玩转Python,我使用了ubuntuLinux来作为开发环境。但是由于国内网络的限制,访问国外的一些软件源的时候,速度比较慢,这时我们需要更换成国内的软件源。1、更换ubuntu18.04的软件安装源查看Ubuntu18版本和codename(一定要注意codename对应)$lsb_release-aNoLSBmodulesareavailable.DistributorID:Ubun
系统 2019-09-27 17:57:23 2099
学习Python不久碰到过这个问题,记得当时没查出是什么问题.刚刚无意中发现了这个问题的原因及解决方案,记录一下.参考:https://juejin.im/post/5bc2bd3a5188255c94465d31第一种情况参考文章中介绍说产生这个问题的原因是因为创建了自定义的Logger对象后,又使用了logging中的日志输出方法,这些方法使用的是默认配置的Logger对象,导致之后输出的日志信息会重复。示例代码:importlogging#日志管理l
系统 2019-09-27 17:50:07 2096
最近在做编程练习,发现有些结果的值与答案相差较大,通过分析比较得出结论,大概过程如下:定义了一个计算损失的函数:deferror(yhat,label):yhat=np.array(yhat)label=np.array(label)error_sum=((yhat-label)**2).sum()returnerror_sum主要出现问题的是yhat-label部分,要强调的是一定要保证两者维度是相同的!这点很重要,否则就会按照python的广播机制进行
系统 2019-09-27 17:47:40 2095
用pandas计算相关系数计算相关系数用pandas,比如我想知道风速大小与风向紊乱(标准差来衡量)之间的相关系数,下面是代码:importpandasaspdimportpylabasplt#每小时的阵风风速平均值all_gust_spd_mean_list=[8.21529411764706,7.872941176470587,7.829411764705882,8.354117647058825,9.025882352941174,9.3845238
系统 2019-09-27 17:56:56 2094
如下所示:beta分布的最大特点是其多样性,从下图可以看出,beta分布具有各种形态,有U形,类似正态分布的形状,类似uniform分布的形状等,正式这一特质使beta分布在共轭先验的计算中起到重要作用:importmatplotlib.pyplotaspltimportnumpyasnpfromscipyimportstatsfrommatplotlibimportstylestyle.use('ggplot')params=[0.5,1,2,3]x=n
系统 2019-09-27 17:45:39 2094