大数据一般是在“云”上玩的,但“云”都是要钱的,而且数据上上下下的也比较麻烦。所以,在本地电脑上快速处理数据的技能还是要的。pandas在比赛中学到的一个工具,本地可以在亿级别的数据上进行聚合等操作。内部的数据包括:•Series:一维数组,每个元素有一个标签•DataFrame:二维表格,可以看做Series的集合•Panel:三维数据数据的初始化我们可以通过构造函数来初始化,从下面的代码中可以想象得到数据是样子:frompandasimportSeri
系统 2019-09-27 17:55:02 3131
百度语音识别通过RESTAPI的方式给开发者提供一个通用的HTTP接口。上传需要完整的录音文件,录音文件时长不超过60s。官方文档库:http://ai.baidu.com/docs#/ASR-Online-Python-SDK/top调用方式开发文档写可以两种方式调用。可以下载使用SDK不下载使用SDK:根据文档组装url获取token,处理本地音频以JSON格式POST到百度语音识别服务器,获得返回结果语音格式格式支持pcm(不压缩)wav(不压缩,p
系统 2019-09-27 17:55:42 3128
创建窗口#创建一个海龟myTurtle=turtle.Turtle()#创建一个窗口myWin=turtle.Screen()···#代码最后关闭窗口即结束myWin.exitonclick()常用绘图命令#向当前画笔方向移动d像素长度turtle.forward(d)#向当前画笔相反方向移动d像素长度turtle.backward(d)#顺时针移动degree度turtle.right(degree)#逆时针移动degree度turtle.left(de
系统 2019-09-27 17:56:18 3125
在我的电脑中存在多个版本的Python,实际工作中也时常需要切换Python版本来进行相关工作。在Pycharm的终端中使用python和ipython命令进入的pythonshell都是环境变量中,也就是默认的python版本。每次在PyCharm软件中Terminal窗口或者在cmd命令行界面中,执行python命令,启动的都是python3的交互界面:在PyCharm软件中Terminal窗口中,输入python优先进入环境变量中的python3.6
系统 2019-09-27 17:52:13 3118
实现代码一、#!/usr/bin/pythonx,y=9,9lst=[(x,y,str(y)+'X'+str(x)+'='+str(x*y))forxinrange(1,y+1)foryinrange(1,x+1)]foriteminlst:printitem[2],if(item[0]==item[1]):print'\n'实现代码二、foriinrange(1,10):forjinrange(1,i+1):printstr(i*j)+'='+str(i
系统 2019-09-27 17:37:55 3111
我们在传输数据时,经常使用tcp/ip的服务器和客户端模型,很多设备也经常将网口作为硬件接口预留出来。可以使用tcp/ip传输图像、大的文件等,如果图片过大,还会进行拆分传输,接收方根据对应协议进行解包。解包过程中可能会出现tcp粘包现象,所以要根据对应特性进行拆包。本次给大家分享一个小的python传输图像的例子,由于数据量不大,没有粘包的现象,以后会给大家分享一个Qt下使用tcp/ip根据对应协议解析图片的例子。一般在发送图片数据之前会先将图片的大小等
系统 2019-09-27 17:52:17 3110
#图像像素到字符的转换importnumpyasnpfromPILimportImageifname==‘main’:image_file=“girl.jpg”height=116img=Image.open(image_file)print("img=",img)img_width,img_height=img.sizewidth=int(1.5*height*img_width//img_height)img=img.resize((width,hei
系统 2019-09-27 17:57:42 3109
当前时间的毫秒时间戳转换为年-月-日时:分:秒importtime#当前时间的13位毫秒时间戳times=int(time.time()*1000)print(times)#1565750406765#输入毫秒级的时间,转出正常格式的时间deftimeStamp(timeNum):timeStamp=float(timeNum/1000)timeArray=time.localtime(timeStamp)otherStyleTime=time.strft
系统 2019-09-27 17:56:59 3107
折腾一台被闲置的windows机子,洗成ubuntu系统开始,到使用自己的macbookpro远程ssh跑模型,分分钟搞定~原安装使用命令行:pipinstallsome-package临时拉取镜像下载:pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simplesome-package原本下载torch需要10h以上,拉取aliyun镜像后仍需5h以上,而使用清华镜像只需5min~你值得拥有!看到这感人的速度,
系统 2019-09-27 17:54:42 3105
多线程处理Socket并发server#!/usr/bin/envpythonimportsocketimportthreadingserver=socket.socket()server.bind(('',9999))server.listen(5)defreadThread(conn,addr):"""创建一个新的线程,负责和一个客户端通讯:paramconn::paramaddr::return:"""whileTrue:data=conn.recv
系统 2019-09-27 17:47:42 3099
Ubuntu16.04默认安装了Python2.7和3.5请注意,系统自带的python千万不能卸载!输入命令python按Ctrl+D退出python命令行输入命令sudoadd-apt-repositoryppa:jonathonf/python-3.6Readingpackagelists...DoneE:ProblemexecutingscriptsAPT::Update::Post-Invoke-Success'if/usr/bin/test-w
系统 2019-09-27 17:57:03 3094
先给大家介绍下pythonpickle存储、读取大数据量列表、字典的数据针对于数据量比较大的列表、字典,可以采用将其加工为数据包来调用,减小文件大小#列表#存储list1=[123,'xiaopingguo',54,[90,78]]list_file=open('list1.pickle','wb')pickle.dump(list1,list_file)list_file.close()#读取list_file=open('list1.pickle','
系统 2019-09-27 17:46:37 3088
一、用默认设置绘制折线图importmatplotlib.pyplotaspltx_values=list(range(11))#x轴的数字是0到10这11个整数y_values=[x**2forxinx_values]#y轴的数字是x轴数字的平方plt.plot(x_values,y_values,c='green')#用plot函数绘制折线图,线条颜色设置为绿色plt.title('Squares',fontsize=24)#设置图表标题和标题字号pl
系统 2019-09-27 17:56:54 3087
最近在处理文件时需要将一行文本按照一定的分隔符分成多行。如ABC123,1,2,1!#2,3,4!#5!#6ABC123是ID,后面的是属性,按‘,’分割的第4列,第6列都有不同的属性,用!#分割,如4!#5!#6,我想要拆成ABC123,1,2,1,3,4ABC123,,,2,,5ABC123,,,,,6直接上代码:#-*-coding:utf-8-*-importsysimporttime#原始文件inputfile=sys.argv[1]#第一层分隔
系统 2019-09-27 17:54:43 3085
一、概述公司需要通过网页用户认证登录实现上网,网络设备判断当前帐号12小时没有没上网将会自动断开帐号上网,每天早上上班第一件事就是打开用户认证网页输入。用户名与密码,有时候要家里通过teamview远程控制软件连接公司电脑,想让公司电脑24小时在线,最后通过python实现了自动登录。代码:#_*_coding:utf-8_*_importrequests,times=requests.session()data=[('opr','pwdLogin'),(
系统 2019-09-27 17:47:43 3085