- 军军小站|张军博客
搜索到与相关的文章
Python

python的set处理二维数组转一维数组的方法示例

forsplitValueinset(dataset[:,featureIndex].tolist()):首先set是一个无序,无重复的数据结构,所以很多时候使用它来进行去重;但是set接收的函数是原生array,这个怎么办?我现在有的numpy里面的matrix;于是我查了一下,直接使用matrix.tolist(),但是发现返回值有问题:importosos.chdir("D:\\galaxy\\aliyunsvn\\code\\MLInAction\

系统 2019-09-27 17:46:43 1729

Python

python生成器和列表解析

什么是生成器?可以理解为一种数据类型,这种数据自动实现了迭代器协议(其他数据类型需要调用自己内置的_iter_方法),所以生成器就是可迭代对象python提供生成器的两种表现形式:1.生成器函数:常规函数的定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次从它离开的地方继续执行。**函数里有yiled,执行函数就是一个生成器,不管yield位置在哪。采集函数创建生成器时,如

系统 2019-09-27 17:46:40 1729

Python

python显示出对应字典的键名和该值

从下面字典中查找出值为数字的字符串,并显示出对应字典的键名和该值dct={'Name':['Alice','1456'],'Age':['aa','5aa','345']}#取出字典的值forvalue1indct.values():#遍历值列表forvalue2invalue1:#判断是否为数字的字符串ifvalue2.isdigit():value=value1key=[kfor(k,v)indct.items()ifv==value]print("键

系统 2019-09-27 17:46:31 1729

Python

python爬虫---实现项目(四) 用BeautifulSoup分析新浪新闻

这次只演示了,如何在真实项目内用到BeautifulSoup库来解析网页,而新浪的新闻是ajax加载过来的数据,在这里我们只演示解析部分数据(具体反扒机制没做分析)。代码地址:https://gitee.com/dwyui/BeautifulSoup_xinlang.git。关于的爬虫的博客已经越来越多,使用到的技术也越来越多,后期我还会持续写下去,大概从几个角度去写,多线程爬取(提高效率),如何更好的做到爬取数据(破解反扒)。用redis管理多线程和代理

系统 2019-09-27 17:45:54 1729

Python

python购物车

python文件部分:user={'username':None}shopping_trolley={}shopping_num=[0]money=[0]my_money=[0]#获取商品列表defget_goods_list():withopen('shopping.txt',encoding='utf-8')asfr:shopping_dic=eval(fr.read())returnshopping_dicshopping_dic=get_goods

系统 2019-09-27 17:45:36 1729

Python

python 调用HBase的简单实例

新来的一个工程师不懂HBase,java不熟,python还行,我建议他那可以考虑用HBase的thrift调用,完成目前的工作。首先,安装thrift下载thrift,这里,我用的是thrift-0.7.0-dev.tar.gz这个版本tarxzfthrift-0.7.0-dev.tar.gzcdthrift-0.7.0-devsudo./configure--with-cpp=no--with-ruby=nosudomakesudomakeinstal

系统 2019-09-27 17:45:33 1729

Python

分析用Python脚本关闭文件操作的机制

如果不用“with”,那么Python会在何时关闭文件呢?答案是:视情况而定。Python程序员最初学到的东西里有一点就是可以通过迭代法很容易地遍历一个打开文件的全文:f=open('/etc/passwd')forlineinf:print(line)注意上面的代码具有可行性,因为我们的文件对象“f”是一个迭代器。换句话说,“f“知道在一个循环或者任何其他的迭代上下文中做什么,比如像列表解析。我的Python课堂上的大多数学生都具有其他编程语言背景,在使

系统 2019-09-27 17:45:26 1729

Python

Python多进程方式抓取基金网站内容的方法分析

本文实例讲述了Python多进程方式抓取基金网站内容的方法。分享给大家供大家参考,具体如下:在前面这篇//www.jb51.net/article/162418.htm我们已经简单了解了”python的多进程”,现在我们需要把抓取基金网站(28页)内容写成多进程的方式。因为进程也不是越多越好,我们计划分3个进程执行。意思就是:把总共要抓取的28页分成三部分。怎么分呢?#初始ranger=range(1,29)#步长step=10myList=[r[x:x+

系统 2019-09-27 17:45:24 1729

Python

Python环境下安装使用异步任务队列包Celery的基础教程

1.简介celery(芹菜)是一个异步任务队列/基于分布式消息传递的作业队列。它侧重于实时操作,但对调度支持也很好。celery用于生产系统每天处理数以百万计的任务。celery是用Python编写的,但该协议可以在任何语言实现。它也可以与其他语言通过webhooks实现。建议的消息代理RabbitMQ的,但提供有限支持Redis,Beanstalk,MongoDB,CouchDB,,和数据库(使用SQLAlchemy的或Django的ORM)。celer

系统 2019-09-27 17:38:47 1729

Python

python实现文本文件合并

python合并文本文件示例代码。python实现两个文本合并employee文件中记录了工号和姓名catemployee.txt:100JasonSmith200JohnDoe300SanjayGupta400AshokSharmabonus文件中记录工号和工资catbonus.txt:100$5,000200$500300$3,000400$1,250要求把两个文件合并并输出如下,处理结果:400ashoksharma$1,250100jasonsmi

系统 2019-09-27 17:38:46 1729