搜索到与相关的文章
Python

python爬虫

python爬虫1《1》什么是爬虫网络爬虫?网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。《2》爬虫的基本原理:我们把互联网比喻为一张大网,网络爬虫我们想象为网上的蜘蛛,网页与网页之间的连接我们理解为节点,爬虫就相当于是访问网页,获取网页的信息,又通过节点可以爬取另一个网站,然后不停的通过一个个节点即访问一个个网页,这样网站的数据就可以被我们获取下来了。《3》爬虫的分类:网络爬虫可分为通用爬虫和聚焦爬虫

系统 2019-09-27 17:50:05 2295

Python

python的迭代器与生成器实例详解

本文以实例详解了python的迭代器与生成器,具体如下所示:1.迭代器概述:迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退。1.1使用迭代器的优点对于原生支持随机访问的数据结构(如tuple、list),迭代器和经典for循环的索引访问相比并无优势,反而丢失了索引值(可以使用内建函数enumerate()找回这个索引值)。但对于无法随机访

系统 2019-09-27 17:47:50 2295

Python

Python中的ctime()方法使用教程

ctime()方法转换,因为历元到表示本地时间的字符串表示以秒为单位的时间。如果不设置秒时或None,所返回的时间的当前time()被使用。使用asctime(localtime(secs))。不使用ctime()的区域信息。语法以下是ctime()方法的语法:time.ctime([sec])参数sec--这些都是秒数要被转换成字符串表示。返回值此方法不返回任何值。例子下面的例子显示了ctime()方法的使用。#!/usr/bin/pythonimpor

系统 2019-09-27 17:46:42 2295

Python

Python多种方式统计文本行数 大文本 文件行数文件内

方法一Python读取文件针对小文件可行,大文件效率和性能都很差。以下是几种写法defget_count(file_abs_name):""":param:file_abs_name文件名含绝对路径"""withopen(file_abs_name,'r')asf:cnt=len(f.readlines)f.flush()returncntdefget_count(file_abs_name):""":param:file_abs_name文件名含绝对路径

系统 2019-09-27 17:46:00 2295

Python

浅谈Python的文件类型

Python的文件类型主要分为3种:源代码(sourcefile)、字节码(byte-codefile)、优化的字节码(optimizedfile)。这些代码都可以直接运行,不需要编译或者连接。这正是Python语言的特性,Python的文件通过python.exe和pythonw.exe解释运行。1.源代码Python的源文件以"py"为扩展名,有python.exe解释运行,可在控制台下运行。"pyw"是图形开发用户接口(GUI)文件的扩展名,作为桌面

系统 2019-09-27 17:38:37 2295

Python

遍历python字典几种方法总结(推荐)

如下所示:aDict={'key1':'value1','key2':'value2','key3':'value3'}print'-----------dict-------------'fordinaDict:print"%s:%s"%(d,aDict[d])print'-----------item-------------'for(k,v)inaDict.items():print'%s:%s'%(k,v)#效率最高print'----------

系统 2019-09-27 17:38:15 2295

Python

python 字典(dict)按键和值排序

python字典(dict)的特点就是无序的,按照键(key)来提取相应值(value),如果我们需要字典按值排序的话,那可以用下面的方法来进行:1下面的是按照value的值从大到小的顺序来排序。dic={'a':31,'bc':5,'c':3,'asd':4,'aa':74,'d':0}dict=sorted(dic.items(),key=lambdad:d[1],reverse=True)print(dict)输出的结果:[('aa',74),('a

系统 2019-09-27 17:38:09 2295

Java

解决办法 Exception in thread "main" java.lan

Exceptioninthread"main"java.lang.NoClassDefFoundError:test(wrongname:com/sapmonitor/unix/test)atjava.lang.ClassLoader.defineClass1(NativeMethod)atjava.lang.ClassLoader.defineClass(ClassLoader.java:620)atjava.security.SecureClassLo

系统 2019-08-29 23:21:24 2295

编程技术

Spring+iBatis+Atomikos实现JTA事务

Atomikos分两个:一个是开源的TransactionEssentials,一个是商业的ExtremeTransactions。TransactionEssentials的主要特征:JTA/XA事务管理——提供事务管理和连接池不需要应用服务器——TransactionEssentials可以在任何JavaEE应用服务器中运行,也就是不依赖于任何应用服务器开源——TransactionEssentials是遵守Apache版本2许可的开源软件专注于JDB

系统 2019-08-29 23:15:47 2295

编程技术

海量数据处理之Bloom Filter详解

海量数据处理之BloomFilter详解前言本博客内曾已经整理过十道海量数据处理面试题与十个方法大总结。接下来,本博客内会重点分析那些海量数据处理的方法,并重写十道海量数据处理的面试题。如果有任何问题,欢迎不吝指正。谢谢。一、什么是BloomFilterBloomFilter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。BloomFilter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,

系统 2019-08-29 22:28:46 2295