- 军军小站|张军博客
拥有Python标签的文章
Python

Python编写百度贴吧的简单爬虫

操作:输入带分页的地址,去掉最后面的数字,设置一下起始页数和终点页数功能:下载对应页码的所有页面并储存为HTML文件,以当前时间命名代码:#-*-coding:utf-8-*-#----------------------------#程序:百度贴吧的小爬虫#日期:2015/03/28#语言:Python2.7#操作:输入带分页的地址,去掉最后面的数字,设置一下起始页数和终点页数#功能:下载对应页码的所有页面并储存为HTML文件,以当前时间命名#-----

系统 2019-09-27 17:51:10 2026

Python

python中对数据进行各种排序的方法

Python列表具有内置的list.sort()方法,可以在原地修改列表。还有一个sorted()内置的函数从迭代构建一个新的排序列表。在本文中,我们将探讨使用Python排序数据的各种技术。请注意,sort()原始数据被破坏,sorted()没有对原始数据进行操作,而是新建了一个新数据。一、基本的排序最基本的排序很简单。只要使用sorted()函数即可返回一个新的排序的列表>>>sorted([5,2,3,1,4])[1,2,3,4,5]咱们也可以使用l

系统 2019-09-27 17:51:01 2026

Python

浅析python中的迭代与迭代对象

什么是python的迭代如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们称为迭代(Iteration)。(在Python中,迭代是通过for...in来完成的)Python的for循环抽象程度要高于C的for循环,因为Python的for循环不仅可以用在list或tuple上,还可以作用在其他可迭代对象上。(可以直接作用于for循环的对象统称为可迭代对象(Iterable),如list、tuple、dic

系统 2019-09-27 17:50:30 2026

Python

腾讯十年Python开发经验写的Python入门笔记,是否对你有帮助?

启动python从IDLE启动PythonIDLE是一个PythonShell。Shell的意思是“外壳”,是一个通过键入文本与程序交互的途径(类似windows中的cmd。VisualStudio也是一种Shell)>>>是指Python准备好了,可以输入Python指令alt+N快速回到上一条语句(复制粘贴);alt+P下一条字符串print("hello,world")#"内是字符串"计算print(5+3)括号内没有""+print("ilove"

系统 2019-09-27 17:48:40 2026

Python

python 连接操作oracle数据库 cx_Oracle库安装

1.oracle数据库客户端instantclient下载安装和环境变量配置.可以直接到oracle官网下载,版本要正确选择如果你的电脑是64为系统,python安装也是64位的版本那你就需要下载64位的版本否则会出错,我用的是11.2版本下载地址如下,也可以在官网选择其他版本的下载地址:http://download.oracle.com/otn/nt/instantclient/11204/instantclient-basic-windows.x64

系统 2019-09-27 17:47:57 2026

Python

python中的列表推导式

序言python的列表对象是这个语言提供的最通用的序列,列表是一个任意类型的对象的位置相关的有序集合,它没有固定的大小。不像字符串,其大小是可变的,通过对偏移量进行赋值以及其他各种列表的方法进行调用,确实能够修改列表的大小。列表的形式如下>>>A=['apple',1,[1,2,'peach'],2]列表可以包含多种元素,可以进行嵌套,带有多种方法(具体的方法,可以查看相关手册),通过这些方法,列表可以有很多功能,例如可以当做栈,队列(低效,一般不用)等,

系统 2019-09-27 17:47:41 2026

Python

(李航统计学习方法)SVM的python实现

支持向量机是一种二分类模型,基本模型是定义在特征空间的间隔最大的线性分类器。间隔最大化使它有别于感知机。在面试中,经常遇到手推SVM,所以公式的推导也很重要。模型:策略:间隔最大化,形式化为求解凸二次规划,等价于正则化的合页损失函数最小化算法:略支持向量机包括:线性可分支持向量机,线性支持向量机,非线性支持向量机间隔最大化的直观解释:对训练数据集找到几何间隔最大的超平面意味着以充分大的确信度对训练数据进行分类。使其面对最难分的实例点也有足够大的确信度将它们

系统 2019-09-27 17:47:32 2026

Python

Python爬虫动态ip代理防止被封的方法

在爬取的过程中难免发生ip被封和403错误等等,这都是网站检测出你是爬虫而进行反爬措施,在这里为大家总结一下怎么用IP代理防止被封首先,设置等待时间:常见的设置等待时间有两种,一种是显性等待时间(强制停几秒),一种是隐性等待时间(看具体情况,比如根据元素加载完成需要时间而等待)图1是显性等待时间设置,图2是隐性第二步,修改请求头:识别你是机器人还是人类浏览器浏览的重要依据就是User-Agent,比如人类用浏览器浏览就会使这个样子的User-Agent:'

系统 2019-09-27 17:46:26 2026

Python

用Python抢过年的火车票附源码

前言:大家跟我一起念,Python大法好,跟着本宝宝用Python抢火车票首先我们需要splinter安装:pipinstallsplinter-ihttp://pypi.douban.com/simple--trusted-hostpypi.douban.com然后还需要一个浏览器的驱动,当然用chrome啦下载地址:http://chromedriver.storage.googleapis.com/index.html?path=2.20/根据下载的

系统 2019-09-27 17:45:45 2026

Python

python中pip的使用和修改下载源的方法

基本命令显示版本信息pip-V安装指定包pipinstallpipinstall-i'host'指定下载源卸载指定包pipuninstall列出已安装的包piplist显示有关已安装包的信息pipshow查找指定包pipsearch修改下载源Linuxvim~/.pip/pip.conf#编辑用户目录下隐藏的配置文件,没有的话生成一个格式如下:[global]index-url=http://mirrors.aliyun.com/pypi/simple/[

系统 2019-09-27 17:45:41 2026

Python

利用ctypes提高Python的执行速度

前言ctypes是Python的外部函数库。它提供了C兼容的数据类型,并且允许调用动态链接库/共享库中的函数。它可以将这些库包装起来给Python使用。这个引入C语言的接口可以帮助我们做很多事情,比如需要调用C代码的来提高性能的一些小型问题。通过它你可以接入Windows系统上的kernel32.dll和msvcrt.dll动态链接库,以及Linux系统上的libc.so.6库。当然你也可以使用自己的编译好的共享库我们先来看一个简单的例子我们使用Pytho

系统 2019-09-27 17:38:21 2026

Python

吐血总结!100个Python面试问题集锦(上)

作者|Python语音识别来源|深度学习与python(ID:PythonDC)Python是目前编程领域最受欢迎的语言。在本文中,我将总结Python面试中最常见的100个问题。每道题都提供参考答案,希望能够帮助你在2019年求职面试中脱颖而出,找到一份高薪工作。这100道面试题涉及Python基础知识、Python编程、数据分析以及Python函数库等多个方面。Q1、Python中的列表和元组有什么区别?Q2、Python的主要功能是什么?Python

系统 2019-09-27 17:57:13 2025

Python

Python csv模块使用方法代码实例

这篇文章主要介绍了Pythoncsv模块使用方法代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下importcsvdefopenSCV(filename):withopen("renting.csv",'r',encoding='utf_8_sig')asf:f_csv=csv.reader(f)forrowinf_csv:print(row)defTest1():headers=['ID','NA

系统 2019-09-27 17:57:06 2025

Python

python for循环remove同一个list过程解析

下午在用python将Linux的conf配置文件转化成字典dict时遇到了一个奇怪的问题,原先conf配置文件中没有注释行(以#开头的行),后来为了避免这种情况,添加了一个对以#开头的行删除的操作。实践结果颠覆了已有的认知,直接上代码示例。代码片段1#!/usr/bin/python#encoding:utf-8#-*-coding:utf8-*-importrelist_to_test=['#','#conf','NAME="Ubuntu"','VER

系统 2019-09-27 17:56:35 2025

Python

详解Python 4.0 预计推出的新功能

Python3.8发布在即,核心开发者团队让我总结一下最近讨论的Python4.0预计推出的新功能,代码名为“Ouroboros:自噬蛇”。Python4.0是大家翘首以盼的新版本,也将成为Python历史上的重大里程碑,在此感谢为之努力奋斗的100多名贡献者。经过邮件列表上的论战,PEP8里的一行79个字符的限制将增加至一行89.5个字符。IDE用户终于可以充分利用30"超宽4K显示器的优势啦!这是我们对每行100个字符这一呼声的妥协,大家各退一步。所有

系统 2019-09-27 17:56:07 2025