python面试题
【持续更新】
1.如何判断一个python对象的类型?
print type(2017)print type('junxi')
2.python里面如何生存随机数?
import random
num = random.random()
int_num = random.randint(1, 10)print '随机选取一个0-1之间的数', numprint '随机选取一个1-10之间的整数', int_num
3.写出IP的python正则表达式
import reimport os # cmd = os.system('ifconfig eth0 > ip_info.txt')with open('ip_info.txt', 'r') as path: text = path.read() # print(text) # print(type(text)) result = re.findall( r ' \b([0-9]{1,2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]{1,2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]{1,2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]{1,2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\b ' , text) # print(result)
4.写尽可能多的str对象的方法
str1 = 'a,b,c,,D,11,222.33.55'print str1.split('.')[0]
str1 = str1.replace('11', '99')print str1print str1.upper()print str1.lower()
5.全局变量与局部变量的区别,如何在函数里面给一个全局变量赋值?
# 全局变量在函数内部和外部都可以使用,局部变量只能在其作用域内使用。
第一个例子:
con = ' haha ' def fun(): global con con = ' lolo ' print (con) fun() print (con)
第二个例子:
下面这段代码输出什么? num = 9 def f1(): num = 20 def f2(): print num f2() f1() f2() 答案: 9 9 num不是个全局变量,所以每个函数都得到了自己的num拷贝,如果你想修改num,则必须用global关键字声明。比如下面这样 num = 9 def f1(): global num num = 20 def f2(): print num f2() f1() f2() # prints: # 9 # 20
6.元组和列表的区别,有两个list,b1=[1, 2, 3], b2[2, 3, 4],写出合并代码
# 元组内容不可变,列表内容可修改
b1 = [1, 2, 3 ] b2 = [2, 3, 4] print b1 + b2
7.请写出一段python代码实现删除一个List里面的重复元素。list1 = [1, 1, 2, 3, 4, 5, 4]
list1 = [1, 1, 2, 3, 4, 5, 4, 6, 7, 7, 5, 2, 1 ] list1.sort() last = list1[-1] for i in range(len(list1)-2, -1, -1 ): if list1[i] == last: del list1[i] else : last = list1[i] print list1
8.写入如下list的交集与差集代码,b1=[1, 2, 3], b2=[2, 3, 4]
b1 = [4, 1, 2, 3, 5 ] b2 = [2, 3, 4, 4, 4, 2, 1, 3, 6 ] same = list((set(b1).union(set(b2))) ^ set(b1) ^ set(b2)) # 求交集print same diff = [] # 求差集for i in b1: if i not in b2: diff.append(i) for i in b2: if i not in b1: diff.append(i) print diff union = list(set(b1).union(set(b2))) # 求并集print union
9.请写出一段python代码实现list里排序a=[1,2,4,2,4,5,7,10,5,5,7,8,9,0,3]
a = ['a', 1, 2, 4, 2, 4, 5, 7, 10, 5, 5, 7, 8, 9, 0, 3, 'b', 'd', 'c']
b = sorted(a, key=lambda a:a)print b
10.D=[x * x for x in range(1, 10)], 请写出D的输出结果
D = [x * x for x in range(1, 10)]print D
11.如何用python输出一个fibonacci数列(100以内)
def fib(n): num_list = [1, 1 ] print ' fib数列第1个数是: ' , num_list[0] print ' fib数列第2个数是: ' , num_list[1 ] for i in range(2 , n): num = num_list[i-1] + num_list[i-2 ] num_list.append(num) print ' fib数列第%s个数是:%s ' % (i+1 , num_list[i]) fib( 100)
12.什么是lambda函数?下面这段代码输出是什么?
# 匿名函数就是不用定义函数名,写成一行的实用小函数,可直接赋值给一个变量使用,也可直接传参使用。# 求20以内的质数
nums = range(2, 20)for i in nums:
nums = filter(lambda x: x == i or x % i, nums)print nums
13.说说用过的几种爬虫框架及它们的优缺点,用过哪些解析Html的python库?
"""
pyspider的优点是简单,立刻就能上手,脚本编写规则。懂了的话,一小时写甚至可以写十多个爬虫。
scrapy的优点是自定义程度高,适合学习研究爬虫技术,要学习的相关知识也较多,故而完成一个爬虫的时间较长。
beautifulsoup4
urllib
requests
"""
14.谈一下对于多线程的理解,对于cou密集型和IO密集型怎么使用多线程,说说线程池,线程锁的用法,有没有用过multiprocessing或concurrent,futures?
答案:略。
1 5 . Python 的特点和优点是什么?
答案:略。
16 . 深拷贝和浅拷贝的区别是什么?
深拷贝是将对象本身复制给另一个对象。这意味着如果对对象的副本进行更改时不会影响原对象。在 Python 中,我们使用 deepcopy()函数进行深拷贝,使用方法如下:
>>> import copy
>>> b=copy.deepcopy(a)
浅拷贝是将对象的引用复制给另一个对象。因此,如果我们在副本中进行更改,则会影响原对象。使用 copy()函数进行浅拷贝,使用方法如下:
>>> b=copy.copy(a)
17 、 TRY EXCEPT FINALLY 的执行顺序
try…except…except…[else…][finally…]
执行 try下的语句,如果引发异常,则执行过程会跳到except语句。对每个except分支顺序尝试执行,如果引发的异常与except中的异常组匹配,执行相应的语句。如果所有的except都不匹配,则异常会传递到下一个调用本代码的最高层try代码中。
try下的语句正常执行,则执行else块代码。如果发生异常,就不会执行;如果存在finally语句,最后总是会执行。
18 . Python里面如何生成随机数?
答: random模块
随机整数: random.randint(a,b):返回随机整数x,a<=x<=b
random.randrange(start,stop,[,step]):返回一个范围在(start,stop,step)之间的随机整数,不包括结束值。
随机实数: random.random( ):返回0到1之间的浮点数
random.uniform(a,b):返回指定范围内的浮点数
19 . 用一个例子解释Python中的继承。
继承允许一个类获得另一个类的所有成员 (比如属性和方法)。继承提供代码可重用性,使创建和维护应用程序变得更容易。我们继承的类称为super-class,继承的类称为派生/子类。
以下是 Python支持的不同类型的继承:
a. 单一继承 - 派生类获取单个超类的成员。
b. Multi-level继承 - 从基类base1继承的派生类d1,d2继承自base2。
c. 分层继承 - 从一个基类可以继承任意数量的子类
d. 多重继承 - 派生类从多个基类继承。
20 . 解释Flask是什么及其好处?
Flask是基于“Werkzeug,Jinja2和良好意图”BSD许可证的Python网络微框架。 Werkzeug和Jinja2是它的两个依赖项。这意味着它对外部库几乎没有依赖性。它使框架变得轻盈,只是少量依赖于更新和更少的安全性错误。
会话基本上允许您记住从一个请求到另一个请求的信息。在 flask中,会话使用签名的cookie,以便用户可以查看会话内容并进行修改。当且仅当有密钥Flask.secret_key,用户可以修改会话。
21 . 什么是负指数,为什么使用它们?
Python中的序列是索引的,它由正数和负数组成。正的数字使用'0'作为第一个索引,'1'作为第二个索引,以此类推。
负数的索引从 '-1'开始,表示序列中的最后一个索引,' - 2'作为倒数第二个索引,依次类推。
22 . 如何用Python来进行查询和替换一个文本字符串?
可以使用 sub()方法来进行查询和替换,sub方法的格式为:
a. sub(replacement, string[,count=0])
b. replacement是被替换成的文本
c. string是需要被替换的文本
d. count是一个可选参数,指最大被替换的数量
2 3. 解释一下python的and-or语法
与 C表达式 bool ? a : b类似,但是bool and a or b,当 a 为假时,不会象C表达式 bool ? a : b 一样工作
应该将 and-or 技巧封装成一个函数:
defchoose(bool, a,b):return(booland[a]or[b])[0]
因为 [a] 是一个非空列表,它永远不会为假。甚至 a 是 0 或 '' 或其它假值,列表[a]为真,因为它有一个元素。
23 . 单引号,双引号,三引号的区别?
单引号和双引号是等效的,如果要换行,需要符号 (\),三引号则可以直接换行,并且可以包含注释
如果要表示 Let’s go 这个字符串
单引号 : s4 = ‘Let\’s go’
双引号: s5 = “Let’s go”
s6 = ‘I realy like“python”!’
这就是单引号和双引号都可以表示字符串的原因了。
24 . 当退出 Python 时是否释放所有内存分配?
答案是否定的。那些具有对象循环引用或者全局命名空间引用的变量,在 Python 退出是往往不会被释放
另外不会释放 C 库保留的部分内容。
25 . Python里面search()和match()的区别?
match()函数只检测RE是不是在string的开始位置匹配,search()会扫描整个string查找匹配, 也就是说match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回none 。
26 . 如何在Python中随机化列表中的项目?
考虑下面显示的示例:
from random import shuffle x = [ ' Keep ' , ' The ' , ' Blue ' , ' Flag ' , ' Flying ' , ' High ' ] shuffle(x) print (x)
以下代码的输出如下。
['Flying', 'Keep', 'Blue', 'High', 'The','Flag']
27、 __new__.__init__区别,如何实现单例模式,有什么优点
__new__是一个静态方法,__init__是一个实例方法
__new__返回一个创建的实例,__init__什么都不返回
__new__返回一个cls的实例时后面的__init__才能被调用
当创建一个新实例时调用__new__,初始化一个实例时调用__init__
28、深浅拷贝
浅拷贝只是增加了一个指针指向一个存在的地址,而深拷贝是增加一个指针并且开辟了新的内存,这个增加的指针指向这个新的内存,
采用浅拷贝的情况,释放内存,会释放同一内存,深拷贝就不会出现释放同一内存的错误
29、HTTP/IP相关协议,分别位于哪层
http协议是超文本传输协议,http协议是基于TCP/IP通信协议来传递数据
http协议工作与c/s架构上,浏览器作为http的客户端通过URL向http服务端即web服务器发送所用请求。web服务器收到所有请求后,向客户端发送响应信息,
http特点是短连接,无状态
地址栏键输入URL,按下回车之后经历了什么?
1.浏览器向DNS服务器请求解析该URL中的域名所对应的IP地址
2.解析出IP地址后,根据IP地址和默认端口80,和服务器建立TCP连接
3.浏览器发出读取文件的http请求,该请求报文作为TCP三次握手的第三个报文的数据发送给服务器
4.服务器对浏览器请求做出响应,并把对应的html文件发送给浏览器
5.释放TCP连接
6.浏览器将该HMTL渲染并显示内容
30、TCP/UDP区别
TCP协议是面向连接,保证高可靠性(数据无丢失,数据无失序,数据无错误,数据无重复达到)传输层协议
UDP:数据丢失,无秩序的传输层协议(qq基于udp协议)
31、webscoket
websocket是基于http协议的,可持续化连接
轮询:浏览器每隔几秒就发送一次请求,询问服务器是否有新消息
长轮询:客户端发起连接后,如果没有消息,就一直不返回response给客户端,直到有消息返回,返回完之后,客户端再次发起连接
32、RabbitMQ:
服务器端有Erlang语言来编写,支持多种客户端,只会ajax,用于分布式系统中存储转发消息,在易用性、扩展性、高可用性的方面不俗。
connection是RabbitMQ的socket连接,它封装了socket部分相关协议逻辑
connectionFactroy为connection的制造工厂
channel是我们与RabbitMQ打交道的最重要的一个接口,大部分的业务操作是在chaanel这个接口中完成,包括定义Queue、定义Exchange、
绑定Queue与Exchange,发布消息等
33、装饰器
调用装饰器其实是一个闭包函数,为其他函数添加附加功能,不修改被修改的源代码和不修改被修饰的方式,装饰器的返回值也是一个函数对象。
比如:插入日志、性能测试、事物处理、缓存、权限验证等,有了装饰器,就可以抽离出大量与函数功能本身无关的雷同代码并继续重用。
34、闭包
1.必须有一个内嵌函数
2.内嵌函数必须引用外部函数的变量(该函数包含对外作用域而不是全局作用域名字的引用)
3.外部函数的返回值必须是内嵌函数
35、迭代器与生成器
迭代可迭代对象对应_iter_(方法)和迭代器对应_next_(方法)的一个过程
生成器:包括含有yield这个关键字,生成器也是迭代器,调动next把函数变成迭代器。
36、classmethod,staticmethod,property
类方法:将类的函数转换成类方法,函数上装饰@classmethod会将函数的自动传值参数改成cls
静态方法:此方法相当于给类扩展一个功能,将类内的函数实例化,给类或对象使用,此时类内的函数就是普通函数,不管是类还是实例化的对象都可以使用
实例化:类的实例化就会产生一个实例(对象),可以理解为类()把虚拟的东西实例化,得到具体存在的值
37、HTTP常用的状态码
200--服务器成功返回网页
204--请求收到,但返回信息为空
304--客户端已经执行了GET,但文件未变化
400--错误请求,如语法错误
403--无权限访问
404--请求的页面不存在
500--服务器产生内部错误
38、多进程,多线程,协程,GIL
GIL:全局解释器锁,是锁在cpython解释器上,导致同一时刻,同一进程只能有一个线程被执行
多进程:多进程模块multiprocessing来实现,cpu密集型,IO计算型可以用多进程
多线程:多线程模块threading来实现,IO密集型,多线程可以提高效率
协程:依赖于geenlet,对于多线程应用。cpu通过切片的方式来切换线程间的执行,遇到IO操作自动切换,线程切换时需要耗时,
而协成好处没有切换的消耗,没有锁定概念。
进程:是资源管理单位,进行是相互独立的,实现并发和并发
线程:是最小的执行单位,线程的出现为了降低上下文切换的消耗,提供系统的并发性
39、IO多路复用/异步非阻塞
IO多路复用:通过一种机制,可以监听多个描述符 select/poll/epoll
select:连接数受限,查找配对速度慢,数据由内核拷贝到用户态
poll:改善了连接数,但是还是查找配对速度慢,数据由内核拷贝到用户态
epoll:epoll是linux下多路复用IO接口,是select/poll的增强版,它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率
异步非阻塞:异步体现在回调上,回调就是有消息返回时告知一声儿进程进行处理。非阻塞就是不等待,不需要进程等待下去,
继续执行其他操作,不管其他进程的状态。
40、PEP8规范,规范的好处是什么?
1.缩进:4个空实现缩进,尽量不使用Tab
2.行:没行最大长度不超过79,换行可以使用反斜杠
3.命名规范:
4.注释规范:
41、range-and-xrange
都在循环时使用,xrange内存性能更好,xrange用法与range完全相同,range一个生成list对象,xrange是生成器
42、with上下文机制原理
_enter_和_exit_,上下文管理协议,即with语句,为了让一个对象兼容with语句,必须在这个对象类中声明_enter_和_exit_方法,
使用with语句的目的就是把代码块放入with中执行,with结束后,自动完成清理工作,无须收到干预
43、经典类、新式类
经典类遵循:深度优先,python2中
新式类遵循:广度优先,Python3中
44、有没有一个工具可以帮助查找Python的bug和进行静态的代码分析?
PyChecker是一个Python代码的静态分析工具,它可以帮助查找Python代码的bug,会对代码的复杂度和格式提出警告,
Pylint是另外一个工具可以进行codingstandard检查
45、 Python是如何进行内存管理的
1.对象引用计数:
引用计数增加的情况:
来保持追踪内存中的对象,所有对象都用引用计数,一个对象分配一个新名称
将其放入一个容器中(列表,字典,元祖)
引用计数减少的情况:
使用del语句对对象别名显示的销毁
引用超出作用域或被重新赋值
sys.getrefcount()函数可以获得对象的当前引用计数
2.标记-清除机制
3.分代技术
46、什么是python?使用python有什么好处?
python是一种编程语言,它有对象、模块、线程、异常处理和自动内存管理。它简洁,简单、方便、容易扩展、有许多自带的数据结果,而且它开源
47、什么是pickling和unpickling?
Pickle模块读入任何python对象,将它们转换成字符串,然后使用dump函数将其转储到一个文件中——这个过程叫做pickling
反之从存储的字符串文件中提取原始python对象的过程,叫做unpickling
48、python是如何被解释的?
Python是一种解释性语言,它的源代码可以直接运行,Python解释器会将源代码转换成中间语言,之后再翻译成机器码再执行
49、数组和元祖之间的区别是什么?
数组和元祖之间的区别:数组内容可以被修改,而元祖内容是只读的,不可被修改的,另外元祖可以被哈希,比如作为字典的key
50、参数按值传递和引用传递是怎么实现的?
python中的一切都是类,所有的变量都是一个对象的引用。引用的值是由函数确定的,因此无法被改变,但是如果一个对象是可以被修改的,你可以改动对象
51、Python都有哪些自带的数据结构?
Python自带的数据结构分为可变和不可变的:可变的有:数组、集合、字典,不可变的是:字符串、元祖、整数
52、什么是python的命名空间?
在python中,所有的名字都存在于一个空间中,它们在改空间中存在和被操作——这就是命名空间,它就好像一个盒子,在每个变量名字都对应装着一个对象,
当查询变量的时候,会从该盒子里面寻找相应的对象
53、python中的unittest是什么?
在python中,unittest是python中的单元测试框架,它拥有支持共享搭建、自动测试、在测试中暂停代码、将不同测试迭代成一组
54、*args与**kwargs
*args代表位置参数,它会接收任意多个参数并把这些参数作为元祖传递给函数。**kwargs代表的关键字参数,返回的是字典,位置参数一定要放在关键字前面
55、在Python中什么是slicing?
slicing是一种在有序的对象类型中(数组、元祖、字符串)节选某一段的语法
56、python中的docstring是什么?
Python中文档字符串被称为docstring,它在Python中的作用是为函数、模块和类注释生成文档
57、os与sys区别
os是模块负责程序与操作系统的交互,提供了访问操作系统底层的接口
sys模块是负责程序与python解释器的交互,提供了一系列的函数和变量,用于操控Python时运行的环境
58、实现一个单例模式
_new_()在 _init_()之前被调用,用于生成实例对象。利用这个方法和类的属性的特点可以实现设计模式的单例模式。
单例模式是指创建唯一对象,单例模式设计的类只能实例,实例化1个对象
class Singleton(object): __instance = None def __init__ (self): pass def __new__ (cls, *args, ** kwargs): if Singleton. __instance is None: Singleton. __instance =object. __new__ (cls,*args,** kwargs) return Singleton. __instance
59、闭包
写一个函数,接收整数参数n,返回一个函数,函数的功能是把函数的参数和n相乘并把结果返回。
def mulby(num): def gn(val): return num * val return gn zw = mulby(7 ) print (zw(9));
60、一行代码交换两个变量值
a=8 b =9 答案: (a,b) = (b,a)