上面的博客把基本的HTML解析库已经说完了,这次我们来给予几个实战的项目。这次主要用Requests库+正则表达式来解析HTML。项目一:爬取猫眼电影TOP100信息代码地址:https://gitee.com/dwyui/maoyan-Requests.git项目二:美食爬取(包含多层爬取)代码地址:https://gitee.com/dwyui/meishi_Requests.git
系统 2019-09-27 17:47:06 1892
登录流程:实例化一个driver,然后driver.get()发送请求最重要的:切换iframe子框架,因为豆瓣的网页中的登录那部分是一个ifrme,必须切换才能寻找到对应元素利用selenium切换到账号密码登录利用selenium输入账户和密码利用selenium点击登录按钮然后利用字典推导式保存了一下cookie代码实现:importtimefromseleniumimportwebdriver#实例化driverdriver=webdriver.C
系统 2019-09-27 17:47:06 1892
前言进程之间通信与线程同步是一个历久弥新的话题,对编程稍有了解应该都知道,但是细说又说不清。一方面除了工作中可能用的比较少,另一方面就是这些概念牵涉到的东西比较多,而且相对较深。网络编程,服务端编程,并发应用等都会涉及到。其开发和调试过程都不直观。由于同步通信机制的原理都是想通的,本文希通过望借助python实例来将抽象概念具体化。阅读之前可以参考之前的一篇文章:python多线程与多进程及其区别,了解一下线程和进程的创建。python多线程同步pytho
系统 2019-09-27 17:46:39 1892
Python中将数字格式化时,有些时候需要将数字格式化,为了显示美观,需要补零。今天在写代码时,看见别人的奇怪写法,觉得有必要在这里把Python更好的写法重写一下。看到的别人的代码foriinrange(99):num_str=str(i)iflen(num_str)>1:num_str='0'+str(i)print(num_str)看到这段代码,我的三观被刷新了。如果补零比较多,确实代码的行数可观。常见和不常见的格式化补零方法foriinrange(
系统 2019-09-27 17:45:59 1892
Python是用于编码图形界面的极佳语言。由于可以迅速地编写工作代码并且不需要费时的编译周期,所以可以立即使界面启动和运行起来,并且不久便可使用这些界面。将这一点与Python易于链接本机库的能力结合起来,就可以形成一个出色的环境。gnome-python是为Python封装GNOME及其相关库的软件包。这使您能够用Python编写外观与核心GNOME应用程序完全相同的应用程序,而所花的时间只是用C编写该应用程序所花的一部分。然而,不用C进行编程会有一个缺
系统 2019-09-27 17:38:29 1892
Python登录网站详解及实例对于大部分论坛,我们想要抓取其中的帖子分析,首先需要登录,否则无法查看。这是因为HTTP协议是一个无状态(Stateless)的协议,服务器如何知道当前请求连接的用户是否已经登录了呢?有两种方式:在URI中显式地使用SessionID;利用Cookie,大概过程是登录一个网站后会在本地保留一个Cookie,当继续浏览这个网站的时候,浏览器会把Cookie连同地址请求一起发送过去。Python提供了相当丰富的模块,所以对于这种网
系统 2019-09-27 17:38:24 1892
一、参数传入规则可变参数允许传入0个或任意个参数,在函数调用时自动组装成一个tuple;关键字参数允许传入0个或任意个参数,在函数调用时自动组装成一个dict;1.传入可变参数:defcalc(*numbers):sum=0forninnumbers:sum=sum+n*nreturnsum以上定义函数,使用如下:传入多个参数,calc(1,2,3,4)30#函数返回值传入一个列表,nums=[1,2,3]calc(*nums)#通过*将list中的元素作
系统 2019-09-27 17:38:04 1892
Python的标准库中的os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的。即它允许一个程序在编写后不需要任何改动,也不会发生任何问题,就可以在Linux和Windows下运行。下面列出了一些在os模块中比较有用的部分。它们中的大多数都简单明了。os.sep可以取代操作系统特定的路径分隔符。windows下为“\\”os.name字符串指示你正在使用的平台。比如对于Windows,它是'nt',而对于Linux/Un
系统 2019-09-27 17:37:58 1892
一般开发过游戏的都知道Lua和C++可以很好的结合在一起,取长补短,把Lua脚本当成类似动态链接库来使用,很好的利用了脚本开发的灵活性。而作为一门流行的通用型脚本语言Python,也是可以做到的。在一个C++应用程序中,我们可以用一组插件来实现一些具有统一接口的功能,一般插件都是使用动态链接库实现,如果插件的变化比较频繁,我们可以使用Python来代替动态链接库形式的插件(堪称文本形式的动态链接库),这样可以方便地根据需求的变化改写脚本代码,而不是必须重新
系统 2019-09-27 17:37:46 1892
====================================================================今天逛空间,意外看到CSDN空间报如上图的错!这种错误以前也见到过!今天就深入研究一下错误产生的原因:解决504GatewayTime-out(nginx)504GatewayTime-out问题常见于使用nginx作为webserver的服务器的网站我遇到这个问题是在升级discuz论坛的时候遇到的一般看来,这种情况可能
系统 2019-08-29 23:46:36 1892