淘宝的页面很复杂,如果使用分析ajax或者js的方式,很麻烦抓取淘宝‘美食'上面的所有食品信息spider.py#encoding:utf8importrefromseleniumimportwebdriverfromselenium.common.exceptionsimportTimeoutExceptionfromselenium.webdriver.common.byimportByfromselenium.webdriver.support.ui
系统 2019-09-27 17:50:09 1894
一、字符串基本操作索引、切片、乘法、成员资格检查、长度、长度、最小值、最大值字符串不可变,因此元素赋值和切片赋值是非法的、二、设置字符串的格式>>>"{3}{0}{2}{1}{3}{0}".format("be","not","or","to")'tobeornottobe'三设置字符串长度>>>"{foo}{}{bar}{}".format(1,2,bar=4,foo=3)'3142'>>>"{foo}{1}{bar}{0}".format(1,2,ba
系统 2019-09-27 17:49:14 1894
一、安装Python1)官网下载安装2)配置环境变量(未勾选自动配置需要手动配置)3)检查是否安装成功(交互窗口中输入Python-v)二、Selenium3.X+FireFox驱动+geckodriver1、安装selenium:1)W+r输入cmd,然后输入pipinstallselenium2)安装FireFox,添加附加组件seleniumIDE、FireBUG3)https://github.com/mozilla/geckodriver/rel
系统 2019-09-27 17:48:46 1894
现在拥有了正则表达式这把神兵利器,我们就可以进行对爬取到的全部网页源代码进行筛选了。下面我们一起尝试一下爬取内涵段子网站:http://www.neihan8.com/article/list_5_1.html打开之后,不难看出里面一个一个非常有内涵的段子,当你进行翻页的时候,注意url地址的变化:第一页url:http://www.neihan8.com/article/list_5_1.html第二页url:http://www.neihan8.com
系统 2019-09-27 17:48:39 1894
一数据结构和GIL1queue标准库queue模块,提供FIFO的queue、LIFO的队列,优先队列Queue类是线程安全的,适用于多线程间安全的交换数据,内部使用了Lock和Condition为什么说容器的大小不准确,其原因是如果不加锁,是不可能获取到准确的大小的,因为你刚读取了一个大小,还没取走,有可能被就被其他线程修改了,queue类的size虽然加了锁,但是依然不能保证立即get,put就能成功,因为读取大小和get,put方法是分来的。2GIL
系统 2019-09-27 17:48:10 1894
发现一个很简单的配置方法,一直想写的没写上,今天抽空就把它给补充完整好了。本文的配置方法Windows,Mac和Linux系统均适合。一.安装MATLABEngineAPIforpythoninstallMATLABEngineAPIforPythonWindows系统cd"matlabroot\extern\engines\python"pythonsetup.pyinstallMacorLinux系统cd"matlabroot/extern/engin
系统 2019-09-27 17:48:05 1894
前言Go大概2009年面世以来,已经8年了,也算是8年抗战。在这8年中,已经有很多公司开始使用Go语言开发自己的服务,甚至完全转向Go开发,也诞生了很多基于Go的服务和应用,比如Dokcer、k8s等,很多的大公司也在用,比如google(作为开发Go语言的公司,当仁不让)、Facebook、腾讯、百度、阿里、京东、小米以及360,当然除了以上提到的,还有很多公司也都开始尝试Golang,这其中是什么原因呢?让我们来一起分析分析。原因1:性能Go极其地快。
系统 2019-09-27 17:48:04 1894
题目描述请实现一个函数用来找出字符流中第一个只出现一次的字符。例如,当从字符流中只读出前两个字符"go"时,第一个只出现一次的字符是"g"。当从该字符流中读出前六个字符“google"时,第一个只出现一次的字符是"l"。输出描述:如果当前字符流没有存在出现一次的字符,返回#字符。思路用两个列表,一个用来保存所有的字符,一个用来保存只出现一次的字符,算法#-*-coding:utf-8-*-classSolution:#返回对应chardef__init__
系统 2019-09-27 17:47:35 1894
你学习到今日,会发现python你基本都掌握了。可以完成基本的东西。。。。。突然有个问题,是为什么我还不能搞程序,完整实现一点东西(贵在坚持,入门就想吃大胖子,想太多了)另外一个问题,我们写出来简单的代码,本来一个很简单的内容,但是真正能用缺要debug很久。。。。(排查)bug###是昆虫,臭虫的意思,在计算机发展过程中,有一个故事,就是昆虫依附在电路板某个地方,导致无法开机。。。debug###就是驱虫,除虫的意思。(会网络的朋友,经常无奈的时候会de
系统 2019-09-27 17:47:06 1894
很多时候可能需要在一个图中画出多条函数图像,但是可能y轴的物理含义不一样,或是数值范围相差较大,此时就需要双y轴。matplotlib和seaborn都可以画双y轴图像。一个例子:importseabornassnsimportmatplotlib.pyplotasplt#ax1forKDE,ax2forCDFf,ax1=plt.subplots()ax1.grid(True)#ax1.set_ylim(0,1)ax1.set_ylabel('KDE')a
系统 2019-09-27 17:46:19 1894