搜索到与相关的文章
Python

python爬虫---从零开始(一)初识爬虫

我们开始来谈谈python的爬虫。1,什么是爬虫:网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。互联网犹如一个大蜘蛛网,我们的爬虫就犹如一个蜘蛛,当在互联网遇到所需要的资源,我们就会爬取下来,即为爬虫是一个请求网站并且提取数据的自动化程序。2,下面我们来提到两个名词:1)请求,request即为我们的请求,当我们在浏览器内输入网址,敲击回车时,这时浏览器就会发送消息给该网址所在

系统 2019-09-27 17:50:56 2141

Python

第四天 python 常用的字符串的操作

Python访问字符串中的值name="huanfengdebianchengriji"print("首字母大写",name.capitalize())print("i的个数",name.count("i"))print("输出name50个如果长度不够,两边补-居中输出",name.center(50,"-"))print("输出name50个如果长度不够,右边补",name.ljust(50,"-"))print("输出name50个如果长度不够,左边

系统 2019-09-27 17:50:36 2141

Python

关于python学习的记录

关于Python3进度打卡文章目录关于Python3进度打卡第一天——9.4一、安装环境变量二、关于编辑三、基本介绍第二天——9.5一、基本数据类型二、基本语句三、编程实践第三天——9.7一、制作贪吃蛇游戏的准备二、需求及算法分析三、代码实现四、一些全局参数的初始化五、关于贪吃蛇及食物的位置六、关于贪吃蛇的上下左右移动七、判断能否迟到食物八、绘制贪吃蛇、食物的函数九、贪吃蛇的逻辑调用十、主逻辑层判断游戏是否结束第一天——9.4一、安装环境变量1、首先访问h

系统 2019-09-27 17:50:31 2141

Python

我的python学习之路

初识pythonpython爬虫爬虫步骤(个人学习后的理解):获取URL地址解析URL源码提取源码中的需要信息使用re、beautifulsoup、urllib.request等常用库写入txt、excel等等。Python格式化字符:format_string%string_to_convert其中:format_string为格式标记字符串,形式为“%cdoe”;string_to_convert为要格式化的字符串,如果是两个以上,则需要用小括号括起来

系统 2019-09-27 17:49:59 2141

Python

python3 中的字符串(单引号、双引号、三引号)以及字符串与数字的运算

python3中的字符串是一种常见的数据类型。字符串有多种表现形式:单引号、双引号和三引号,且这些字符串的表现形式(单、双、三)都必须是成对出现的。单、双引号是英文的:‘'和"",三引号则是三个单引号或者三个双引号都可以:""""""或者'''''',在python中打出来时没有顺序之分(其实也看不出来顺序...),在一对引号的中间打上东西就是字符串,例如:#单引号#'123''小明''xyz'#双引号#"123""小明""xyz"关于单引号:单引号比较特

系统 2019-09-27 17:49:33 2141

Python

python连接hive批量补充时间分区特征

1.python连接数据库frompyhiveimporthiveconn=hive.Connection(host='xxxxxx',port=xxx,auth='CUSTOM',username='yourusername',password='yourpassword',database='default')cursor=conn.cursor()2.SQL代码封装设计为可传参方式defget_sql(d):d="'"+d+"'"add_sql_ho

系统 2019-09-27 17:49:01 2141

Python

python:在django中用celery实现异步

celery英文官方网站:www.celeryproject.org中文网站:http://docs.jinkan.org/docs/celery/celeryCelery是一个简单、灵活且可靠的,处理大量消息的分布式系统,并且提供维护这样一个系统的必需工具。专注于实时处理的任务队列,同时也支持任务调度。作用:解决耗时操作:开一个新的进程,去操作耗时操作,不影响原有进程定时操作,使Listitem用celery定时执行操作:定义一个任务task,也就是一个

系统 2019-09-27 17:48:28 2141

Python

(六)如何利用Python从头开始实现随机森林算法

作者:chen_h微信号&QQ:862251340微信公众号:coderpai(一)机器学习中的集成学习入门(二)bagging方法(三)使用Python进行交易的随机森林算法(四)Python中随机森林的实现与解释(五)如何用Python从头开始实现Bagging算法(六)如何利用Python从头开始实现随机森林算法介绍随机森林是集成学习中一个主要的算法。简而言之,集成方法是一种将几个弱学习器的预测结果进行组合,最终形成一个强学习器的方法。可以直观的猜测

系统 2019-09-27 17:48:27 2141

Python

Python进阶小结

目录一、异常TODO二、深浅拷贝2.1拷贝2.2浅拷贝2.3深拷贝三、数据类型内置方法3.1数字类型内置方法3.1.1整型3.1.2浮点型3.2字符串类型内置方法3.3列表类型内置方法3.4元祖类型内置方法3.5字典类型内置方法3.6集合类型内置方法3.7布尔类型四、数据类型分类4.1按值个数4.2按有序无序4.3按可变不可变一、异常TODO万能捕捉异常公式try:#逻辑代码1/0exceptExceptionase:print(e)divisionbyz

系统 2019-09-27 17:45:32 2141

Python

Python之配置文件处理

在平时的工程中,我们在构建工程时,常常需要用到配置文件,用来配置项目的一些信息,比如数据库,请求网址,文件夹,线程、进程数等信息,这样就可以方便我们通过修改配置文件中的参数来很好地完成整个项目的功能修改或开发。配置文件一般区别于Python代码,会单独存放在一个文件夹中,方便管理,常见的配置文件格式有.conf,.ini,.yaml等。本文使用Python中的configparser模块来处理conf、ini配置文件。首先需要安装configparser模

系统 2019-09-27 17:45:29 2141