搜索到与相关的文章
Python

python爬虫小案例_从豆瓣爬取多页的图书信息保存到数据库(MongoDB)

一、在豆瓣网爬取以下图书的信息:二、参考代码:1、连接MongoDB数据库,并且创建数据库和表importpymongomyclient=pymongo.MongoClient("mongodb://127.0.0.1:27017/")db=myclient['webCrawler']#创建数据库webCrawlerdatatable=db['Book_info']#创建Book_info表2、爬取数据并且存储到数据库importreimportpanda

系统 2019-09-27 17:56:44 2097

Python

完美解决Python2操作中文名文件乱码的问题

Python2默认是不支持中文的,一般我们在程序的开头加上#-*-coding:utf-8-*-来解决这个问题,但是在我用open()方法打开文件时,中文名字却显示成了乱码。我先给大家说说Python中的编码问题,Python中的字符串的大概分为为str和Unicode两种形式,其中str常用的编码类型为utf-8,gb2312,gbk等等,Python使用Unicode作为编码的基础类型。str记录的是字节数组,只是某种编码的存储格式,终于输出到文件或是

系统 2019-09-27 17:56:07 2097

Python

用python进行数据分析:记录(一)

python数据分析记录用python进行数据分析:记录(一)主要记录一些语法语句的使用Seaborn的joinplot图无法显示pearson相关系数如何让sns.joinplot显示pearson相关系数:1.按自己的思路写的代码显示的图标没有rp系数的显示2.如图3.导入stats,写函数4.如图关于zip()函数和enumerate()函数zip()1.该函数用于将多个可迭代对象作为参数,依次将对象中对应的元素打包成一个个元组,然后返回由这些元组组

系统 2019-09-27 17:55:54 2097

Python

详解python函数的闭包问题(内部函数与外部函数详述)

python函数的闭包问题(内嵌函数)>>>deffunc1():...print('func1running...')...deffunc2():...print('func2running...')...func2()...>>>func1()func1running...func2running...内部函数func2作用域都在外部函数func1作用域之内如果试图在外部函数的外部调用内部函数将会报错>>>func2()Traceback(mostre

系统 2019-09-27 17:54:55 2097

Python

python实现kNN算法识别手写体数字的示例代码

1。总体概要kNN算法已经在上一篇博客中说明。对于要处理手写体数字,需要处理的点主要包括:(1)图片的预处理:将png,jpg等格式的图片转换成文本数据,本博客的思想是,利用图片的rgb16进制编码(255,255,255)为白色,(0,0,0)为黑色,获取图片大小后,逐个像素进行判断分析,当此像素为空白时,在文本数据中使用0来替换,反之使用1来替换。fromPILimportImage'''将图片转换成文档,使用0,1分别替代空白和数字'''pic=Im

系统 2019-09-27 17:54:43 2097

Python

Appium+python自动化(二十五)- 那些让人抓耳挠腮、揪头发和掉头发

简介在前边的第二十二篇文章里,已经分享了通过获取控件的坐标点来获取点击事件的所需要的点击位置,那么还有没有其他方法来获取控件点击事件所需要的点击位置呢?答案是:Yes!因为在不同的大小屏幕的手机上获取控件的坐标点,不是一样的,而是有变化的,因此在不同的手机机型上,我们可能都需要重新获取坐标点,这么操作起来,如果操作控件特别的多,那么获取控件的坐标点就会显得特别的繁琐。因此我们可以通过获取控件的ID来避免获取控件坐标点的这种弊端。通过控件ID实现自动化脚本的

系统 2019-09-27 17:53:35 2097

Python

在Python程序员面试中被问的最多的10道题

我们在为大家整Python程序员面试试题中,发现了一些被面试官问到的最多的一些问题,以下就是本篇内容:Python是个非常受欢迎的编程语言,随着近些年机器学习、云计算等技术的发展,Python的职位需求越来越高。下面我收集了10个Python面试官经常问的问题,供大家参考学习。类继承有如下的一段代码:classA(object):defshow(self):print'baseshow'classB(A):defshow(self):print'deriv

系统 2019-09-27 17:53:04 2097

Python

酷! 程序员用Python带你玩转冲顶大会

2018年1月3日,王思聪被迫动用自己的微博,为一个诞生不到10天的App打了广告,“每天我都发奖金,今晚9点就发10万”。对他而言,这天的微博并非生日宴会,而是战场。王思聪的一则微博开启了“全民竞答”类APP的爆红之路。一时间,直播巨头们都跟上“王校长”的节奏,“冲顶大会”之外,映客旗下的“芝士超人”、今日头条旗下的“百万英雄”和花椒直播旗下的“百万作战”纷纷亮相,每天狂撒百万现金。“冲顶大会”、“芝士超人”、“百万英雄”等知识竞答游戏火了,奖金数额也从

系统 2019-09-27 17:52:32 2097

Python

余弦相似性计算及python代码实现过程解析

A:西米喜欢健身B:超超不爱健身,喜欢打游戏step1:分词A:西米/喜欢/健身B:超超/不/喜欢/健身,喜欢/打/游戏step2:列出两个句子的并集西米/喜欢/健身/超超/不/打/游戏step3:计算词频向量A:[1,1,1,0,0,0,0]B:[0,1,1,1,1,1,1]step4:计算余弦值余弦值越大,证明夹角越小,两个向量越相似。step5:python代码实现importjiebaimportjieba.analysedefwords2vec(

系统 2019-09-27 17:52:29 2097

Python

Python一行代码搞定炫酷可视化,你需要了解一下Cufflinks!

Python资源共享群:484031800前言学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等。这些可视化库都有自己的特点,在实际应用中也广为大家使用。plotly、Boken等都是交互式的可视化工具,结合Jupyternotebook可以非常灵活方便地展现分析后的结果。虽然做出的效果非常的炫酷,比如plotly,但是每一次都需要写很长的代

系统 2019-09-27 17:51:31 2097