`

python爬虫入门(解析)

 
阅读更多

 根据上一篇的转载进行的总结:

 

python爬虫的主要步骤

1.访问网站,获取html数据

2.读取html数据,解析数据,取出你想要的值

   解析数据使用beautifulsoup

 

解析数据的步骤详解:

1. 用beautifulsoup将html数据解析成一个对象

    

soup = BeautifulSoup(html_text, "html.parser")  # 创建BeautifulSoup对象

 

2.通过soup对象,获取标签内容

    myHead=soup.head    #获取第一个<head>标签

    myBody=soup.body     #获取第一个<body>标签

    myBody=soup.b           #获取第一个<b>标签

 

    myPara= day.find_all('p')      # 获取所有p标签

 

3.通过标签对象,获取文本

   text=myPara.string

 

4.div嵌套div,不好定位,就用find_all获取

 

data = body.find_all('div', {'class': 'weather_li_left'})
print(data)

 

 5.获取标签下的所有 <li> 标签,并且输出子标签的文本

     

child=parent.find_all('li')
for text in child:
    print(text.string)

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    Python爬虫开发:从入门到实战(微课版).pptx

    Python爬虫开发:从入门到实战(微课版) 读书笔记模板 Python爬虫开发:从入门到实战(微课版)全文共33页,当前为第1页。 01 思维导图 读书笔记 目录分析 内容摘要 精彩摘录 作者介绍 目录 03 05 02 04 06 Python...

    python 爬虫入门实例.docx

    Python爬虫,简而言之,就是使用Python编程语言来编写的网络爬虫程序。网络爬虫是一种自动化程序,能够在互联网上自动抓取并提取所需的信息。Python作为一种功能强大且易于学习的编程语言,特别适合用来编写爬虫。...

    Python 爬虫入门的教程之Beautiful Soup解析

    Python 爬虫入门的教程之Beautiful Soup解析

    Python 网络爬虫开发 Python爬虫入门基础教程:Python的urllib2 模块解析 共6页.pptx

    Python 网络爬虫开发 Python爬虫入门基础教程:Python的urllib2 模块解析 共6页.pptx

    零基础Python爬虫从入门到精通-视频教程网盘链接提取码下载 .txt

    本套视频教程适合想掌握爬虫技术的学习者,以企业主流版本Python 3.7来讲解,内容包括:Python基础、Urllib、解析(xpath、jsonpath、beautiful)、requests、selenium、Scrapy框架等。针对零基础的同学可以从头学起...

    python 爬虫入门实例.zip

    Python爬虫,简而言之,就是使用Python编程语言来编写的网络爬虫程序。网络爬虫是一种自动化程序,能够在互联网上自动抓取并提取所需的信息。Python作为一种功能强大且易于学习的编程语言,特别适合用来编写爬虫。...

    Python爬虫入门教程:超级简单的Python爬虫教程

    这是一篇详细介绍 Python 爬虫入门的教程,从实战出发,适合初学者。读者只需在阅读过程紧跟文章思路,理清相应的实现代码,30 分钟即可学会编写简单的 Python 爬虫。 这篇 Python 爬虫教程主要讲解以下 5 部分内容...

    Python爬虫入门:基础知识解析.pptx

    Python爬虫获取数据 Python爬虫可以自动化获取网络上的数据,节省大量人力和时间成本。 Python爬虫进行数据分析 Python爬虫可以抓取到大量的用户行为数据,通过分析这些数据,可以更好地理解用户需求。 Python爬虫在...

    Python爬虫入门指南.md

    2. Python爬虫常用库 3. 示例代码 1. 网络爬虫简介 网络爬虫(Web Crawler),也称为网页蜘蛛(Spider),是一种自动获取网页内容的程序。通过模拟用户浏览网页的行为,爬虫可以抓取网页上的信息,如文本、图片、...

    解析Python网络爬虫_复习大纲.docx

    解析Python网络爬虫_复习大纲.docx 本文档是关于Python网络爬虫的复习大纲,涵盖了爬虫的基本概念、实现原理、技术、网页请求原理、抓取网页数据、数据解析、并发下载、抓取动态内容、图像识别与文字处理、存储爬虫...

    分享一个Python爬虫入门实例(有源码,学习使用)

    Python爬虫是一种使用Python编程语言实现的自动化获取网页数据的技术。它广泛应用于数据采集、数据分析、网络监测等领域。以下是对Python爬虫的详细介绍: 1. **架构和组成**: - **下载器**:负责根据指定的URL...

    Python爬虫开发从入门到实战实训指导教程.zip

    第5章 高性能HTML内容解析 第6章 Python与数据库 第7章 异步加载与请求头 第8章 模拟登录与验证码 第9章 抓包与中间人爬虫 第10章 Android原生App爬虫 第11章 Scrapy 第12章 Scrapy高级应用 第13章 爬虫开发中的法律...

    Python爬虫零基础入门必会项目实例

    《Python爬虫零基础入门必会项目实例》资源描述 概要: 《Python爬虫零基础入门必会项目实例》是一本专为初学者设计的Python爬虫教程。本书通过丰富的实例,手把手地指导读者从零开始构建自己的第一个爬虫项目。...

    Python爬虫基础教程-主要讲解requests库

    本教程将介绍Python爬虫的基础知识和常用技术,帮助你快速入门Python爬虫编程。 本教程介绍了Python爬虫的基础知识和常用技术,包括发送HTTP请求、解析HTML、提取信息、保存数据、反爬虫策略等。通过学习本教程,你...

    python爬虫爬虫贴吧图片的实例

    python爬虫入门基础代码实例和1个简单的python爬虫爬虫贴吧图片的实例 代码中给出了注释,并且可以直接运行 python爬虫主要操作步骤: 获取网页html文本内容; 分析html中图片的html标签特征,用正则解析出所有的...

    python爬取北京连家租房数据,可运行的python程序,打开你的爬虫之旅

    是一个可以爬虫入门的文件,带领你走进python的爬虫神奇世界。作为一个使用requests库的小案例,可以调动你的学习兴趣。同时也可以关注我,以后会发一些更加神奇的程序,并且不仅仅是python爬虫,还有flask框架、...

    Python爬虫案例.md

    《Python网络爬虫入门实战》(崔庆才著):这本书从基础开始介绍了Python爬虫的原理和常用库的使用,通过实战项目帮助你快速入门。 网络教程:有很多免费的在线教程可以帮助你学习Python爬虫,比如Python官方文档中...

    小白如何入门 Python 爬虫?.docx

    本文针对初学者,我会用最简单的案例告诉你如何入门python爬虫! 想要入门Python 爬虫首先需要解决四个问题 熟悉python编程 了解HTML 了解网络爬虫的基本原理 学习使用python爬虫库 一、你应该知道什么是爬虫? ...

    Python爬虫是一种使用Python编程语言来自动化获取网页数据的技术 这项技术主要涉及到向目标服务器发送请求,获取HTML页

    教程和文档:对于初学者来说,可以通过阅读Python爬虫的教程和文档来快速入门。这些教程和文档详细介绍了如何使用Python进行网络爬虫的开发,包括如何发送请求、解析HTML、处理异常等。 实战案例:通过实战案例的...

Global site tag (gtag.js) - Google Analytics