`

Python爬虫基础编程

阅读更多

初学Python爬虫时都会从最简单的方法开始,以下为几种常见的基础做法。

"""
    简单的循环处理
"""
import requests


url_list = [
    "https://www.baidu.com",
"https://www.cnblogs.com/"
]

for url in url_list:
    result = requests.get(url)
    print(result.text)


"""
    线程池处理
"""
import requests
from concurrent.futures import ThreadPoolExecutor


def fetch_request(url):
    result = requests.get(url)
    print(result.text)


url_list = [
    "https://www.baidu.com/",
"https://www.cnblogs.com/"
]

pool = ThreadPoolExecutor(10)

for url in url_list:
    # 线程池中获取线程,执行fetch_request方法
pool.submit(fetch_request, url)

# 关闭线程池
pool.shutdown()

"""
    线程池+回调函数
"""
import requests
from concurrent.futures import ThreadPoolExecutor


def fetch_async(url):
    response = requests.get(url)
    return response


def callback(future):
    print(future.result().text)


url_list = [
    "https://www.baidu.com/",
"https://www.cnblogs.com/"
]

pool = ThreadPoolExecutor(10)

for url in url_list:
    v = pool.submit(fetch_async, url)
    # 调用回调函数
v.add_done_callback(callback)

pool.shutdown()

"""
    进程池处理
"""
import requests
from concurrent.futures import ProcessPoolExecutor


def fetch_requst(url):
    result = requests.get(url)
    print(result.text)


url_list = [
    "https://www.baidu.com/",
"https://www.cnblogs.com/"
]

if __name__ == '__main__':

    pool = ProcessPoolExecutor(max_workers=10)

    for url in url_list:
        pool.submit(fetch_requst, url)

    pool.shutdown()

"""
    进程池+回调函数
"""
import requests
from concurrent.futures import ProcessPoolExecutor


def fetch_async(url):
    response = requests.get(url)
    return response


def callback(future):
    print(future.result().text)


url_list = [
    "https://www.baidu.com/",
"https://www.cnblogs.com/"
]


if __name__ == '__main__':
    pool = ProcessPoolExecutor(10)

    for url in url_list:
        v = pool.submit(fetch_async, url)
        v.add_done_callback(callback)

    pool.shutdown()

0
0
分享到:
评论

相关推荐

    Python爬虫基础教程-主要讲解requests库

    本教程将介绍Python爬虫的基础知识和常用技术,帮助你快速入门Python爬虫编程。 本教程介绍了Python爬虫的基础知识和常用技术,包括发送HTTP请求、解析HTML、提取信息、保存数据、反爬虫策略等。通过学习本教程,你...

    Python 爬虫基础 网络爬虫、数据采集、Python编程、数据处理

    资源描述: 这个资源是关于Python爬虫基础的教程,旨在帮助初学者掌握如何使用Python编程语言构建简单的网络爬虫,从网页中抓取数据,并进行基本的数据处理和存储。 内容概要: 教程涵盖了Python爬虫的基本概念、...

    Python爬虫基础知识

    Python爬虫基础知识摘自千锋教育编著的《Python快乐编程》,内容清晰,项目讲解清楚,还有配套的视频和源码学习,很适合各大高校作为Python教材或者中低高级程序员使用。

    2024年的必考python爬虫面试题10个.zip

    python爬虫内容概要: 本套面试题涵盖了Python爬虫的基本原理、反爬虫策略、常用库(如BeautifulSoup、Scrapy、Selenium)的使用、代理IP的应用、Ajax爬取、多线程/多进程提高效率、分布式爬虫的实现等核心技术点。...

    Python爬虫高级开发工程师5期-视频教程网盘链接提取码下载.txt

    Python爬虫高级开发工程师五期课程是一门专为有一定Python编程基础的学员设计的进阶课程。课程内容包括高级爬虫技术、数据解析与处理、反爬虫策略、分布式爬虫等方面的知识。通过本课程的学习,学员将能够掌握更加...

    解析Python网络爬虫_复习大纲.docx

    解析Python网络爬虫_复习大纲.docx

    Python爬虫零基础入门必会项目实例

    无论您是编程新手还是对Python爬虫感兴趣的进阶开发者,这本书都将帮助您掌握必备技能。 适用人群: 本书适用于所有想要学习Python爬虫技术的人群。无论您是学生、数据分析师、还是对数据挖掘感兴趣的普通人,这...

    python爬虫教程从入门到精通

    第01章从零开始系统入门python爬虫工程师-课程导学第02章彻底解决让人头疼的环境搭建问题第03章我们从了解网络爬虫开始,重新认识爬虫第04章爬虫工程师基本功--计算机网络协议基础第05章爬虫工程师基本功-前端基础第...

    大家说的Python爬虫是指什么?学会Python爬虫需要了解的五大方面.docx

    如果你已经掌握了这些基础知识,那么学习Python爬虫就会更加容易。 2. **HTML和CSS**:学习HTML和CSS基础知识,这是构建网页的基础。如果你想要爬取网页上的信息,那么你需要了解HTML和CSS的基础知识,这样才能更好...

    Python 爬虫基础知识.md

    爬虫是一种自动化程序,用于从互联网上抓取数据。Python 是一种流行的编程语言,广泛用于编写爬虫程序。以下是 Python 爬虫的基础知识。

    【爬虫客必备】Python网络编程基础

    主要内容包括网络基础知识、高级网络操作、Web Services、解析HTML和XHTML、XML、E-mail服务、FTP、使用Python操作数据库、SSL、几种服务器端框架等

    python爬虫入门到精通必备的书籍.docx

    python爬虫入门到精通必备的书籍全文共7页,当前为第1页。python爬虫入门到精通必备的书籍全文共7页,当前为第1页。python爬虫入门到精通必备的书籍 python爬虫入门到精通必备的书籍全文共7页,当前为第1页。 python...

    python爬虫基础知识.docx

    随着互联网的快速发展,大数据时代已经来临。而在获取海量的数据中,网络爬虫成为了一种重要的工具。Python作为一门简单易学且功能强大的编程语言,被广泛...本文将介绍Python爬虫的基础知识,并通过实例来详细说明。

    python爬虫基础知识及爬虫实例.zip

    Python爬虫是指使用Python编程语言编写的一种自动化程序,用于从互联网上抓取数据。爬虫通过模拟浏览器的行为,访问网页的URL,下载网页的内容,解析网页的结构,提取所需的数据。

    Python网络爬虫基础教学大纲.docx

    Python网络爬虫基础教学大纲 Python网络爬虫基础教学大纲全文共10页,当前为第1页。Python网络爬虫基础教学大纲全文共10页,当前为第1页。一、课程的性质与目标 Python网络爬虫基础教学大纲全文共10页,当前为第1页...

    2024年Python爬虫详解(一看就懂).zip

    无论你是学生、数据分析师还是编程爱好者,只要你对Python爬虫感兴趣,都可以从本博客中受益。 ### 使用场景及目标 本博客适用于在家中、学校或任何学习环境中自学Python爬虫。通过跟随博客,读者可以逐步掌握Python...

    Python爬虫程序源代码爬取豆瓣TOP250排行榜数据电影名称评分导演演员等信息

    Python爬虫程序源代码爬取豆瓣TOP250排行榜数据电影名称评分导演演员等信息 知识领域: 数据爬取、数据分析、Python编程技术关键词: Python、网络爬虫、数据抓取、数据处理内容关键词: 豆瓣电影、排行榜、数据...

    python爬虫 (入门&进阶).pdf

    python网络爬虫【Python+人工智能+大数据分析】 python网络爬虫,用python写网络爬虫,达内智能网络编程,0基础学习,学习智能课,简单好学

Global site tag (gtag.js) - Google Analytics