临近端午节,粽子销售进入高峰期。除蛋黄粽、鲜肉粽、豆沙粽等经典口味,今年的粽子届迎来鲍鱼等海鲜及松露等蘑菇的“大举入侵”。2022端午消费趋势数据显示,5月中旬至下旬,粽子销量环比增长超440%,咸粽占据主导优势,咸粽/甜粽的销售比例约为4:1。
现在真的是万物都“卷”,端午节不仅是粽子口味的战争,还是各个品牌之间的战争,毕竟送礼是我们的一大传统,那选择什么牌子的粽子呢?选择什么口味的粽子呢?选择什么价格区间呢?今天爬取了京东上面的 “粽子数据” 进行分析,看看有啥发现吧。本文就从数据爬取、数据清洗、数据可视化,这三个方面入手,教你简单完成一个小型的数据分析项目,让你对爬虫知识能够有一个综合的运用。
数据来源:https://www.jd.com/
基于京东网站,我们搜索网站“粽子”数据,大概有100页,所以我们获取的数据量还是很大的,最重要的一点是像京东这样的网站反爬机制是非常严的,所以做好反爬措施是非常重要的,特别是爬虫代理IP的使用和选择,这里推荐亿牛云,专业提供高质量爬虫代理IP的厂商。本文中分享的也是使用他们家代理的实践。示例如下:
#! -*- encoding:utf-8 -*-
import requests
import random
# 要访问的目标页面
targetUrl = "http://httpbin.org/ip"
# 要访问的目标HTTPS页面
# targetUrl = "https://httpbin.org/ip"
# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理验证信息
proxyUser = "username"
proxyPass = "password"
proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
"host" : proxyHost,
"port" : proxyPort,
"user" : proxyUser,
"pass" : proxyPass,
}
# 设置 http和https访问都是用HTTP代理
proxies = {
"http" : proxyMeta,
"https" : proxyMeta,
}
# 设置IP切换头
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}
resp = requests.get(targetUrl, proxies=proxies, headers=headers)
print resp.status_code
print resp.text
综合数据分析,粽子店铺销量Top10其实与商品相似,五芳斋官方旗舰店和真真老老旗舰店占据首位,遥遥领先。看来五芳斋在大家眼里还是很有人气的。
分享到:
相关推荐
H5游戏---端午节微信小游戏粽子大战,自己通过网络下载的,东西还可以,完整没问题的。
游戏玩法:狂点屏幕,吃得最多粽子,获得最佳称号 源码存放环境:LINUX 6.X + Nginx 环境
端午节的香甜粽子作文.doc
飘香的甜粽子flash动画是一款端午节卡通粽子动画素材下载。
粽子团购产品购销合同.pdf
微信公众号微信小游戏源码,端午节抢粽子大赛。
端午节粽子模板
端午节粽子模板PSD
端午节粽子模板下载
粽子 粽子叶创意轻舟免抠图,赛龙舟抽象镂空图,龙舟满载香粽免抠图,粽子免抠图,香甜粽子免抠图,淡雅小清新竹叶边角修饰免抠图,随风飘摇的柳枝免抠图,端午节高清免抠图打包下载,共13张。
五芳斋粽子的源文件,适用于粽子类平面设计的需要
打开粽子端午节flash动画素材 打开粽子端午节flash动画素材
python画粽子
利用python爬虫爬取淘宝粽子销售数据,并对其分析,得到粽子商品名称词云图、粽子店铺销量Top10、粽子商品销量Top10、各省份粽子销量分布
粽子感官描述性词汇的建立及质构属性的预测,李卢娟,周志磊,本文以6种糯米制备的粽子为研究对象,采用Spectrum法对10名评价员进行培训,建立了粽子的感官描述性词汇,分析了粽子的风味和质构差�
包粽子的方法与步骤图解参考.doc
C语言期末作业-买粽子程序,菜单界面如下所示(免积分下载) >========粽子商店========< 1:增加购物记录 2:修改购物记录 3:删除购物记录 4:查询购物记录 5:统计购物记录 6:大额购物信息 7:时间范围内的购物...
【薪酬报告】粽子行业2021年薪酬调查报告.docx
粽子背景端午节主题PPT模板.pptx
端午节包粽子教学PPT模板.ppt