最新文章列表

简单分析爬虫中需要登陆的网站

在爬虫工作过程中经常会遇到需要登录的问题,面对这样的问题就需要用到模拟登录的相关方法。python提供了强大的url库,想做到这个并不难。那么今天我们就以登录京东为例,做一个简单的例子。 在进行实践之前得明白cookie的作用,cookie是某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据。因此我们需要用Cookielib模块来保持网站的cookie。要完整的获取一个需要 ...
小taomi_77 评论(0) 有636人浏览 2022-06-21 16:38

《爬虫逆向进阶实战》一本值得购买的书

现在很多做爬虫的都开始转逆向,我想很多人会在网上购买书籍进行学习,刚好最近618要到了,听说《爬虫逆向进阶实战》开始预售啦!《爬虫逆向进阶实战》以爬虫逆向方向的相关技术和岗位要求进行撰写,结合作者多年工作经验,总结了爬虫的架构体系、主流框架、技术体系和未来发展。  另外书中内容对于大家所擅长的开发语言并没有要求,进阶为高阶爬虫工程师需要了解和掌握的技术内容十分广泛,不局限于编程语言,不拘泥于采集方法 ...
小taomi_77 评论(0) 有6018人浏览 2022-06-13 16:42

又是一年甜咸粽子大战

临近端午节,粽子销售进入高峰期。除蛋黄粽、鲜肉粽、豆沙粽等经典口味,今年的粽子届迎来鲍鱼等海鲜及松露等蘑菇的“大举入侵”。2022端午消费趋势数据显示,5月中旬至下旬,粽子销量环比增长超440%,咸粽占据主导优势,咸粽/甜粽的销售比例约为4:1。 现在真的是万物都“卷”,端午节不仅是粽子口味的战争,还是各个品牌之间的战争,毕竟送礼是我们的一大传统,那选择什么牌子的粽子呢?选择什么口味的粽子呢?选择什 ...
小taomi_77 评论(0) 有439人浏览 2022-06-02 16:10

python学习框架介绍

对于爬虫初学者来说,弄清楚一个领域的知识体系往往比单纯学习某个技术要重要得多,因为技术总会跟随时代发生快速变化,而知识体系往往变化较小,今天我们以自学的角度来了解一下Python爬虫的知识体系吧。 一、python爬虫提取信息的基本步骤:1,获取数据2,解析数据3,提取数据4,保存数据。 二、python爬虫学习框架,爬虫有很多的框架可以选择,还有很多的库可以用,这里重点讲下requests库 ,r ...
小taomi_77 评论(0) 有401人浏览 2022-05-25 16:42

python开发中解决: No module named xxx

   python开发中 No module named xxx  ,是比较常见的问题,今天只探讨其中的一种情况: 同一目录内,a.py 无法import b.py 产生的No module named b    同一文件夹内,新建a.py无法导入已存在的b.py import b  我的pthon环境: python3.9  官网下载的zip包 pycharm 2022.1 折 ...
naily 评论(0) 有428人浏览 2022-05-24 11:22

python简单的获取基金信息

最近基金非常涨跌幅度蛮大的,很多原本不投资、不理财人,也开始讨论、参与买基金了。投资基金的人都知道根据投资对象的不同,基金分为股票型基金、债券基金、混合型基金、货币基金。所以今天我们就来看看,这些基金公司都喜欢买那些公司的股票。 接下来我们就自己动手利用python从基金网站获取数据来进行分析,在整个过程中我们我们需要用到的技术有P代理池,多线程,爬虫等。首先需要编写爬虫,这个是比较简单的。不过我们 ...
小taomi_77 评论(0) 有357人浏览 2022-04-27 16:36

deepin20安装pip3

下载setuptool源码,给python3安装 https://pypi.org/project/setuptools/#files cd setuptools-50.3.2 sudo python3 setup.py build sudo python3 setup.py install 下载pip源码 https://pypi.org/project/pip/#files 4. 解压 ...
brucectl 评论(0) 有194人浏览 2022-03-17 16:49

python更新yaml文件保留注释内容和换行缩进办法

python常用编辑读取yaml文件的库有yaml、pyyaml等,直接使用会因为注释内容大多为中文,编码存储实现方式原因,导致注释丢失,或中文部分变成乱码。   下面是使用ruamel.yaml实现保留手动编辑的注释和中文部分内容方法源码,很简单。   # -*- coding: utf-8 -*- # @Time : 2021/9/5 23:10 # @Author : Admi ...
xiaojingjing 评论(0) 有1451人浏览 2021-11-22 12:42

双十一让人又爱又恨

最近双十一活动正在疯狂的进行中,毕竟是一年一次的大促销,活动力度大,大家都等着这个活动薅羊毛呢。但是这个活动真的是让人又爱又恨呀,公司一直都有在获取京东的一些数据。在活动之前都还进行的挺顺利的,一开始活动后突然发现获取数据不行了,失败率一直在上升,这让我们就很头大了。失败率一升高,我们就以为是代理的原因,一直都是使用的亿牛云代理,还是加强版的一直都是比较给力的,直接找了商家,经过他们技术和我们的研究 ...
小taomi_77 评论(0) 有349人浏览 2021-11-05 16:25

Win 10 中使用 Python 碰到的奇怪现象

本文作者:流光飞舞,来源:https://shuhari.dev/blog/2019/11/win10-store-python 最近在使用 Python 的时候发生了很奇怪的现象:从命令行执行 python.exe 并不会进入 REPL,似乎也没有其他反应,然而稍等片刻,会看到系统弹出 Windows Store 页面,并定位到 Python App 的详情页。 这个现象让我很是 ...
code小生 评论(0) 有211人浏览 2021-10-31 12:16

Java 老兵不死,Kotlin 蓄势待发

本文链接:https://www.oreilly.com/radar/where-programming-languages-are-headed-in-2020/ 作者:Zan McQuade & Amanda Quinn 编译:徐九 在进入新的十年之际,各行各业都在进行盘点与展望。SegmentFault 作为开发者社区与科技行业的垂直媒体,一直关注行业的发展与相关动态,近期 ...
code小生 评论(0) 有271人浏览 2021-09-07 21:30

最近博客热门TAG

Java(141744) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) .net(54785) 编程(39454) JSP(37542) 数据结构(36424) Eclipse(31254) PHP(29988) F#(26079) 算法(24867) 脚本(19840) J#(18922) JDBC(17888) ASP(17480) JDK(14881) JVM(14450)

博客电子书下载排行

    >>浏览更多下载

    相关资讯

    相关讨论

    Global site tag (gtag.js) - Google Analytics