`
liudaoru
  • 浏览: 1558053 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

使用wget获取一个需要登陆的页面

阅读更多

应用判断是否一个用户是否登录主要是通过cookie,而浏览器最终发给服务器的是一个标准的http头,比如下面的:

 

GET /pc/myInfo HTTP/1.1

Accept: */*

Accept-Language: zh-cn

UA-CPU: x86

Accept-Encoding: gzip, deflate

User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB6; .NET CLR 2.0.50727; CIBA; InfoPath.2)

Host: wenda.sogou.com

Connection: Keep-Alive

Cookie: SUID=aifGPyes

 

wget支持 –head 的方式将这个请求拼出来,所以我们就可以构造一个下面的http请求:

 

wget --head "Accept: */*" --head "Accept-Language: zh-cn" --head "Accept-Encoding: gzip, deflate" --head "User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB6; .NET CLR 2.0.50727; CIBA; InfoPath.2)" --head "Host: wenda.sogou.com "-head "Connection: Keep-Alive" --head "Cache-Control: no-cache" --head "Cookie: SUID=aifGPyes" http://wenda.sogou.com/pc/myInfo

 

这样就可以获取需要登陆的内容了。

1
0
分享到:
评论
2 楼 liudaoru 2009-05-07  
感谢《wget 破除http header下载禁止》,http://www.diybl.com/course/1_web/webjs/2007111/81739.html

1 楼 liudaoru 2009-05-07  

相关推荐

    python自动获取网络音乐工具源代码修改版

    接着,我们可以使用Python的urllib库或者第三方库如wget来下载音乐文件。通过提取音乐文件的URL,我们可以将音乐文件下载到本地存储,方便用户进行播放或者收藏。此外,我们还可以利用Python的第三方库如...

    citycodeinchina:一种获取由www.stats.gov.cn发布的统计使用城市代码的方法

    一种获取由发布的统计使用城市代码的方法 步: 创建数据库和表区域 修改getdata.php中的$ dbconf。(使用pdo驱动程序进行db操作) 下载所有页面:wget -r -c -np -L -P ./2017 移动下载的页面:mv ./2017/ ./2017...

    WEB安全测试

    7.1 使用cURL获取页面 138 7.2 获取URL的许多变体 139 7.3 自动跟踪重定向 140 7.4 使用cURL检查跨站式脚本 141 7.5 使用cURL检查目录遍历 144 7.6 冒充特定类型的网页浏览器或设备 147 7.7 以交互方式冒充另一种...

    retractshons

    我们删除现有的 cookie,证明我们不是机器人,获取一个新的 cookie 并使用 Firefox 的“保存 cookie”插件将其保存到工作目录 当我们有页面时,我们使用 ipython notebook 处理它们 @thatdavidmiller 在 ipython ...

    redmine_negar:Redmine Markdownrich编辑器插件

    Negar插件这是一个Redmine编辑器插件,您可以同时编辑RTF和Markdown格式的文本,这有助于您在编辑HTML RTF格式的页面时拥有动态Wiki。 插件在编辑器上实现,并使用和来带来实时预览和编辑器之间的关联。目录安装只需...

    Python 图片爬虫

    表示从第10页开始扫描到第12页,图片保存文件夹为cache,获取页面失败最多可以尝试3次。 3.运行期间可以随时按回车键退出程序。 运行atlas.py文件爬取网站二: 1.不带参数运行:直接运行atlas.py,使用默认配置参数...

    [完整][中文][WEB安全测试].(美)霍普.扫描版.pdf

    7.1 使用cURL获取页面 138 7.2 获取URL的许多变体 139 7.3 自动跟踪重定向 140 7.4 使用cURL检查跨站式脚本 141 7.5 使用cURL检查目录遍历 144 7.6 冒充特定类型的网页浏览器或设备 147 7.7 以交互方式冒充另一种...

    pyanisort:使用来自anidb.net的信息自动对动漫进行排序

    安装链接到 PyPI 页面: ://pypi.python.org/pypi/pyAniSort 如果您不想安装 pip,还有一个 Windows 安装二进制文件。 安装时请确保您使用的是python3版本的pip。 该程序仅适用于 python3 $ pip install pyanisort ...

    trello-swagger-generator:阅读Trello糟糕的API文档页面并生成一个大文件

    阅读Trello糟糕的API文档页面,并生成一个大文件。 招摇 pip install beautifulsoup4 ./generate_swagger_TrelloAPI.py 查看摇摇欲坠的文件 运行简单的Python http服务器 dev/http_cors_server.py 打开浏览器到 ...

    WykopStatistics:用于收集有关主要开挖数据的程序

    使用pugi xml库以C ++和bash编写如何使用: 要获得主页上的发现的统计信息,首先,您需要一个描述这些发现的xml文件。 您可以从Internet上下载它,链接为: : ,也可以自己生成。 如果您不想生成,请转到步骤2。1....

    CURL用法大全

    最有可能的是您试图进入一个在此服务器上不存在的目录。 11:FTP 非正常的PASS回复。cURL无法解析发送到PASS请求的应答。 13:FTP 非正常的的PASV应答,cURL无法解析发送到PASV请求的应答。 14:FTP非正常的227格式。...

    Etherscan-ML:适用于以太坊和ERC-20区块链的Python数据科学和机器学习库

    Etherscan ML机器学习,数据处理和Bash模块 这是一个正在进行的项目。 由Elyse Lam为USC维特比数据科学...发现一个未记录的API可以获取所有事务,而不会出现get_all_transactions出现页面调度的问题。 需要其他格式。

    Linux抓取网页实例

    Linux抓取网页,简单方法是直接通过curl或wget两种命令。curl和wget命令,目前已经支持Linux和Windows平台,后续将介绍。curl支持http,https,ftp,ftps,scp,telnet等网络协议,详见手册mancurlwget支持http,...

    FrontPage:FrontPage 98主题!

    我采购并启动了FrontPage 98,将一个页面和一堆HTML组件放在一起,然后将其保存在每个可用的主题中,使用wget下载它,然后在此处提交结果。 目前, 192.168.1.13/目录包含了所有HTML( .htm ,因为为什么不呢?)...

    monadical.com:自定义Flask + Jinja2静态网站生成器,为monadical.com提供内容

    静态HTML是使用由Flask,Jinja2和wget支持的简短的自定义网站生成器生成的。 所有元数据都存储在content.json 。 模板位于: templates/ 静态文件位于: static/ 安装 apt install wget python3 # on Ubuntu/...

    dexy:3LO OAuth2 CLI客户端

    敏捷介绍Dexy是一个简单的命令行工具,用于与外部提供程序进行...安装Linux wget https://github.com/Chronojam/dexy/releases/download/v1.0.6/linux-amd64 -O dexy && sudo mv dexy /usr/local/bin/dexy MacOSX wget ...

    nginx编译安装后对nginx进行平滑升级的方法

    nginx编译安装后用了一段时间后发现当前版本有漏洞或需要新的功能时就需要对当前nginx版本进行版本升级,但又不能影响正常的使用,所以这时就需到对nginx的平滑升级,更新到最新版本了。 本文演示的是nginx-1.13.6...

    PT4.28.rar

    2. 进行加密配置,打包程序 www.kxcms.com 在线获取 ...wget https://www.kxcms.com/loader/loader72.so 3.3 下载授权文件 wget 官网打包地址提供 ...wget 官网打包地址提供 ...(如果出现404错误页面,删除install.lock)

    custom-module-loaders:向您展示如何(轻松地)在Clojurescript中使用基于CommonJS的库

    到那时,您应该能够在浏览器中打开index.html ,并使用原始的React和观看一个简单的演示,就像它们打包在npm中一样(模块几个cp和mv可以解决我还没有解决的问题)还没有解决)。 可以随意使用src/cljs/custom-...

    webtest:蜘蛛并测试您网站的缓存策略

    这些脚本将抓取您的网站,生成用于测试的 URL,然后运行标头测试以确定每个页面的 HTTP 状态代码,以及您网站的页面是否正确使用缓存。 它将测试 Varnish 和 Akamai 配置。 它会生成一份不错的报告供您分析。 安装 ...

Global site tag (gtag.js) - Google Analytics