`
chencang
  • 浏览: 419969 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

是使用淘宝API获取数据好,还是利用爬虫去抓取数据好呢

阅读更多

RT

目前抓了淘宝的200多万家 的店铺地址(URL)了,不知道算不算流氓爬虫。估计爬了他们 95%的店铺地址 ,仅供参考。

 

发现一个搞笑的店铺,整个店铺里都是卖避孕套之类的,分类到了数码相机类里面去了,哈哈

目前不知道taobao会不会把一个店铺分到多个类中,如何会分到多个类中的话,我这数值还要缩减,自己要来排重一下。

分享到:
评论
6 楼 felicitia 2013-12-08  
需要登录的数据能抓取到吗?模拟淘宝的登录感觉太难了。。。
5 楼 exceedly 2012-10-26  
淘宝有访问其他店铺产品信息的API吗...我怎么没有看到- -
4 楼 chencang 2010-01-17  
njaueducn 写道
抓取这些URL干嘛呢?

根据店铺的url入口来抓取他们的商品,再做一些分析
3 楼 njaueducn 2009-08-26  
抓取这些URL干嘛呢?
2 楼 chencang 2009-07-14  
meishujun1986 写道
你好,你用爬虫抓取到了淘宝的数据?我用淘宝的API调用他的商品信息的时候反正是没有数据返回的,如果可以的话能把你的爬虫程序发给我借鉴一下吗?我的邮箱是meishujun1986@163.com 谢谢了

meishujun1986你好,淘宝API调用是能获得数据的,可能你没有仔细看清API所需的格式、参数等条件,导致了你没有获得返回数据。
我的淘宝的爬虫程序其实就是一个抓取器,发送几个http请求,然后拿到页面来分析就OK了,很简单的,所以建议你自己写一下吧。因为程序整体尚未成型,所以拿不出手,见谅!
1 楼 meishujun1986 2009-07-12  
你好,你用爬虫抓取到了淘宝的数据?我用淘宝的API调用他的商品信息的时候反正是没有数据返回的,如果可以的话能把你的爬虫程序发给我借鉴一下吗?我的邮箱是meishujun1986@163.com 谢谢了

相关推荐

Global site tag (gtag.js) - Google Analytics