`
sunnyshuhai
  • 浏览: 40515 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

从Yahoo和Google抓取页面的外链数量

阅读更多

     做过SEO搜索引擎优化的朋友都知道要收集很多相关的数据,如页面的访问量、关键字为页面带来的访问量、页面在关键字下的排名、页面PR值等等,用来监控网站的这些数据的变化情况,为我们的优化工作提供依据。这里边很多的数据都需要从Web上抓取,Google 和Yahoo是数据的最重要来源。 下边这段小程序就是用来获取页面的外部链接数的,把我们需要抓取数据的URL存到一个文本文件中,一行一个。运行程序就生成一个文件,里边有对应的结果,前边是URL后边就是外链数。主要用到了open-uri库。

 

 

require 'open-uri'

def get_yahoo_inlink

  open('yahoourl.txt','w') do |file|
      open('url列表.txt').each do |line|
      line=line.strip()
        
       if line!=''
        search_url=line.gsub(/:/,'%3A').gsub(/\//,'%2F').gsub(/,/,'%2C')
        url="http://siteexplorer.search.yahoo.com/search?p=#{search_url}&bwm=i&bwmo=d" 
        page_content=Kernel.open(url).read()
        result=page_content.scan(/Inlinks \(.*\)/)
          
          if result.length==1
           linknumber=result[0].delete('Inlinks (').delete(')')
           file.puts "#{line}  : #{linknumber}"
        else 
           file.puts "#{line}  :0"
        end
      end
     end      
   end
end

def get_google_inlink
  
  open('googleurl.txt','w') do |file|
      open('url列表.txt').each do |line|
      line=line.strip()
      
      if line!=''
        search_url=line.gsub(/:/,'%3A').gsub(/\//,'%2F').gsub(/,/,'%2C')
        url="http://www.google.com/search?num=20&hl=en&q=link%3A#{search_url}&btnG=Search" 
        page_content=Kernel.open(url).read()
        result=page_content.scan(/of about.* linking to/)
        result2=page_content.scan(/of .* linking to/)
        
        if result.length==1
           linknumber=result[0].delete('of about').delete('linking to').delete('<b>').delete('</b>')
           file.puts "#{line}  : #{linknumber}"
        else 
           if result2.length==1
              linknumber=result2[0].delete('of').delete('linking to').delete('<b>').delete('</b>')
              file.puts "#{line}  : #{linknumber}"
           else 
             file.puts "#{line}  :0"
           end           
         end
       end
     end      
   end
end
 

 

 

 

 

 

 

 

1
0
分享到:
评论

相关推荐

    几木SEO优化工具 优化站点

    10、友情链接检测:检测友情链接网址是否有自己网址的链接,同时检测对方网址的外链数量、GooglePR、百度收录情况及百度快照。 11、网页META检测:快速检测网页的META标签,分析标题、关键词、描述等是否有利于搜索...

    易贸SEO工具箱 v2.4

    6.【排名检测】功能,可以依据网站或关键词检测排名情况、排名升降趋势,支持Google、AOL、Bing、Yahoo和Baidu等搜索引擎。 7.【文章伪原创】功能,批量文件TBS和批量伪原创,自动文字排版和语句友好性整理,手工发...

    易贸SEO工具箱 v2.7.zip

    6.【排名检测】功能,可以依据网站或关键词检测排名情况、排名升降趋势,支持Google、AOL、Bing、Yahoo和Baidu等搜索引擎。 7.【文章伪原创】功能,批量文件TBS和批量伪原创,自动文字排版和语句友好性整理,手工发...

    草根站长工具箱 v10.1.rar

    页面模拟抓取,密度查询,各种加密,ICO在线制作,LOGO在线制作,多功能计数器,各国语言翻译等,增加外链:免费在线快速提高网站暴光率,明显增加网站外部连接(不作弊)。快速提高百度,YAHOO,GOOGLE等排名,网页...

    给网站制作一个完美的优化方案

    从谷歌分析工具中可以看到网站的一些基本数据,记录这些基本的数据,可以清楚的和优化后的网站进行对比,这样才能看出网站优化后到底有没有效果。从而判断我们的网站优化是否成功,这也是站长们想看到的最终结果。 ...

    草根站长工具箱 v9.9

    页面模拟抓取,密度查询,各种加密,ICO在线制作,LOGO在线制作,多功能计数器,各国语言翻译等,增加外链:免费在线快速提高网站暴光率,明显增加网站外部连接(不作弊)。快速提高百度,YAHOO,GOOGLE等排名,网页...

    firefox 14 和网页开发的插件

    有一个比Google Page Speed更强大网页性能优化工具,那就是YSlow,它是由Yahoo提供的页面性能评测和优化工具,YSlow也有页面性能评分,有趣的 是,YSlow评分接近的两个页面,Page Speed评分却相去甚远,在实际的页面...

    蜘蛛大师(zhizhudashi) v1.5 官方版.zip

    支持Google、百度、bing、yahoo!、搜狗、360搜索、Mob百度。 自动采集自动发稿 文章的标题、内容、关键词一键修改,可批量导入TXT内容,瞬间生成上万篇文章,系统也提供新闻采集,自动抓取热门新闻,在配合关键词...

    seo建设者|SEO建设者免费版

     支持目前主流的七大搜索引擎(百度、谷歌、雅虎、搜狗、搜搜、有道、必应)的关键词排名查询。支持网站与关键词的一对多与多对多两种联动查询模式,同时支持关键词排名历史记录保存,关键词收藏等功能。  *百度...

    搜索引擎优化魔法书

    一、抓取.........................................................................................................................................5 二、索引................................................

    SEO魔法书-最全的优化教程

    一、抓取..........................................................................................................................................5 二、索引..............................................

Global site tag (gtag.js) - Google Analytics