做过SEO搜索引擎优化的朋友都知道要收集很多相关的数据,如页面的访问量、关键字为页面带来的访问量、页面在关键字下的排名、页面PR值等等,用来监控网站的这些数据的变化情况,为我们的优化工作提供依据。这里边很多的数据都需要从Web上抓取,Google 和Yahoo是数据的最重要来源。 下边这段小程序就是用来获取页面的外部链接数的,把我们需要抓取数据的URL存到一个文本文件中,一行一个。运行程序就生成一个文件,里边有对应的结果,前边是URL后边就是外链数。主要用到了open-uri库。
require 'open-uri'
def get_yahoo_inlink
open('yahoourl.txt','w') do |file|
open('url列表.txt').each do |line|
line=line.strip()
if line!=''
search_url=line.gsub(/:/,'%3A').gsub(/\//,'%2F').gsub(/,/,'%2C')
url="http://siteexplorer.search.yahoo.com/search?p=#{search_url}&bwm=i&bwmo=d"
page_content=Kernel.open(url).read()
result=page_content.scan(/Inlinks \(.*\)/)
if result.length==1
linknumber=result[0].delete('Inlinks (').delete(')')
file.puts "#{line} : #{linknumber}"
else
file.puts "#{line} :0"
end
end
end
end
end
def get_google_inlink
open('googleurl.txt','w') do |file|
open('url列表.txt').each do |line|
line=line.strip()
if line!=''
search_url=line.gsub(/:/,'%3A').gsub(/\//,'%2F').gsub(/,/,'%2C')
url="http://www.google.com/search?num=20&hl=en&q=link%3A#{search_url}&btnG=Search"
page_content=Kernel.open(url).read()
result=page_content.scan(/of about.* linking to/)
result2=page_content.scan(/of .* linking to/)
if result.length==1
linknumber=result[0].delete('of about').delete('linking to').delete('<b>').delete('</b>')
file.puts "#{line} : #{linknumber}"
else
if result2.length==1
linknumber=result2[0].delete('of').delete('linking to').delete('<b>').delete('</b>')
file.puts "#{line} : #{linknumber}"
else
file.puts "#{line} :0"
end
end
end
end
end
end
分享到:
相关推荐
10、友情链接检测:检测友情链接网址是否有自己网址的链接,同时检测对方网址的外链数量、GooglePR、百度收录情况及百度快照。 11、网页META检测:快速检测网页的META标签,分析标题、关键词、描述等是否有利于搜索...
6.【排名检测】功能,可以依据网站或关键词检测排名情况、排名升降趋势,支持Google、AOL、Bing、Yahoo和Baidu等搜索引擎。 7.【文章伪原创】功能,批量文件TBS和批量伪原创,自动文字排版和语句友好性整理,手工发...
6.【排名检测】功能,可以依据网站或关键词检测排名情况、排名升降趋势,支持Google、AOL、Bing、Yahoo和Baidu等搜索引擎。 7.【文章伪原创】功能,批量文件TBS和批量伪原创,自动文字排版和语句友好性整理,手工发...
页面模拟抓取,密度查询,各种加密,ICO在线制作,LOGO在线制作,多功能计数器,各国语言翻译等,增加外链:免费在线快速提高网站暴光率,明显增加网站外部连接(不作弊)。快速提高百度,YAHOO,GOOGLE等排名,网页...
从谷歌分析工具中可以看到网站的一些基本数据,记录这些基本的数据,可以清楚的和优化后的网站进行对比,这样才能看出网站优化后到底有没有效果。从而判断我们的网站优化是否成功,这也是站长们想看到的最终结果。 ...
页面模拟抓取,密度查询,各种加密,ICO在线制作,LOGO在线制作,多功能计数器,各国语言翻译等,增加外链:免费在线快速提高网站暴光率,明显增加网站外部连接(不作弊)。快速提高百度,YAHOO,GOOGLE等排名,网页...
有一个比Google Page Speed更强大网页性能优化工具,那就是YSlow,它是由Yahoo提供的页面性能评测和优化工具,YSlow也有页面性能评分,有趣的 是,YSlow评分接近的两个页面,Page Speed评分却相去甚远,在实际的页面...
支持Google、百度、bing、yahoo!、搜狗、360搜索、Mob百度。 自动采集自动发稿 文章的标题、内容、关键词一键修改,可批量导入TXT内容,瞬间生成上万篇文章,系统也提供新闻采集,自动抓取热门新闻,在配合关键词...
支持目前主流的七大搜索引擎(百度、谷歌、雅虎、搜狗、搜搜、有道、必应)的关键词排名查询。支持网站与关键词的一对多与多对多两种联动查询模式,同时支持关键词排名历史记录保存,关键词收藏等功能。 *百度...
一、抓取.........................................................................................................................................5 二、索引................................................
一、抓取..........................................................................................................................................5 二、索引..............................................