Autocompete with Trie

Hooopo

浏览: 329117 次
性别:
来自: 北京

最近访客更多访客>>

u012363178

yuan

southwolf

dub

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Ruby

Ruby Redis json performance

像微薄里面用户输入一个@会从服务器取出匹配的用户login name什么的。这种场景用前缀树比较节省空间并且效率高。fast trie——A super fast, efficiently stored Trie for Ruby。据作者说速度是灰常的快。。
地址：https://github.com/tyler/trie

gem install fast_trie

require 'trie'

TRIE = Trie.new

#初始化数据
User.all.each do |user|
  TRIE.add(user.login_name, 0)
end

#js调用autocomplete
def autocomplete
    children = sort_by_weight(TRIE.children(params[:prefix]))

    respond_to do |format|
      format.js { render(:string => JSON.dump(children)) }
    end
  end

根据用户的输入行为给某个key增加权重(用于搜索排序)：
def incr_weight(login_name, n = 1)
  weight = TRIE.get(login_name) || 0
  TRIE.add(login_name, weight + n)
end

#根据权重给结果排序
def sort_by_weight(login_name_list)
  login_name_list.sort_by{|login_name|  TRIE.get(login_name)}
end

这东西的性能不错啊这是测试数据，看样子比那个redis的autocomplete要简单高效呀：

引用

Performance Characteristics

Here are some quick benchmarks on my 2.4ghz Intel Core 2 Duo MacBook Pro:

For keys that are 5 characters long:
31,344 adds/second
1,827,408 searches/second
38,453 prefixes searches/second

For keys that are 10 characters long:
30,653 adds/second
1,802,649 searches/second
13,553 prefix searches/second

For keys that are 20 characters long:
30,488 adds/second
1,851,461 searches/second
5,855 prefix searches/second

For keys that are 40 characters long:
30,710 adds/second
1,838,380 searches/second
2,762 prefix searches/second

不过好像不能被序列化。这样在多进程部署的时候有点麻烦呀。再研究一下。。

3
顶

1
踩

分享到：

reduce method missing call stack with dy ... | 用imagemagick和tesseract-ocr破解简单验 ...

2011-04-09 04:04
浏览 1626
评论(1)
分类:编程语言
查看更多

1 楼 Hooopo 2011-04-20

Why-is-the-autocomplete-for-Quora-so-fasthttp://www.quora.com/Why-is-the-autocomplete-for-Quora-so-fast

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论