最新文章列表

怎样通过词频得到这个词频的排序?

     在大规模检索中,我们怎样通过已经的词频得到词频的排序? 通俗点讲,就是当我知道“java”这个词的频率是x,那么"java"到底在排在第几位呢?       大规模数据中,有一个重要的法则叫“齐普夫法则”,它描述为第k个出现次数最多的词汇,它的词频与1/k成正比。这个法则的发现过程一点都不科学,齐普夫是这样干的:找到一本大部头的书籍,统计不同词汇出现的次数并排序,发觉词 ...
AngelAndAngel 评论(0) 有2040人浏览 2012-12-03 14:35

大规模服务中的问题小记

大规模web服务要点: 1)可靠性、负载均衡问题 由于web服务的访问量巨大,一台服务器无法承担负载,而近十几年来的趋势表明,“横向扩展”(scale o ...
johnawm 评论(0) 有956人浏览 2012-08-20 12:43

最近博客热门TAG

Java(141744) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54919) .net(54785) Web(54514) 工作(54118) Linux(50905) Oracle(49875) 应用服务器(43289) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37267) 数据结构(36424)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics