本月博客排行
-
第1名
青否云后端云 -
第2名
e_e -
第3名
vipbooks - silverend
- lemonhandsome
- ajinn
- jveqi
- kingwell.leng
- xiangjie88
年度博客排行
-
第1名
青否云后端云 -
第2名
zw7534313 -
第3名
大家都说我很棒 - liyihz2008
- wy_19921005
- gengyun12
- hbxflihua
- e_e
- luxurioust
- dbagirl
- zysnba
- Alsmile
- robotmen
- gaozzsoft
- jywhltj
- cpongo1
- leslie26
- qepwqnp
- zhangdaiscott
- 解宜然
- cuityang
- sichunli_030
- gashero
- fantaxy025025
- ranbuijj
- gdpglc
- ssydxa219
- wallimn
- vipbooks
- 淡看人生
- hanbaohong
- jickcai
- javashop
- johnsmith9th
- appalese
- gaojingsong
- weiyides
- zhangyi0618
- java-007
- AVI
- laiyangdeli
- lyongq04
- xpenxpen
- liunancun
- 龙哥IT
- conkeyn
- nychen2000
- lyndon.lin
- panshunchang
- ouanui
最新文章列表
Add and Search Word - Data structure design
Design a data structure that supports the following two operations:
void addWord(word)
bool search(word)
search(word) can search a literal word or a regular expression string containing only letters a ...
Lucene的数字范围搜索 (Numeric Range Query)原理
0. 全文索引的核心就是倒排索引.
1. 若数字不支持范围查询, 直接变成字符串查找即可
2. 如果要支持范围查询, 直接的字符串存储支持么?
目前lucene要求term按照字典序(lexicographic sortable)排列,
中文分词算法 之 词典机制性能优化与测试
在之前的两篇博文中文分词算法 之 基于词典的正向最大匹配算法和中文分词算法 之 基于词典的逆向最大匹配算法中,我们对分词实现和词典实现都做了优化,本文对词典实现做进一步优化,并和之前的多个实现做一个对比,使用的词典下载地址,使用的测试文本下载地址。
优化TrieV3的关键在于把虚拟根节点(/)的子节点(词表首字母)提升为多个相互独立的根节点,并对这些根节点建立索引。优化的依据是根节点(词 ...
HBase-0.96中新BlockEncoding算法-PREFIX_TREE压缩的初步探究及测试
PREFIX_TREE(HBASE-4676)是HBase 0.96版本中新增加的一种DataBlock Encode算法。
1.什么是PREFIX_TREE
关于前缀树的介绍可以参考维基百科http://zh.wikipedia.org/wiki/Trie
当然其的实现会有差别
2.HBase中的DataBlock
DataBlock是KeyValue的集合,是Hfil ...
trie 树 的代码
想起搜狐老大的一句话
看代码先看h文件,擦,当初感觉他这句话很2,现在想想,诶。
代码摘自
shellinabox
// trie.h -- Basic implementation of a trie abstract data type
#ifndef TRIE_H__
#define TRIE_H__
#include "libhttp/http.h" ...
Trie树 单词查找树 键树
转自:http://zh.wikipedia.org/wiki/%E7%B4%A2%E5%9B%9E%E6%A0%91
Trie
,又称单词查找树
或键树
,是一种树
形结构,是一种哈希
树的变种。典型应用是用于统计和排序大量的字符串
(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表 ...
POJ_2513_Trie树+欧拉回路+并查集
链接:http://poj.org/problem?id=2513
1.把木棒的端点考虑为顶点,木棒考虑为边,建立起一个无向图。
2.问题转化为在无向图上判断是否有欧拉回路或者欧拉道路。
3.在无向图上判断是否有欧拉回路或者欧拉道路:欧拉定理+并查集(判断连通性)
4.考虑如何统计每个顶点的度,开始用的是暴力解法,直接用数组记录顶点,并且通过顺序查找获得顶点编号,TLE,然后考虑用map(红 ...