1. 查询串为 纯汉字,查询出被拆分为单个字,然后使用全文检索,尽可能找出包含所有查询串的 POI,查找范围为POI拥有的所有文本信息。
而搜索“轩顺”,返回结果为:
两个搜索返回的结果是一致的 --- 包含查询串的POIs;返回列表的排序规则可以总结为:
a. POI中查询出是否按照查询串中的顺序连续全部出现
b. 名称包含优先于地址包含
c. 匹配发生在 名称,标签,地址 等
2. 查询串为 纯拼音,不对查询串(拼音串)进行任何拆分
例子1,shuguang
例子2,shuguan
两个搜索返回的结果基本一致,并且同时出现提示 --
你要找的是不是 曙光 书馆
例子3,caguan
例子4,canguan(餐馆)
上海站全部商户中,没有找到"canguan"(0)
例子5,cacanting
例子6,xijiaobailian(西郊百联)
例子7,xijiaobalian
例子8,xijiaoblian
上海站全部商户中,没有找到"xijiaoblian"(0)
由上面的例子,可以大概推测如下:
a. 内部有一个 pre-defined 词典,保存了 词和拼音 映射关系,
b. 首先使用 拼音 进行匹配搜索,匹配策略可能是:
b1. 精准匹配
b2. 包含匹配
b3. 模糊匹配(最小编辑距离 < 某个阙值,比如2,参考例子6,7,8,读者可自行尝试其他组合)
b4. 没有找到任何匹配,即返回空,参考例子4.(canguan竟然没有,很让人费解)
c. 利用拼音映射到的汉字,转到第一条中的 纯汉字 搜索
d. 匹配发生在 名称,标签,地址 等
另外,
例子9,jiaoda
例子10,jiada
例子11,jiaod
上海站全部商户中,没有找到"jiaod"(0)
例子12,shangda
例子13,shangd
上海站全部商户中,没有找到"shangd"(0)
例子14,sangda
例子15,suguang
由上面的例子可以推测,b3 和 b2 的描述可能是不正确的(例子9,11不符合 b3 最小编辑距离匹配,b2 可以使用 口音近似 进行解释),应该加入了 口音 的考虑(对比 例子15 与前面的例子1,2,以及 例子3 的提示):
<1> 不同的口音,相同的拼音,存在不同的发音,考虑了同一个拼音,近似发音的匹配
<2> 不同的口音,不同的拼音,存在近似的发音,
但 模糊近似发音库 是不完善的,例如 “niu肉”和“liu肉”
后续有新发现,继续补充
3. 查询串为 汉字+拼音
例子16,属guang
例子25,素guang
例子17,属guan
例子18,shu光
例子19,shu广
例子20,shang大
例子21,shang大lei
例子22,shanglei大
上海站全部商户中,没有找到"shanglei大"(0)
例子23,上da
例子24,西jiaobailian
a. 首先不区分 拼音 汉字,进行 全文检索,找到包含整个串的POI,不考虑 查找单元 的顺序
a1. 连续的拼音视为一个查找单元,单个汉子视为查找单元,参考例子20,21,22
a2. 查找不到包含所有 查找单元 的 POI系统,转到 b
b. 汉字映射为拼音,转为 第二条 纯拼音 搜索,注意 例子17,25
- 大小: 8.2 KB
- 大小: 10 KB
- 大小: 14.4 KB
- 大小: 10.3 KB
分享到:
相关推荐
适用范围: 点评系统源码,点评门户网,地方点评网, 运行环境: PHP、MYsql 其他说明:,多种行业的点评,可以自由调控点评项目,类型;默认集成产品、会员卡、优惠券、兑奖中心、新闻咨询、评论等模块。 多类型的...
可把源代码加入自己的网站,也可根据自己需要修改代码相关参数,增加自己的网站功能,为浏览者提供更好的体验。
能够简单的抓取大众点评网的某一大类的(比如我测试的是火锅类)的点评数目,商铺星级以及商铺名称,
一个关于装修网ASP源程序 一个关于装修网ASP源程序
计算机行业2019年报点评暨五月投资策略:新基建下的利好~IDC和网络可视化-20200512-国信证券-22页.pdf
最受欢迎的大家喜欢的点评网源码,希望对大家都有用,这个是从别的网下载下来的,但是我不太会调试。请高手赐教了。
网络公司源码。 适合网络推广、seo技术人员通过网络创业,
放点评网程序,asp开发,vbscript,jscript,asp.net,资源上传等
某公司网络设计及机房装修方案说明(含拓扑图主线图机柜布局图)WORD版.pdf
最新杭州装修网PHP系统程序2013安装教程修改数据库上传
某某装修网销售人员培训资料.docx
python易车网车型点评数据
jquery点评网星级评论是一款基于jquery实现的星级评论特效。 jquery点评网星级评论
点评服务网源码,仿大众点评网,asp,动态,数据库
点评网对数字做了处理,一些数字的信息像评论条数、人均、评分等都做了反爬保护。上面的网页中评论条数是1405条,但在页面源码中,除了第一个数字1以外,后面的数字我们看不到,都是一些像随机编码一样的css class。
方维订餐小秘书(在线订餐系统)功能包含订餐、团购、点评、优惠券、商城、KTV预订、活动发布,积分兑换等,是一款非常强大的O2O订餐网站程序,十分适合打造本地O2O电子服务平台。其他功能请移驾官方了解更多,期待...
这个版板是易翠网的,里面介绍比如店铺装修,还有一些营销方面的知识。很多新手都不装修网店,他都觉得不装修也能赚大钱,我为什么要装修呢? 很多新手都以为开网店成本低就是0成本,开网店的投入虽然很少基本可以...
仿土巴兔装修网源码.rar仿土巴兔装修网源码.rar仿土巴兔装修网源码.rar仿土巴兔装修网源码.rar
淘宝店铺装修 网店素材 装修攻略 店铺秘籍 里面有百种免费模版 素材 店铺经验
淘宝上20元买的