6.2从语言模型“反推”的角度看查询扩展
查询扩展就是根据实际出现的词项推断应该出现的词项,也就是从用户提交的查询推断出隐含在用户查询意图背后的其他词项,从而“揣摩”出用户真实的信息需求。启发式的查询扩展方法在实现扩展时,采用的是一种启发式的扩展词选取方法和权重修正策略,缺乏严格的数学推导和理论依据。为了在统计语言模型框架内实现查询扩展,有必要将用户真实的查询意图表示为查询语言模型(或叫信息需求语言模型),记为θU。
在最简单的情况下,假设θU为一元模型。查询扩展的目的就是利用所有与用户信息需求有关的已知信息来“反推”出潜在的查询语言模型。
这里的“过滤”是一种不可见的潜在过程,可认为是由用户完成的,IR系统的用户根据自己的信息需求(查询意图)挑选出一些能代表其查询意图的关键词构成初始查询提交给IR系统;“反推”则由IR系统来完成,是IR系统根据用户提交的查询“揣摩”其真实查询意图的过程,即根据现有的所有与用户信息需求有关的已知信息(用户提交的查询、文档集、检索的上下文信息、用户的个性化信息以及其他外部知识如WordNet等)“推断”出其真实的查询意图。
6.3基于语言模型估计的反推方法
对于由给定的n篇与用户信息需求相关的文档组成的相关文档集合R={D1,D2,…,Dn},假设R中的每篇文档仅含有一个主题(显然,该主题是与用户信息需求相关的),基于这种假设,我们可认为相关文档集合R所讨论的主题由某个概率模型所生成;为了简化问题的规模,进一步假设该概率生成模型为最简单的一元语言模型,称为相关主题模型,记为θR。根据初始的查询语言模型θQ和相关主题模型θR,我们可以采用线性插值平滑的方法将这两部分信息结合起来,从而获得反推后的查询语言模型θU:
P (w|θU)=α*p(w|θQ)+(1-α)*p(w|θR)
其中α为小于1大于0的插值系数,根据经验获得,缺省值为0.2。
参考:基于统计语言建模的信息检索及相关研究
分享到:
相关推荐
如何从ai效果反推 prompt(方法论)
百度SEO反推软件,反推是什么 使用反推技术,使你的网站秒引蜘蛛秒收录 使用说明: 1.导入链接,开头必须带http://,末尾必须带/,一行一条 2.导入你的百度账号COOKIE,一行一条 3.接入打码平台 4.即刻开启秒收录 ...
dwr反推简单例子,自己写的有的地方自己都没看明白!
基于改进遗传算法的区域OD矩阵反推研究,田亮,陈扶崑,利用极大熵模型反推OD分布矩阵,引入遗传算法求解极大熵模型。针对简单遗传算法存在过早收敛和收敛速度慢的缺点,本文对其进行了�
本文主要讲解了怎样进行PCB原理图反推以及在PCB反推是需要注意的细节,希望对你有所帮助。
使用dwr实现服务器端反推的例子,主要争对点对点聊天模式
讲述ajax的反推讲述ajax的反推讲述ajax的反推讲述ajax的反推讲述ajax的反推讲述ajax的反推
能够从EICAD 纬地等绘制好的横断面图中 反推得到断面数据,纬地里是HDM EICAD里是HDX 数据。并同时输出南方cass的断面数据和偏距+高程数据。 批量操作。 提取数据演示: BEGIN,0.655:1 -35.536,93.113 -26.539,92....
使用spring 整合dwr的反推技术,可以运用于在线聊天的实现。
个人所得税计算 可以反推税前工资!2011新个税计算
UOE成形中X60管线钢板的力学性能反推模型,王林锋,郭宝峰,针对大直径直缝埋弧焊管线钢管在UOE成形及之后的试样压平过程中板料力学性能的变化问题,为实现从钢管力学性能确定毛坯钢板力学性
个人所得税计算器和反推
自适应反推控制buck电路的模块搭建,可用于带未知负载的buck电路研究
通过服务器反推使用DWR框架实现即时聊天系统,资源包内包含JavaBean源文件、DWR配置、聊天页面代码、web配置文件代码、javascript代码
195-基于居民平均出行时间的OD反推方法研究-word资料.pdf
通过 dwr 反推技术 实现 web 聊天 无刷新 跟新技术
为克服飞行控制系统设计中传统增益规划方案的缺点,提出一类飞机纵向运动模型参考反推自适应PID控制方案,并给出了该方案的具体设计过程和跟踪性能改善方法.理论分析和数值仿真结果表明,该方案兼具反推自适应控制和PID...
EXE小工具,可以实现任何的工资,个税计算与反推计算,保险计算,实发工资,应发工资,税前工资的计算核验。
DWR2.x的推技术也叫DWR Reverse Ajax(逆向Ajax)主要是在BS架构中,从服务器端向多个浏览器主动推数据的一种技术。
通达信指标公式源码 MACD 反推指标.doc