论坛首页 Java企业应用论坛

数据自动归类

浏览 5873 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (6)
作者 正文
   发表时间:2011-04-27  
看下面的google结果

"康师傅方便面" + "方便面" About 4,390,000 results
"康师傅方便面" + "纸杯" About 15,300 results
"康师傅方便面" + "小包装大米" About 303 results

所以,明显的,康师傅方便面 是属于  方便面 的
0 请登录后投票
   发表时间:2011-04-27   最后修改:2011-04-27
yinjh 写道
或者

直接  google 商品名称+分类名称,看找到多少网页,越多的越可能是正确的分类
但是这样做要 google 商品数量*分类数量 次
也许不现实
可以用别的办法先初分一下,一个商品先得到3个最可能的分类,
拿不准的话,再逐一google

牛人年年有
今年特别多

这种想法太有新意了.....

顺延你公司很有钱可以买本DGR民航货运指南的货品分类清单(电子版).

这个是全世界公认的货运分类清单.
0 请登录后投票
   发表时间:2011-04-27  
我们项目的导出报就用到了自定义的DTO对象。
0 请登录后投票
   发表时间:2011-04-27  
yinjh 写道
看下面的google结果

"康师傅方便面" + "方便面" About 4,390,000 results
"康师傅方便面" + "纸杯" About 15,300 results
"康师傅方便面" + "小包装大米" About 303 results

所以,明显的,康师傅方便面 是属于  方便面 的


这方法好。
0 请登录后投票
   发表时间:2011-05-01  
还有什么更好的方案吗?
0 请登录后投票
   发表时间:2011-05-05  
贝叶斯分类 利用概率统计知识进行分类的算法
以前用过一个php的邮件分类代理,据说分类准确率可以到90%以上,自己使用了一段时间,确实准确率很高,不过很久没更新了.
java应该有相关的算法实现,自己google一下吧
0 请登录后投票
   发表时间:2011-05-13  
贝叶斯分类的先验知识哪里来?
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics