论坛首页 Java企业应用论坛

数据挖掘之分类

浏览 38939 次
精华帖 (10) :: 良好帖 (0) :: 新手帖 (1) :: 隐藏帖 (0)
作者 正文
   发表时间:2008-02-23  
mochow说的和ahuaxuan说的都各自在理,不要为这种文字上的歧义而争论不休了,火气都小一些嘛。

对于分类算法丝毫不了结的人,或许看啦ahuaxuan的代码会更形象得了结这是怎么回事。当然,mochow前辈可能对分类算法有深入的研究,不妨也和大家交流一下心得。大家和和气气讨论讨论岂不是更好?
10 请登录后投票
   发表时间:2008-02-23  
嗯,不要举着棍子打杀,即是说的不对或者不完美,也要给人说话的机会
关键是大家能学习到机会,而不是逞口舌之快,大师都是很谦虚地...
0 请登录后投票
   发表时间:2008-02-24  
如果对这一方面 有兴趣。
算法可以看一下 Duda 的 "pattern classification"
对于统计的方法"The element of statical learning“ 也算很经典的书。
其实我觉得在实际应用中, 更重要的是如何构建feature。 如何评估系统。 最最重要的是哪里找来"Training data". 如果想看一下现。 可以看weka的源代码, 比较基本, 虽然很慢, 每一个算法的注释都会给出基本的参考文献。


0 请登录后投票
   发表时间:2008-02-24  
另外也可以看一下 Andrew Moore 的tutorial:

http://www.autonlab.org/tutorials/

如果你同时对快速实现的算法感兴趣比如如何有效的实现knn。 Andrew Moore 的Group应该是世界上最好的之一了。
0 请登录后投票
   发表时间:2008-02-24  
mba9001 写道
mochow 写道
按照你的逻辑,你应该先检查你自己是否看明白我的意思没有。

我的意思很简单:

首先,分类是一类算法的集合,它包含很多种不同的算法,光统计方法的算法常见的除了knn之外,还有贝叶斯,分类是数据挖掘一个很重要的算法,并不意味着它仅仅属于数据挖掘这一个学科,还在其他很多学科有应用,其中很多领域是数据挖掘涉及不到的地方,很简单的例子,医院的医学图象处理,交通部门的各种图象处理,很多工业上的应用以及航空航天和国防上的应用等等。你是否看懂我的这个意思了呢?至于你说分类用的多不多,你认为在这个研究分类算法的文章里讨论这个有意义么?

其次,分类的学习,我的看法就是掌握分类的基本算法原理比去琢磨或者死记一段代码要重要的多,这样不管你换成什么语言,都可以写出代码来,而且,一旦以后需要用到这个算法的时候,根本无须拘泥于是否是数据挖掘这个领域之内,只要能解决问题就ok。就这个观点来看这篇文章,价值很低。

我的话完了。


看你举的几个例子,如 医院的医学图象处理,交通部门的各种图象处理
大概可以猜出你应该是眼高手低的,顶多你是最多看了看weka的源代码而已.

我也不懂多少.但我不会自认为自己就比别人高明多少.

 

 

老兄你是怎么猜出来的?

 

0 请登录后投票
   发表时间:2008-02-24  
谢谢mba9001,downpour,h819,corvallis的中肯的意见及建议,我也希望大家能够把注意力集中在技术方面,毕竟每个人讨论技术的方式是不一样的,我们的目的是在讨论中得到进步,希望大家看了我的文章之后能够学习到点什么,我也希望能从大家的回复中学习到什么,我们应该相互学习,而不要相互贬低。

关于第二篇文章我已经写好了,就是本文提到的使用knn算法来进行分类 http://www.iteye.com/topic/164435
第三篇文章:“利用朴素bayes定理进行分类”也正在编辑之中,谢谢大家对我的帮助
0 请登录后投票
   发表时间:2008-02-25  
我不认为楼主做错或者说错了什么,这篇文章值得精华……
0 请登录后投票
   发表时间:2008-03-01  
期待 楼主的第三篇 利用朴素bayes定理进行分类
另外 我同意楼上的意见
谢谢楼主提供的相关知识
0 请登录后投票
   发表时间:2008-03-05  
看了这些,我只觉得自己还很需要努力学习,呵呵.我还是个算法盲
0 请登录后投票
   发表时间:2008-03-06  
hyf 写道
mba9001 写道
mochow 写道
按照你的逻辑,你应该先检查你自己是否看明白我的意思没有。

我的意思很简单:

首先,分类是一类算法的集合,它包含很多种不同的算法,光统计方法的算法常见的除了knn之外,还有贝叶斯,分类是数据挖掘一个很重要的算法,并不意味着它仅仅属于数据挖掘这一个学科,还在其他很多学科有应用,其中很多领域是数据挖掘涉及不到的地方,很简单的例子,医院的医学图象处理,交通部门的各种图象处理,很多工业上的应用以及航空航天和国防上的应用等等。你是否看懂我的这个意思了呢?至于你说分类用的多不多,你认为在这个研究分类算法的文章里讨论这个有意义么?

其次,分类的学习,我的看法就是掌握分类的基本算法原理比去琢磨或者死记一段代码要重要的多,这样不管你换成什么语言,都可以写出代码来,而且,一旦以后需要用到这个算法的时候,根本无须拘泥于是否是数据挖掘这个领域之内,只要能解决问题就ok。就这个观点来看这篇文章,价值很低。

我的话完了。


看你举的几个例子,如 医院的医学图象处理,交通部门的各种图象处理
大概可以猜出你应该是眼高手低的,顶多你是最多看了看weka的源代码而已.

我也不懂多少.但我不会自认为自己就比别人高明多少.

 

 

老兄你是怎么猜出来的?

 

首先向mochow道歉.语气太重.

其次,我解释一下我这样回复的原因,和回复一下其它前辈的提问,

1.三人行,必有我师.不可以随意否定别人的努力.

2.每个帖子都会找到适应的读者,君可见各书店的各类入门书非常畅销.

3.学过或看过DM相关的,都会看看weka.

4.对于视音的管理,mochow前辈应该知道,现在已出来和将会出来更多的优秀的"媒资管理系统"

0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics