`
kofsky
  • 浏览: 197172 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
社区版块
存档分类
最新评论

写八股文的几个想法

阅读更多

    CSDN博客要让我抓狂了,今天晚上又写了篇关于ADABOOST的文章,结果编辑完成的时候突然给我挂掉了,大半个小时心血再次付诸东流,我靠。真TM郁闷,这是这周第二次了。这个变态,下次有更好的技术博客,马上搬家,无语了。

    这两天和几个同学都谈了点论文的东西。感觉常常有几个问题常常需要注意下,仅仅个人意见:而且这是都是入门级别的,都是个人意见,请谨慎参考。

   1.论文的立题点
    这个在论文中最关键的。因为你需要说服别人,你的论文是有价值的,你的工作是有意义的。那你就需要展示出你论文最为独特的地方。对于多数论文,都是是算法改进为主的(仅限在图像处理/机器学习/模式识别/搜索相关领域,其他未知)。在这一类以算法改进为主的论文中,论文的独特之处常常以这样的方式出现:
比如说:
      1).算法XXX,没有考虑某个因素,而这个因素在某些情况是很重要的,本文的算法考虑了,因而能贴近实际情况,达到更好的效果;
      2).算法XXX在考虑某因素的时候作了某个假设,这个假设在某些情况下是不合理的,现在我们作出更合理的假设。
      3).算法XXX在A领域被证明非常的有效,但在B领域效果不佳,其原因是A与B有个MM的不同,我们将算法YY方面修改后,使得算法XXX非常有效的适应于领域B,取得很好的效果;
      4).算法A解决了XXX问题,算法B解决了YYY问题,将两者结合起来,能够解决...问题
      5).算法A把因素M与因素N分开考虑,但事实上它们是相关联的,我们将它们结合在一起,用一个XX函数来体现了这种关联关系;或者反之 
      6).线性改为非线性;用遗传算法代替搜索解决组合优化问题;等等
      如果论文看多了,就会陷入一个固定的思维模式,因为绝大多数论文都是采用这样的写法来表述其论文的立意点。只不过,有的确实有用,而更大多数,都是依葫芦划瓢而已。

    以adaboost算法为例,这个算法的改进算法有很多:
       1).正负样本初始权值:由一致改为分别对待
      2).训练过程中权值修正策略:有的是提高分类错误的样本权值,有的是降低分类正确的样本权值,有的是两者皆取
      3).弱分类器类型:stump,CART
      6).体系结构:级联,二维,boost链
      7).由精确的变为模糊的:fuzzy adaboost
      8).弱分类器搜索策略:Float,优化等
      9).。。。
    一个算法,无论怎么改进,都有其具体的应用场景与不足之处。问题是,如果你要对这个算法进行改进,就必须要了解它的优点与缺点,针对不足之处改进,这样才是站得住脚的。否则,如果懂这个算法的人一看,就晓得你的改进是画蛇添足,直接就OVER了。

    事实上,即使是针对不足之处,大部分改进也是无效的,除了本人写写论文之外,不会再有第二个人再来看这个东西。但是,为了毕业,也就这样罢。有时候感觉,这样的狗屁规定很无聊,但在这样的环境下,就这样罢。糊弄篇论文走人是最关键的。

  2.论文思想的描述
    最好的方式是以数学方式来描述算法与观点。
    刚开始写论文的时候,基本上全是文字加上些图表,甚至以代码形式来描述自己的想法。贴代码是很忌讳的,我以为。看英文文献的时候,常常会有些伪代码,国内的也有,但比较少。但直接贴代码的没见过。常常的做法是,需要对你采用的数据结构与算法进行提炼,提炼成为人更容易理解的表达。比如数学公式,比如系统框架图与流程图,比如文字说明,等等。大多数论文都是这些表达方式的结合体。如果数学性比较强点,非常需要对其进行理论方面的分析与讨论。从数学的角度探讨下,为社么你的想法会更有效?算法的改进体现在数学上面,是哪个点?
这一部分是论文的主体部分。当我想说的时候,居然说不出东西来。我想,最好的方式是,找一篇主题相关的论文,然后照着作为模板来写写。要学习的是,该怎么去组织论文的结构?该怎么去展示你的思想?该怎么去把问题以数学的方式表现出来?该怎么去描述你的算法?

    这个是与论文主题与写法非常相关的东西。实在说不出东西来了。OVER.

    3.实验结果
    实验结果也是比较看重的一个部分。因为只有通这些实验结果才能判定给出的算法是否是有效,是否真的达到了预期的改进效果。有的文章确实是展示了算法的改进效果,但如何展示这些改进效果也有点点技巧:
   1).最好给出统计数据,而不是单个数据。
    在图像处理时尤为突出。有的常常给出同一幅图片,通过以前的算法与现有算法的改进效果图,以为这样就足够了。事实上,这会给人一个假象,就是你这个算法,仅仅对这幅图像有效,而对其他图像效果如何,则无从知晓。更好的方式是,文章给出一个评价标准,然后依据这个评价标准,给出两个不同算法对某一系列图像的实验效果的统计数据。然后再从这一系列中图片选取一幅有代表性的展示出来。要注意的是,针对一系列的图像的统计数据才是决定性的,读者是通过统计数据来获得算法的改进效果。

2).侧重展示算法的改进点,并要点明算法改进效果的应用场景。其实,大部分的改进,有利亦有弊。你如何让人信服的承认,你的改进确实有效呢?那就需要找到,你这个改进的应用场景。比如,你的改进算法效果略差,但速度更快,那么在实时应用中就更有实用价值了;又如你的改进算法针对普通图像效果一般,但针对有某一特定噪音(高斯,椒盐等)的图像时,效果更佳;也就说,你要找到你算法的闪光点,并以说服人的方式展示出来。

4. 其他
   数学公式越复杂越好,论文挂的基金项目越NB越好,参考文献英文越多越好,老板越牛X越好,论文写的越模糊越好;如果加点社么数学证明之类的就更精彩了

     写下这篇日志,发现自己也有点BT。当初看论文的时候,发现查到的很多论文都可以归之于垃圾一类的。很郁闷的,自己也生产了一篇,而且现在居然大言不惭的开始教导产生垃圾的经验。很无语。但这就是现实。很多时候人总是会说,社会这样子,自己保持自己的原则,不同流合污就成了。但往往在做的时候就不一定了。你会向现实低头,就看怎么造出一篇垃圾来毕业。还好,我产生的一篇尽管垃圾,但也许有那么一点点经验价值,毕竟是做了一年半实验的劳动成果。
    人总是会变化。总是想不出明天会变成社么样子。想我大四以前,从没想过与图像处理相关的东西,但是没有办法,要去做图像处理,被逼上路。大四学了一个学期,开始慢慢的入门,后来竟然喜欢上了。每一个变化都让我觉得意外。

    就这样罢。反正是随便写点。没人看最好了,免得教坏了小朋友。

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics