•  

    唯有真实的苦难,才能驱逐罗曼蒂克的幻想的苦难;
    唯有看到克服苦难的壮烈的悲剧,才能帮助我们担受残酷的命运;
    唯有抱着我不入地狱谁入地狱的精神,才能挽救一个萎靡而自私的民族……

    不经过战斗的舍弃是虚弱的,
    不经劫难磨练的超脱是轻佻的,
    逃避现实的明哲是卑怯的。
    我们比任何时候都更需要精神的支持,
    比任何时候都更需要坚韧和奋斗。
    --------------------------------------------------------------------------
    生活的悲剧不在于人们受到多少苦,而在于人们错过了什么。——卡莱尔
    只要有无限的热情,一个人几乎可以在任何事情上取得成功。——施瓦布
    与其诅咒黑暗,不如燃起蜡烛。——斯特郎

     

  • ☆竞赛网站☆                             ☆学习网站☆
    ICPC:http://icpc.baylor.edu/icpc        USACO: http://ace.delos.com/usacogate
    IOI: http://olympiads.win.tue.nl/ioi/   OIBH:  http://oibh.ioiforum.org/
    IPSC:http://ipsc.ksp.sk/                DRS:   http://www.mydrs.org/

    ☆在线题库——国外☆                     ☆在线题库——国内☆
    UVA  : http://acm.uva.es/problemset      POJ : http://acm.pku.edu.cn/
    URAL : http://acm.timus.ru/              ZOJ : http://acm.zju.edu.cn/
    SGU  : http://acm.sgu.ru/                JOJ : http://acm.jlu.edu.cn/

    http://oibh.kuye.cn/book-lrjhl/

  • xiaoxinpan says:
    Videolectures.net是个好东东,Replay Media Catcher是个更好的东东。。。

  • 发信人: dirichlet (饮水思源), 信区: GoAbroad
    标  题: [电院硕]dirichlet申请总结
    发信站: 北邮人论坛 (Mon May  5 23:49:46 2008), 站内

    前段时间一直没来得及写总结,现在补上。同时期待那几个未报的研也出来写写。


    最后的选择:
    EECS @ UCI, Irvine, CA
    Ph.D, EE, Wireless Commonications
    Fellowship


    申请背景:
    01信息本      GPA:约87,排名:5/257;   主干GPA:约90
    05电院硕      GPA:约88,标准分排名:1/54
    IEEE国际会议论文:6篇,其中一作、二作各3篇
    数模、优研、各种奖学金:共11次
    GRE:很烂,但能用
    TOEFL:610+5.0
    推荐人:研究生导师、研究生课授课老师、竞赛指导老师

    我的劣势和优势同样明显。直到现在,对申请定位,我仍有很多疑问。
    申请还是越早打算越好,并坚定执行自己的计划,否则就像我一样回头看,发现很多很多方面本可以做好或做得更好。


    申请准备与过程:

    07年8月:开始广泛浏览各学校及院系网页;继续修改简历,直至申请结束;完成PS初稿。
    07年9月初:修改PS,完成推荐信初稿,发给数位好友,请他们拍砖。
    07年9月底:在被拍与修改PS数次后,决定重新构思。完成PS后再发给数位同学,让他们继续拍。
    07年10月中:修改定稿PS、推荐信,并把PS发给一位美国朋友,请他从语言上进行全面修改。
    07年10月22日:在清华东门外的星巴克,PS终稿出炉。一个月后,又修改了近100词。
    07年11月初:开出本、硕成绩单;完成推荐信、推荐表格,找老师们签字。
    07年11月9日:在清华紫荆6号楼UPS,寄出第一份申请材料。
    07年12月7日:在曾写过的RS基础上,直接写出RP终稿。
    07年12月19日:在北大南门外UPS,寄出最后一份申请材料。
    08年1月:仔细思考后,婉拒美、加学校各一个。
    08年2月8日:收到UCI的AD,20天后收到正式offer。
    08年3月:想了无数个问题,和众多国内外同学和朋友谈申请、谈学校、谈生活、谈理想。
    08年4月14日:收到并提交SIR,卖给UCI。


    申请总结:

    1,本科GPA:
    重中之重,绝对王道,对硕士生也仍然重要。基本没人关心你的英语、政治多少分,基础课、专业基础课和专业课越高越好。一般来说,85分以上申请基本无障碍。硕士GPA作用不大。

    2,科研与paper:
    对于硕,科研更是重中之重。对于本,有效的科研经历会使你脱颖而出。对于EECS类专业的各方向,对申请有帮助的国际会议和期刊屈指可数。如果所做项目过于工程化而不易出paper,那么在申请中就要扬长避短。在申请前,最好有至少一篇差不多的paper,因为没paper没真相。

    3,竞赛:
    数模可能有用,但不要过高估计其价值,而且这类开放式竞赛的公信力近几年在下降,但学好数模本身对科研帮助非常大。ACM竞赛价值很高,公信力也很高,但由于其相对专业性而对非计算机类专业申请作用不大。英语演讲、英语辩论赛获奖肯定有帮助。但与前两项相比,竞赛的重要性下降一个量级。

    4,新东方:
    如果不缺钱去听听还是挺好的,但考试还得靠自己,新东方只是介绍技巧和经验,是锦上添花的东西。如果对单口相声、神话故事感兴趣,新东方是个好地方。

    5,GRE:
    够门槛就行。只要不低于1300+4.0,则申请无障碍。根据个人英语水平不同,建议备考准备时间3到6个月。

    6,TOEFL:
    没考过ibt,故对ibt缺少发言权。从申请要求看,许多学校对ibt的各部分都有分数线,因此ibt还是满重要的。

    7,定位选校:
    在EECS类专业申请中,北邮与清华、北大、中科大、上交、浙大、华科差距显著。抛开学校出身,定位因素包括GPA、科研背景、论文质量与数量、是否有牛推荐、GRE、TOEFL,还有研究兴趣与背景与教授是否匹配,这点异常重要。

    8,专业和方向:
    本科生选择面很大,硕士生则基本固定,具体如何选因人而异。EE和CS是工科申请出国竞争最激烈的两个专业。EE包含十余个小方向,包括无线网络、信号处理、VLSI、嵌入式、电磁、光纤等等。EE中又属无线网络竞争最为激烈,EE中约有近一半都是申的这个方向。

    9,PS/SOP:
    写之前仔细构思,力求新颖独特,逻辑清晰,词句简洁有力,但不可怪异、不可言之无物。PS/SOP改多少遍都不过分,需要精雕细啄,最后找老外或英语好的朋友把语言改顺。其实PS/SOP作用有限,甚至还不如CV,只是因为与其他人精心准备的材料相比,一份粗制滥造的PS/SOP极容易产生负作用。更何况 PS/SOP可以体现出写作水平,所以一定要认真对待。

    10,RP:
    与PS/SOP相比写法上简单的多,但学术性要强很多,类似于开题报告。

    11,CV:
    最值得重视的申请材料。有多少干货,一目了然。

    12,RL:
    除非推荐人在该领域内世界知名,否则作用不大,因为老外都知道中国学生的推荐信是怎么回事,但这并非是可以轻视推荐信的理由。

    13,套磁:
    很难说套磁的作用有多大,因人而已,rp也很重要。


    致谢部分:
    首先感谢父母,除了很好很强大的申请费用支持外,还有他们的鼓励与关心;
    其次感谢我的若干中学同学,他们曾经的申请经验和留学经历为我打开了多扇窗;
    接着感谢goldfish、roddick、zhj5825,你们帮了我很多忙,给了我很多宝贵的建议;
    继而感谢我的msn上为我提供过帮助的各位朋友,祝他们前程似锦;
    然后感谢海外北邮人,正是你们的不断努力,才换来北邮名声的逐年提高;
    最后隆重感谢实验室的各位老师,和为我写推荐信的所有老师!


    最后再说一句:
    申请中不确定因素太多,运气也很重要。建议平时没事多攒rp玩!呵呵~~

  • 机器学习(Machine Learning)大家~zz
        
          闲着无事,想写点一些我所了解的machine learning大家。由于学识浅薄,见识有限,并且仅局限于某些领域,一些在NLP及最近很热的生物信息领域活跃的学者我就浅陋无知,所以不对的地方大家仅当一笑。
      
      Machine Learning 大家(1):M. I. Jordan
      
      在我的眼里,M Jordan无疑是武林中的泰山北斗。他师出MIT,现在在berkeley坐镇一方,在附近的两所名校(加stanford)中都可以说无出其右者, stanford的Daphne Koller虽然也声名遐迩,但是和Jordan比还是有一段距离。
      
      Jordan身兼stat和cs两个系的教授,从他身上可以看出Stat和ML的融合。
      
      Jordan 最先专注于mixtures of experts,并迅速奠定了自己的地位,我们哈尔滨工业大学的校友徐雷跟他做博后期间,也在这个方向上沾光不少。Jordan和他的弟子在很多方面作出了开创性的成果,如spectral clustering, Graphical model和nonparametric Bayesian。现在后两者在ML领域是非常炙手可热的两个方向,可以说很大程度上是Jordan的lab一手推动的。
      
      更难能可贵的是, Jordan不仅自己武艺高强,并且揽钱有法,教育有方,手下门徒众多且很多人成了大器,隐然成为江湖大帮派。他的弟子中有10多人任教授,个人认

    为他现在的弟子中最出色的是stanford的Andrew Ng,不过由于资历原因,现在还是assistant professor,不过成为大教授指日可待;另外Tommi Jaakkola和David Blei也非常厉害,其中Tommi Jaakkola在mit任教而David Blei在cmu做博后,数次获得NIPS最佳论文奖,把SVM的最大间隔方法和Markov network的structure结构结合起来,赫赫有名。还有一个博后是来自于toronto的Yee Whye Teh,非常不错,有幸跟他打过几次交道,人非常nice。另外还有一个博后居然在做生物信息方面的东西,看来jordan在这方面也捞了钱。这方面他有一个中国学生Eric P. Xing(清华大学校友),现在在cmu做assistant professor。
      
      总的说来,我觉得 Jordan现在做的主要还是graphical model和Bayesian learning,他去年写了一本关于graphical model的书,今年由mit press出版,应该是这个领域里程碑式的著作。3月份曾经有人答应给我一本打印本看看,因为Jordan不让他传播电子版,但后来好像没放在心上(可见美国人也不是很守信的),人不熟我也不好意思问着要,可以说是一大遗憾. 另外发现一个有趣的现象就是Jordan对hierarchical情有独钟,相当多的文章都是关于hierarchical的,所以能 hierarchical大家赶快hierarchical,否则就让他给抢了。
      
      用我朋友话说看jordan牛不牛,看他主页下面的Past students and postdocs就知道了。
      
      Machine Learning大家(2):D. Koller
      
      D. Koller是1999年美国青年科学家总统奖(PECASE)得主,IJCAI 2001 Computers and Thought Award(IJCAI计算机与思维奖,这是国际人工智能界35岁以下青年学者的最高奖)得主,2004 World Technology Award得主。
      
      最先知道D koller是因为她得了一个大奖,2001年IJCAI计算机与思维奖。Koller因她在概率推理的理论和实践、机器学习、计算博弈论等领域的重要贡献,成为继Terry Winograd、David Marr、Tom Mitchell、Rodney Brooks等人之后的第18位获奖者。说起这个奖挺有意思的,IJCAI终身成就奖(IJCAI Award for Research Excellence),是国际人工智能界的最高荣誉; IJCAI计算机与思维奖是国际人工智能界35岁以下青年学者的最高荣誉。早期AI研究将推理置于至高无上的地位; 但是1991年牛人Rodney Brooks对推理全面否定,指出机器只能独立学习而得到了IJCAI计算机与思维奖; 但是koller却因提出了Probabilistic Relational Models 而证明机器可以推理论知而又得到了这个奖,可见世事无绝对,科学有轮回。
      
      D koller的Probabilistic Relational Models在nips和icml等各种牛会上活跃了相当长的一段时间,并且至少在实验室里证明了它在信息搜索上的价值,这也导致了她的很多学生进入了 google。虽然进入google可能没有在牛校当faculty名声响亮,但要知道google的很多员工现在可都是百万富翁,在全美大肆买房买车的主。
      
      Koller的研究主要都集中在probabilistic graphical model,如Bayesian网络,但这玩意我没有接触过,我只看过几篇他们的markov network的文章,但看了也就看了,一点想法都没有,这滩水有点深,不是我这种非科班出身的能趟的,并且感觉难以应用到我现在这个领域中。
      
      Koller 才从教10年,所以学生还没有涌现出太多的牛人,这也是她不能跟Jordan比拟的地方,并且由于在stanford的关系,很多学生直接去硅谷赚大钱去了,而没有在学术界开江湖大帮派的影响,但在stanford这可能太难以办到,因为金钱的诱惑实在太大了。不过Koller的一个学生我非常崇拜,叫 Ben Taskar,就是我在(1)中所提到的Jordan的博后,是好几个牛会的最佳论文奖,他把SVM的最大间隔方法和Markov network结合起来,可以说是对structure data处理的一种标准工具,也把最大间隔方法带入了一个新的热潮,近几年很多牛会都有这样的workshop。 我最开始上Ben Taskar的在stanford的个人网页时,正赶上他刚毕业,他的顶上有这么一句话:流言变成了现实,我终于毕业了!可见Koller是很变态的,把自己的学生关得这么郁闷,这恐怕也是大多数女faculty的通病吧,并且估计还非常的push!
      
      Machine learning 大家(3):J. D. Lafferty
      
      大家都知道NIPS和ICML向来都是由大大小小的山头所割据,而John Lafferty无疑是里面相当高的一座高山,这一点可从他的publication list里的NIPS和ICML数目得到明证。虽然江湖传说计算机重镇CMU现在在走向衰落,但这无碍Lafferty拥有越来越大的影响力,翻开AI兵器谱排名第一的journal of machine learning research的很多文章,我们都能发现author或者editor中赫然有Lafferty的名字。
      
      Lafferty给人留下的最大的印象似乎是他2001年的conditional random fields,这篇文章后来被疯狂引用,广泛地应用在语言和图像处理,并随之出现了很多的变体,如Kumar的discriminative random fields等。虽然大家都知道discriminative learning好,但很久没有找到好的discriminative方法去处理这些具有丰富的contextual inxxxxation的数据,直到Lafferty的出现。
      
      而现在Lafferty做的东西好像很杂,semi-supervised learning, kernel learning,graphical models甚至manifold learning都有涉及,可能就是像武侠里一样只要学会了九阳神功,那么其它的武功就可以一窥而知其精髓了。这里面我最喜欢的是semi- supervised learning,因为随着要处理的数据越来越多,进行全部label过于困难,而完全unsupervised的方法又让人不太放心,在这种情况下 semi-supervised learning就成了最好的。这没有一个比较清晰的认识,不过这也给了江湖后辈成名的可乘之机。到现在为止,我觉得cmu的semi- supervised是做得最好的,以前是KAMAL NIGAM做了开创性的工作,而现在Lafferty和他的弟子作出了很多总结和创新。
      
      Lafferty 的弟子好像不是很多,并且好像都不是很有名。不过今年毕业了一个中国人,Xiaojin Zhu(上海交通大学校友),就是做semi-supervised的那个人,现在在wisconsin-madison做assistant professor。他做了迄今为止最全面的Semi-supervised learning literature survey,大家可以从他的个人主页中找到。这人看着很憨厚,估计是很好的陶瓷对象。另外我在(1)中所说的Jordan的牛弟子D Blei今年也投奔Lafferty做博后,就足见Lafferty的牛了。
      
      Lafferty做NLP是很好的,著名的Link Grammar Parser还有很多别的应用。其中language model在IR中应用,这方面他的另一个中国学生ChengXiang Zhai(南京大学校友,2004年美国青年科学家总统奖(PECASE)得主),现在在uiuc做assistant professor。
      
      Machine learning 大家(4):Peter L. Bartlett
      
      鄙人浅薄之见,Jordan比起同在berkeley的Peter Bartlett还是要差一个层次。Bartlett主要的成就都是在learning theory方面,也就是ML最本质的东西。他的几篇开创性理论分析的论文,当然还有他的书Neural Network Learning: Theoretical Foundations。
      
      UC Berkeley的统计系在强手如林的北美高校中一直是top3,这就足以证明其肯定是群星荟萃,而其中,Peter L. Bartlett是相当亮的一颗星。关于他的研究,我想可以从他的一本书里得到答案:Neural Network Learning: Theoretical Foundations。也就是说,他主要做的是Theoretical Foundations。基础理论虽然没有一些直接可面向应用的算法那样引人注目,但对科学的发展实际上起着更大的作用。试想vapnik要不是在VC维的理论上辛苦了这么多年,怎么可能有SVM的问世。不过阳春白雪固是高雅,但大多数人只能听懂下里巴人,所以Bartlett的文章大多只能在做理论的那个圈子里产生影响,而不能为大多数人所广泛引用。
      
      Bartlett在最近两年做了大量的Large margin classifiers方面的工作,如其convergence rate和generalization bound等。并且很多是与jordan合作,足见两人的工作有很多相通之处。不过我发现Bartlett的大多数文章都是自己为第一作者,估计是在教育上存在问题吧,没带出特别牛的学生出来。
      
      Bartlett的个人主页的talk里有很多值得一看的slides,如Large Margin Classifiers: Convexity and Classification;Large Margin Methods for Structured Classification: Exponentiated Gradient Algorithms。大家有兴趣的话可以去下来看看。
      
      Machine learning 大家(5): Michael Collins
      
      Michael Collins (http://people.csail.mit.edu/mcollins/)
      自然语言处理(NLP)江湖的第一高人。出身Upenn,靠一身叫做Collins Parser的武功在江湖上展露头脚。当然除了资质好之外,其出身也帮了不少忙。早年一个叫做Mitchell P. Marcus的师傅传授了他一本葵花宝典-Penn Treebank。从此,Collins整日沉迷于此,终于练成盖世神功。
      
      学成之后,Collins告别师傅开始闯荡江湖,投入了一个叫AT&T Labs Research的帮会,并有幸结识了Robert Schapire、Yoram Singer等众多高手。大家不要小瞧这个叫AT&T Labs Research的帮会,如果谁没有听过它的大名总该知道它的同父异母的兄弟Bell Labs吧。
      
      言归正传,话说Collins在这里度过了3年快乐的时光。其间也奠定了其NLP江湖老大的地位。并且练就了Discriminative Reranking, Convolution Kernels,Discriminative Training Methods for Hidden Markov Models等多种绝技。然而,世事难料,怎奈由于帮会经营不善,这帮大牛又不会为帮会拼杀,终于被一脚踢开,大家如鸟兽散了。Schapire去了 Princeton, Singer 也回老家以色列了。Collins来到了MIT,成为了武林第一大帮的六袋长老,并教授一门叫做的Machine Learning Approaches for NLP(http://www.ai.mit.edu/courses/6.891-nlp/) 的功夫。虽然这一地位与其功力极不相符,但是这并没有打消Collins的积极性,通过其刻苦打拼,终于得到了一个叫Sloan Research Fellow的头衔,并于今年7月,光荣的升任7袋Associate Professor。
      
      在其下山短短7年时间内,Collins共获得了4次世界级武道大会冠军(EMNLP2002, 2004, UAI2004, 2005)。相信年轻的他,总有一天会一统丐帮,甚至整个江湖。
      
      看过Collins和别人合作的一篇文章,用conditional random fields 做object recogntion。还这么年轻,admire to death!

        Machine learning 大家(6): Dan Roth

        Dan Roth (http://l2r.cs.uiuc.edu/~danr/)
        统计NLP领域的众多学者后,我得出了一个惊人的结论,就是叫Daniel的牛人特别多: 大到MT领域成名已久的Prof. Dan Melamed,小到Stanford刚刚毕业的Dan Klein,

    中间又有Dan jurafsky这种牛魔王,甚至Michael Collins的师弟Dan Bikel (IBM Research),ISI的Dan Marcu,获得过无数次TREC QA评比冠军的Prof. Dan Moldovan (UTexas Dallas),UC Berkeley毕业的Dan Gildea (U Rochester)。但是,在众多的Dan中,我最崇拜的还是UIUC的Associate Professor,其Cognitive Computation Group的头头Dan Roth。

        这位老兄也是极其年轻的,Harvard博士毕业整十年,带领其团队撑起了UIUC Machine Learning以及NLP领域的一片灿烂天空。其领导开发的SNoW工具可谓是一把绝世好剑,基本达到了"又想马儿跑,又想马儿不吃草"的境界,在不损失分类精度的条件下,学习和预测速度空前。什么?你不知道SNoW?它和白雪公主有什么关系?看来我也得学学"超女"的粉丝们,来一个扫盲了: SNoW是Sparse Network of Winnows的简称,其中实现了Winnow算法,但是记住Sparse Network才是其重点,正是因为有了这块玄铁,SNoW之剑才会如此锋利。

       近年来Roth也赶时髦,把触角伸向了Structured Data学习领域,但与其他人在学习的时候就试图加入结构化信息(典型的如CRF)不同,Roth主张在预测的最后阶段加入约束进行推理,这可以使的学习效率极大的提高,同时在某些应用上,还取得了更好的结果。还有就是什么Kernel学习,估计他也是学生太多,安排不下了,所以只好开疆扩土。

        Harvard出身的Roth,理论功底也极其深厚,好多涉及统计学习理论的工作就不是我这种学工科的人关心的了。

       个人补充一点:南京大学的一个Machine Learning的牛人网名也叫Daniel是不是跟文中的叙述有关呢,呵呵~

  • [转帖] daniel: AI conferences
    发信人: daniel (飞翔鸟), 信区: CompSci
    标  题: 杂谈1: AI tier-1 conferences
    发信站: 小百合BBS (Sat Jun 18 00:42:29 2005)

    好久以前就说要为这个版做点贡献了, 今天6月18日, 黄道吉日, 开始杂谈, 呵呵.


    今天先谈谈AI里面tier-1的conferences, 其实基本上就是AI里面大家比较公认的

    top conference. 下面同分的按字母序排列:


    IJCAI (1+): AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI

      实在太大, 所以虽然每届基本上能录100多篇(现在已经到200多篇了),但分到每个

      领域就没几篇了,象machine learning、computer vision这么大的领域每次大概也

      就10篇左右, 所以难度很大. 不过从录用率上来看倒不太低,基本上20%左右, 因为内

      行人都会掂掂分量, 没希望的就别浪费reviewer的时间了. 最近中国大陆投往国际会

      议的文章象潮水一样, 而且因为国内很少有能自己把关的研究组, 所以很多会议都在

      complain说中国的低质量文章严重妨碍了PC的工作效率. 在这种情况下, 估计这几年

      国际会议的录用率都会降下去. 另外, 以前的IJCAI是没有poster的, 03年开始, 为了

      减少被误杀的好人, 增加了2页纸的poster.值得一提的是, IJCAI是由貌似一个公司

      的"IJCAI Inc."主办的(当然实际上并不是公司, 实际上是个基金会), 每次会议上要

      发几个奖, 其中最重要的两个是IJCAI Research Excellence Award 和 Computer

      & Thoughts Award,  前者是终身成就奖, 每次一个人, 基本上是AI的最高奖(有趣的

      是, 以AI为主业拿图灵奖的6位中, 有2位还没得到这个奖), 后者是奖给35岁以下的

      青年科学家, 每次一个人. 这两个奖的获奖演说是每次IJCAI的一个重头戏.另外,

      IJCAI 的 PC member 相当于其他会议的area chair, 权力很大, 因为是由PC member

      去找 reviewer 来审, 而不象一般会议的PC member其实就是 reviewer. 为了制约

      这种权力, IJCAI的审稿程序是每篇文章分配2位PC member, primary PC member去找

      3位reviewer, second PC member 找一位.


    AAAI (1): 美国人工智能学会AAAI的年会. 是一个很好的会议, 但其档次不稳定, 可

      以给到1+, 也可以给到1-或者2+, 总的来说我给它"1". 这是因为它的开法完全受

      IJCAI制约: 每年开, 但如果这一年的IJCAI在北美举行, 那么就停开. 所以, 偶数年

      里因为没有IJCAI, 它就是最好的AI综合性会议, 但因为号召力毕竟比IJCAI要小一些,

      特别是欧洲人捧AAAI场的比IJCAI少得多(其实亚洲人也是), 所以比IJCAI还是要稍弱

      一点, 基本上在1和1+之间; 在奇数年, 如果IJCAI不在北美, AAAI自然就变成了比

      IJCAI低一级的会议(1-或2+), 例如2005年既有IJCAI又有AAAI, 两个会议就进行了协

      调, 使得IJCAI的录用通知时间比AAAI的deadline早那么几天, 这样IJCAI落选的文章

      可以投往AAAI.在审稿时IJCAI 的 PC chair也在一直催, 说大家一定要快, 因为AAAI

      那边一直在担心IJCAI的录用通知出晚了AAAI就麻烦了.


    COLT (1): 这是计算学习理论最好的会议, ACM主办, 每年举行. 计算学习理论基本上

      可以看成理论计算机科学和机器学习的交叉,  所以这个会被一些人看成是理论计算

      机科学的会而不是AI的会. 我一个朋友用一句话对它进行了精彩的刻画: "一小群数

      学家在开会". 因为COLT的领域比较小, 所以每年会议基本上都是那些人. 这里顺便

      提一件有趣的事, 因为最近国内搞的会议太多太滥, 而且很多会议都是LNCS/LNAI出

      论文集, LNCS/LNAI基本上已经被搞臭了, 但很不幸的是, LNCS/LNAI中有一些很好的

      会议, 例如COLT.


    CVPR (1): 计算机视觉和模式识别方面最好的会议之一, IEEE主办, 每年举行. 虽然题

      目上有计算机视觉, 但个人认为它的模式识别味道更重一些. 事实上它应该是模式识

      别最好的会议, 而在计算机视觉方面, 还有ICCV与之相当. IEEE一直有个倾向, 要把

      会办成"盛会", 历史上已经有些会被它从quality很好的会办成"盛会"了. CVPR搞不好

      也要走这条路. 这几年录的文章已经不少了. 最近负责CVPR会议的TC的chair发信

      说, 对这个community来说, 让好人被误杀比被坏人漏网更糟糕, 所以我们是不是要减

      少好人被误杀的机会啊? 所以我估计明年或者后年的CVPR就要扩招了.


    ICCV (1): 介绍CVPR的时候说过了, 计算机视觉方面最好的会之一. IEEE主办, 每年举行.


    ICML (1): 机器学习方面最好的会议之一. 现在是IMLS主办, 每年举行. 参见关于NIPS的

      介绍.


    NIPS (1): 神经计算方面最好的会议之一, NIPS主办, 每年举行. 值得注意的是, 这个会

      每年的举办地都是一样的, 以前是美国丹佛, 现在是加拿大温哥华; 而且它是年底开会,

      会开完后第2年才出论文集, 也就是说, NIPS'05的论文集是06年出. 会议的名字是

      "Advances in Neural Information Processing Systems", 所以, 与ICML\ECML这样

      的"标准的"机器学习会议不同, NIPS里有相当一部分神经科学的内容, 和机器学习有

      一定的距离. 但由于会议的主体内容是机器学习, 或者说与机器学习关系紧密, 所以

      不少人把NIPS看成是机器学习方面最好的会议之一. 这个会议基本上控制在Michael

      Jordan的徒子徒孙手中, 所以对Jordan系的人来说, 发NIPS并不是难事, 一些未必很

      强的工作也能发上去, 但对这个圈子之外的人来说, 想发一篇实在很难, 因为留给"外

      人"的口子很小. 所以对Jordan系以外的人来说, 发NIPS的难度比ICML更大. 换句话说,

      ICML比较开放, 小圈子的影响不象NIPS那么大, 所以北美和欧洲人都认, 而NIPS则有

      些人(特别是一些欧洲人, 包括一些大家)坚决不投稿. 这对会议本身当然并不是好事,

      但因为Jordan系很强大, 所以它似乎也不太care. 最近IMLS(国际机器学习学会)改选

      理事, 有资格提名的人包括近三年在ICML\ECML\COLT发过文章的人, NIPS则被排除在

      外了. 无论如何, 这是一个非常好的会.


    ACL (1-): 计算语言学/自然语言处理方面最好的会议, ACL (Association of

      Computational Linguistics) 主办, 每年开.


    KR (1-): 知识表示和推理方面最好的会议之一, 实际上也是传统AI(即基于逻辑的AI)

      最好的会议之一. KR Inc.主办, 现在是偶数年开.


    SIGIR (1-): 信息检索方面最好的会议, ACM主办, 每年开. 这个会现在小圈子气越来

      越重. 信息检索应该不算AI, 不过因为这里面用到机器学习越来越多, 最近几年甚至

      有点机器学习应用会议的味道了, 所以把它也列进来.


    SIGKDD (1-): 数据挖掘方面最好的会议, ACM主办, 每年开. 这个会议历史比较短,

      毕竟, 与其他领域相比,数据挖掘还只是个小弟弟甚至小侄儿. 在几年前还很难把它列

      在tier-1里面, 一方面是名声远不及其他的top conference响亮, 另一方面是相对容易

      被录用. 但现在它被列在tier-1应该是毫无疑问的事情了.

      另: 参见sir和lucky的介绍.


    UAI (1-): 名字叫"人工智能中的不确定性", 涉及表示\推理\学习等很多方面, AUAI

      (Association of UAI) 主办, 每年开.


    过两天再来tier-2的

    --

    ※ 来源:.小百合BBS http://lilybbs.us [FROM: 218.94.142.9]

    ※ 修改:.daniel 於 Jun 18 00:47:44 2005 修改本文.[FROM: 218.94.142.9]


    发信人: daniel (飞翔鸟), 信区: CompSci
    标  题: 杂谈2: AI tier-2 conferences
    发信站: 小百合BBS (Mon Jun 20 01:18:16 2005)

    tier-2的会议列得不全, 我熟悉的领域比较全一些.

    AAMAS (2+): agent方面最好的会议. 但是现在agent已经是一个一般性的概念,
       几乎所有AI有关的会议上都有这方面的内容, 所以AAMAS下降的趋势非常明显.

    ECCV (2+): 计算机视觉方面仅次于ICCV的会议, 因为这个领域发展很快, 有可能
       升级到1-去.

    ECML (2+): 机器学习方面仅次于ICML的会议, 欧洲人极力捧场, 一些人认为它已
       经是1-了. 我保守一点, 仍然把它放在2+. 因为机器学习发展很快, 这个会议
       的reputation上升非常明显.

    ICDM (2+): 数据挖掘方面仅次于SIGKDD的会议, 目前和SDM相当. 这个会只有5年
       历史, 上升速度之快非常惊人. 几年前ICDM还比不上PAKDD, 现在已经拉开很大
       距离了.

    SDM (2+): 数据挖掘方面仅次于SIGKDD的会议, 目前和ICDM相当. SIAM的底子很厚,
       但在CS里面的影响比ACM和IEEE还是要小, SDM眼看着要被ICDM超过了, 但至少
       目前还是相当的.

    ICAPS (2): 人工智能规划方面最好的会议, 是由以前的国际和欧洲规划会议合并
       来的. 因为这个领域逐渐变冷清, 影响比以前已经小了.

    ICCBR (2): Case-Based Reasoning方面最好的会议. 因为领域不太大, 而且一直
       半冷不热, 所以总是停留在2上.

    COLLING (2): 计算语言学/自然语言处理方面仅次于ACL的会, 但与ACL的差距比
       ICCV-ECCV和ICML-ECML大得多.

    ECAI (2): 欧洲的人工智能综合型会议, 历史很久, 但因为有IJCAI/AAAI压着,
       很难往上升.

    ALT (2-): 有点象COLT的tier-2版, 但因为搞计算学习理论的人没多少, 做得好
       的数来数去就那么些group, 基本上到COLT去了, 所以ALT里面有不少并非计算
       学习理论的内容.

    EMNLP (2-): 计算语言学/自然语言处理方面一个不错的会. 有些人认为与COLLING
       相当, 但我觉得它还是要弱一点.

    ILP (2-): 归纳逻辑程序设计方面最好的会议. 但因为很多其他会议里都有ILP方面
       的内容, 所以它只能保住2-的位置了.

    PKDD (2-): 欧洲的数据挖掘会议, 目前在数据挖掘会议里面排第4. 欧洲人很想把
       它抬起来, 所以这些年一直和ECML一起捆绑着开, 希望能借ECML把它带起来.
       但因为ICDM和SDM, 这已经不太可能了. 所以今年的PKDD和ECML虽然还是一起开,
       但已经独立审稿了(以前是可以同时投两个会, 作者可以声明优先被哪个会考虑,
       如果ECML中不了还可以被PKDD接受).

    过两天再来tier-3的.


    --

    ※ 来源:.小百合BBS http://lilybbs.us [FROM: 218.94.142.9]

    ※ 修改:.daniel 於 Jun 20 01:19:51 2005 修改本文.[FROM: 218.94.142.9]


    发信人: daniel (飞翔鸟), 信区: CompSci
    标  题: 杂谈3: AI tier-3 conferences
    发信站: 小百合BBS (Wed Jun 22 18:21:26 2005)

    列得很不全. 另外, 因为AI的相关会议非常多, 所以能列在tier-3也算不错了, 基本上能
    进到所有AI会议中的前30%吧

    ACCV (3+): 亚洲的计算机视觉会议, 在亚太级别的会议里算很好的了.

    DS (3+): 日本人发起的一个接近数据挖掘的会议.

    ECIR (3+): 欧洲的信息检索会议, 前几年还只是英国的信息检索会议.

    ICTAI (3+): IEEE最主要的人工智能会议, 偏应用, 是被IEEE办烂的一个典型. 以前的
    quality还是不错的, 但是办得越久声誉反倒越差了, 糟糕的是似乎还在继续下滑, 现在
    其实3+已经不太呆得住了.

    PAKDD (3+): 亚太数据挖掘会议, 目前在数据挖掘会议里排第5.

    ICANN (3+): 欧洲的神经网络会议, 从quality来说是神经网络会议中最好的, 但这个领域
    的人不重视会议,在该领域它的重要性不如IJCNN.

    AJCAI (3): 澳大利亚的综合型人工智能会议, 在国家/地区级AI会议中算不错的了.

    CAI (3): 加拿大的综合型人工智能会议, 在国家/地区级AI会议中算不错的了.

    CEC (3): 进化计算方面最重要的会议之一, 盛会型. IJCNN/CEC/FUZZ-IEEE这三个会议是
    计算智能或者说软计算方面最重要的会议, 它们经常一起开, 这时就叫WCCI (World
    Congress on Computational Intelligence). 但这个领域和CS其他分支不太一样, 倒是和
    其他学科相似, 只重视journal, 不重视会议, 所以录用率经常在85%左右, 所录文章既有
    quality非常高的论文, 也有入门新手的习作.

    FUZZ-IEEE (3): 模糊方面最重要的会议, 盛会型, 参见CEC的介绍.

    GECCO (3): 进化计算方面最重要的会议之一, 与CEC相当,盛会型.

    ICASSP (3): 语音方面最重要的会议之一, 这个领域的人也不很care会议.

    ICIP (3): 图像处理方面最著名的会议之一, 盛会型.

    ICPR (3): 模式识别方面最著名的会议之一, 盛会型.

    IEA/AIE (3): 人工智能应用会议. 一般的会议提名优秀论文的通常只有几篇文章, 被提名
    就已经是很高的荣誉了, 这个会很有趣, 每次都搞1、20篇的优秀论文提名, 专门搞几个
    session做被提名论文报告, 倒是很热闹.

    IJCNN (3): 神经网络方面最重要的会议, 盛会型, 参见CEC的介绍.

    IJNLP (3): 计算语言学/自然语言处理方面比较著名的一个会议.

    PRICAI (3): 亚太综合型人工智能会议, 虽然历史不算短了, 但因为比它好或者相当的综
    合型会议太多, 所以很难上升.

    ※ 修改:.daniel 於 Jun 22 18:24:00 2005 修改本文.[FROM: 218.94.142.8]


    发信人: daniel (飞翔鸟), 信区: CompSci
    标  题: 杂谈4: AI conferences - combined list
    发信站: 小百合BBS (Wed Jun 22 18:58:37 2005)

    说明: 纯属个人看法, 仅供参考. tier-1的列得较全, tier-2的不太全, tier-3的很不全.
          同分的按字母序排列. 不很严谨地说, tier-1是可以令人羡慕的, tier-2是可以令
          人尊敬的,由于AI的相关会议非常多, 所以能列进tier-3的也是不错的

    tier-1:
    IJCAI (1+): International Joint Conference on Artificial Intelligence
    AAAI (1): National Conference on Artificial Intelligence
    COLT (1): Annual Conference on Computational Learning Theory
    CVPR (1): IEEE International Conference on Computer Vision and Pattern
              Recognition
    ICCV (1): IEEE International Conference on Computer Vision
    ICML (1): International Conference on Machine Learning
    NIPS (1): Annual Conference on Neural Information Processing Systems
    ACL (1-): Annual Meeting of the Association for Computational Linguistics
    KR (1-): International Conference on Principles of Knowledge Representation
             and Reasoning
    SIGIR (1-): Annual International ACM SIGIR Conference on Research and
             Development in Information Retrieval
    SIGKDD (1-): ACM SIGKDD International Conference on Knowledge Discovery and
             Data Mining
    UAI (1-): International Conference on Uncertainty in Artificial Intelligence

    tier-2:
    AAMAS (2+): International Joint Conference on Autonomous Agents and
                Multiagent Systems
    ECCV (2+): European Conference on Computer Vision
    ECML (2+): European Conference on Machine Learning
    ICDM (2+): IEEE International Conference on Data Mining
    SDM (2+): SIAM International Conference on Data Mining
    ICAPS (2): International Conference on Automated Planning and Scheduling
    ICCBR (2): International Conference on Case-Based Reasoning
    COLLING (2): International Conference on Computational Linguistics
    ECAI (2): European Conference on Artificial Intelligence
    ALT (2-): International Conference on Algorithmic Learning Theory
    EMNLP (2-): Conference on Empirical Methods in Natural Language Processing
    ILP (2-): International Conference on Inductive Logic Programming
    PKDD (2-): European Conference on Principles and Practice of Knowledge
               Discovery in Databases

    tier-3:
    ACCV (3+): Asian Conference on Computer Vision
    DS (3+): International Conference on Discovery Science
    ECIR (3+): European Conference on IR Research
    ICTAI (3+): IEEE International Conference on Tools with Artificial
                Intelligence
    PAKDD (3+): Pacific-Asia Conference on Knowledge Discovery and Data Mining
    ICANN (3+): International Conference on Artificial Neural Networks
    AJCAI (3): Australian Joint Conference on Artificial Intelligence
    CAI (3): Canadian Conference on Artificial Intelligence
    CEC (3): IEEE Congress on Evolutionary Computation
    FUZZ-IEEE (3): IEEE International Conference on Fuzzy Systems
    GECCO (3): Genetic and Evolutionary Computation Conference
    ICASSP (3): International Conference on Acoustics, Speech, and Signal
                Processing
    ICIP (3): International Conference on Image Processing
    ICPR (3): International Conference on Pattern Recognition
    IEA/AIE (3): International Conference on Industrial and Engineering
            Applications of Artificial Intelligence and Expert Systems
    IJCNN (3): International Joint Conference on Neural Networks
    IJNLP (3): International Joint Conference on Natural Language Processing
    PRICAI (3): Pacific-Rim International Conference on Artificial Intelligence

    ※ 修改:.daniel 於 Jun 22 19:01:40 2005 修改本文.[FROM: 218.94.142.8]

    发信人: daniel (飞翔鸟), 信区: CompSci
    标  题: 杂谈5: 关于list的补充说明
    发信站: 小百合BBS (Thu Jun 23 18:42:51 2005)

    列list只是为了帮助新人熟悉领域, 给出的评分或等级都是个人意见, 仅供参考. 特别要
    说明的是:

    1. tier-1 conference上的文章并不一定比tier-3的好, 只能说前者的平均水准更高.

    2. 研究工作的好坏不是以它发表在哪儿来决定的, 发表在高档次的地方只是为了让工作更
    容易被同行注意到. tier-3会议上发表1篇被引用10次的文章可能比在tier-1会议上发表1
    0篇被引用0次的文章更有价值. 所以, 数top会议文章数并没有太大意义, 重要的是同行的
    评价和认可程度.

    3. 很多经典工作并不是发表在高档次的发表源上, 有不少经典工作甚至是发表在很低档的
    发表源上. 原因很多, 就不细说了.

    4. 会议毕竟是会议, 由于审稿时间紧, 错杀好人和漏过坏人的情况比比皆是, 更何况还要
    考虑到有不少刚开始做研究的学生在代老板审稿.

    5. 会议的reputation并不是一成不变的,新会议可能一开始没什么声誉,但过几年后就野
    鸡变凤凰,老会议可能原来声誉很好,但越来越往下滑.

    6. 只有计算机科学才重视会议论文, 其他学科并不把会议当回事. 但在计算机科学中也有
    不太重视会议的分支.

    7. Politics无所不在. 你老板是谁, 你在哪个研究组, 你在哪个单位, 这些简单的因素都
    可能造成决定性的影响. 换言之, 不同环境的人发表的难度是不一样的. 了解到这一点后
    , 你可能会对high-level发表源上来自low-level单位名不见经传作者的文章特别注意(例
    如如果<计算机学报>上发表了平顶山铁道电子信息科技学院的作者的文章,我一定会仔细读
    ).

    8. 评价体系有巨大的影响. 不管是在哪儿谋生的学者, 都需要在一定程度上去迎合评价体
    系, 否则连生路都没有了, 还谈什么做研究. 以国内来说, 由于评价体系只重视journal,
    有一些工作做得很出色的学者甚至从来不投会议. 另外, 经费也有巨大的制约作用. 国外
    很多好的研究组往往是重要会议都有文章. 但国内是不行的, 档次低一些的会议还可以投
    了只交注册费不开会, 档次高的会议不去做报告会有很大的负面影响, 所以只能投很少的
    会议. 这是在国内做CS研究最不利的地方. 我的一个猜想:人民币升值对国内CS研究会有
    不小的促进作用(当然, 人民币升值对整个中国来说利大于弊还是弊大于利很难说).

    9. ... ...

  • The importance of stupidity in scientific research(转自未名BBS)  2009-04-04 21:44  |  (分类:默认分类)

    发信人: emptyhb (bio02|带着梦想去飞), 信区: AdvancedEdu
    标  题: Why and how Ph.D.
    发信站: 北大未名站 (2009年04月04日03:36:41 星期六), 转信
       

    Ph.D.进入第三年,感悟不少,成果还不多@@
    不过至今还觉得过得很开心,还想一辈子干,所以前三年自以为收获不小
    今天朋友发来一篇Essay,内容是一位教授谈他对ph.d.的一些感悟,深有同感,特别是
    "I don't think students are made to understand how hard it is to do research.
    And how very,very hard it is to do important research"

     First published online May 20, 2008
    doi: 10.1242/10.1242/jcs.033340
    Journal of Cell Science 121, 1771 (2008)
    Published by The Company of Biologists 2008

        Essay
        The importance of stupidity in scientific research
        Martin A. Schwartz
      
        Department of Microbiology, UVA Health System, University of
        Virginia, Charlottesville, VA 22908, USA
      
        e-mail: maschwartz@virginia.edu
      
        Accepted 9 April 2008
      
        I recently saw an old friend for the first time in many years. We
        had been Ph.D. students at the same time, both studying science,
        although in different areas. She later dropped out of graduate
        school, went to Harvard Law School and is now a senior lawyer for
        a major environmental organization. At some point, the
        conversation turned to why she had left graduate school. To my
        utter astonishment, she said it was because it made her feel
        stupid. After a couple of years of feeling stupid every day, she
        was ready to do something else.
      
        I had thought of her as one of the brightest people I knew and her
         subsequent career supports that view. What she said bothered me.
        I kept thinking about it; sometime the next day, it hit me.
        Science makes me feel stupid too. It's just that I've gotten used
        to it. So used to it, in fact, that I actively seek out new
        opportunities to feel stupid. I wouldn't know what to do without
        that feeling. I even think it's supposed to be this way. Let me
        explain.
      
        For almost all of us, one of the reasons that we liked science in
        high school and college is that we were good at it. That can't be
        the only reason – fascination with understanding the physical
        world and an emotional need to discover new things has to enter
        into it too. But high-school and college science means taking
        courses, and doing well in courses means getting the right answers
         on tests. If you know those answers, you do well and get to feel
        smart.
      
        A Ph.D., in which you have to do a research project, is a whole
        different thing. For me, it was a daunting task. How could I
        possibly frame the questions that would lead to significant
        discoveries; design and interpret an experiment so that the
        conclusions were absolutely convincing; foresee difficulties and
        see ways around them, or, failing that, solve them when they
        occurred? My Ph.D. project was somewhat interdisciplinary and, for
         a while, whenever I ran into a problem, I pestered the faculty in
         my department who were experts in the various disciplines that I
        needed. I remember the day when Henry Taube (who won the Nobel
        Prize two years later) told me he didn't know how to solve the
        problem I was having in his area. I was a third-year graduate
        student and I figured that Taube knew about 1000 times more than I
         did (conservative estimate). If he didn't have the answer, nobody
         did.
      
        That's when it hit me: nobody did. That's why it was a research
        problem. And being my research problem, it was up to me to solve.
        Once I faced that fact, I solved the problem in a couple of days.
        (It wasn't really very hard; I just had to try a few things.) The
        crucial lesson was that the scope of things I didn't know wasn't
        merely vast; it was, for all practical purposes, infinite. That
        realization, instead of being discouraging, was liberating. If our
         ignorance is infinite, the only possible course of action is to
        muddle through as best we can.
      
        I'd like to suggest that our Ph.D. programs often do students a
        disservice in two ways. First, I don't think students are made to
        understand how hard it is to do research. And how very, very hard
        it is to do important research. It's a lot harder than taking even
         very demanding courses. What makes it difficult is that research
        is immersion in the unknown. We just don't know what we're doing.
        We can't be sure whether we're asking the right question or doing
        the right experiment until we get the answer or the result.
        Admittedly, science is made harder by competition for grants and
        space in top journals. But apart from all of that, doing
        significant research is intrinsically hard and changing
        departmental, institutional or national policies will not succeed
        in lessening its intrinsic difficulty.
      
        Second, we don't do a good enough job of teaching our students how
         to be productively stupid – that is, if we don't feel stupid it
        means we're not really trying. I'm not talking about `relative
        stupidity', in which the other students in the class actually read
         the material, think about it and ace the exam, whereas you don't.
         I'm also not talking about bright people who might be working in
        areas that don't match their talents. Science involves confronting
         our `absolute stupidity'. That kind of stupidity is an
        existential fact, inherent in our efforts to push our way into the
         unknown. Preliminary and thesis exams have the right idea when
        the faculty committee pushes until the student starts getting the
        answers wrong or gives up and says, `I don't know'. The point of
        the exam isn't to see if the student gets all the answers right.
        If they do, it's the faculty who failed the exam. The point is to
        identify the student's weaknesses, partly to see where they need
        to invest some effort and partly to see whether the student's
        knowledge fails at a sufficiently high level that they are ready
        to take on a research project.
      
        Productive stupidity means being ignorant by choice. Focusing on
        important questions puts us in the awkward position of being
        ignorant. One of the beautiful things about science is that it
        allows us to bumble along, getting it wrong time after time, and
        feel perfectly fine as long as we learn something each time. No
        doubt, this can be difficult for students who are accustomed to
        getting the answers right. No doubt, reasonable levels of
        confidence and emotional resilience help, but I think scientific
        education might do more to ease what is a very big transition:
        from learning what other people once discovered to making your own
         discoveries. The more comfortable we become with being stupid,
        the deeper we will wade into the unknown and the more likely we
        are to make big discoveries.

  • 转帖一篇电子工程上的文章,挺有意思。

    *主旨: 存活者偏差----很重要的逻辑观念*

     1941年,第二次世界大战正打得如火如荼。

     有一天,美国哥伦比亚大学著名统计学 家沃德 教授(Abraham Wald)
     遇到了一个意外的访客, 那是英国皇家空军的作战指挥官。
     他说:「 沃德教授,每次飞行员出发去执行轰炸任务,
     我们最怕听到的回报是: 『呼叫总部,我中弹了!』
     请协助我们改善这个攸关飞行员生死的难题吧!」

     沃德接下这个紧急研究案,他受委托分析德国地面炮火击中联军轰炸机的资料,并且
    以统计专业,建议机体装甲应该如何加强,才能降低被炮火击落的机会。但依照当时的
    航空技术,机体装甲只能局部加强,否则机体过重,会导致起飞困难及操控迟钝。
     沃德将联军轰炸机的弹着点资料,描绘成两张比较表,
     沃德的研究发现,机翼是最容易被击中的部位,
     而飞行员的座舱与机尾,则是最少被击中的部位。
     沃德详尽的资料分析,令英国皇家空军十分满意。

     但在研究成果报告的会议上,却发生一场激辩。

     负责该项目的作战指挥官说:「沃德 教授的研究清楚地显示,联军轰炸机的机翼,
    弹孔密密麻麻,最容易中弹。因此,我们应该加强机翼的装甲。」
     沃德客气但坚定地说: 「将军,我尊敬你在飞行上的专业,
     但我有完全不同的看法,我建议加强飞行员座舱与机尾发动机部位的装甲,因为那儿
    最少发现弹孔。」
     在全场错愕怀疑的眼光中,沃德解释说:「我所分析的样本中,只包含顺利返回基地
    的轰炸机。
     从统计的观点来看,我认为被多次击中机翼的轰炸机, 似乎还是能够安全返航,而飞
    机很少发现弹着点的部位,并非真的不会中弹,
     而是一旦中弹,根本就无法返航。」指挥官反驳说:
     「我很佩服沃德教授没有任何飞行经验,就敢做这么大胆的推论,就我个人而言,过
    去在执行任务时,也曾多次机翼中弹严重受创,要不是我飞行技术老到,运气也不错,
    早就机毁人亡了,所以,我依然强烈主张应该加强机翼的装甲。」这两种意见僵持不
    下,皇家空军部部长陷入苦思。

     他到底要相信这个作战经验丰富的飞将军, 还是要相信一个独排众议的统计学家?
     由于战况紧急,无法做更进一步的研究,部长决定接受沃德的建议,立刻加强驾驶舱
    与机尾发动机的防御装甲。不久之后,联军轰炸机被击落的比例,果然显著降低。为了
    确认这个决策的正确性,一段时间后,英国军方动用了敌后工作人员,搜集了部份坠毁
    在德国境内的联军飞机残骸,他们中弹的部位,果真如沃德所预料,主要集中在驾驶舱
    与发动机的位置。
     看不见的弹痕最致命

     乍看之下,作战指挥官加强机翼装甲的决定十分合理, 但他忽略了一个事实:弹着点
    的分布,是一种严重偏误的资料。
     因为最关键的资料,其实是在被击落的飞机身上,
     但这些飞机却无法被观察到,因此,布满了弹痕的机翼,反而是飞机最强韧的部位。
    空军作战指挥官差点因为太重视「看得见」的弹痕,反而做出错误的决策。
     这个案例有两个特别值得警惕的地方。
     死掉或被俘的人无法发表意见
     第一, 搜集更多资料,并不会改善决策品质。 由于弹痕资料的来源本身就有严重的
    偏误,努力搜集更多的资料,恐怕只会更加深原有的误解。
     第二,召集更多作战经验丰富的飞行员来提供专业意见,也不能改善决策品质,因为
    这些飞行员,正是产生偏误资料过程中的一环。他们都是安全回航的飞行员,虽然可能
    有机翼中弹的经验,但都不是驾驶舱或发动机中弹的「烈士」。

     简单的说, 当他们愈认真凝视那些「看得到」的弹痕,他们离真相就愈远。

     信息界有所谓「Garbage In, Garbage Out」,
     前提(或假设)若是错误,再漂亮的统计算式或方法、再多的资料,也不能让后面的
    推论变得正确。
     在管理实务与日常生活中,许多关键的资料, 也像上述轰炸机的个案一样,会因为
    「失败」而观察不到。

     台大 刘顺仁 教授在著作《决胜》一书中, 对「存活者偏差(survivorship
     bias)」举例说明,是我读过的书中最生动贴切又清楚的一个。如果有一位70岁的老人
    在电视上说,
     他就是靠每天抽一包烟、嚼一包槟榔才能长寿, 请想起「死人没法上电视说话」这件
    事。
     同样的道理,不是那个地方长寿的老人家吃或喝某东西, 某东西就是养生圣品。

     再看一个骗钱的例子(这已经进化到E-mail版)
     1月2日你接到一封匿名信, 向你表示,这个月市场会上涨,结果市场果然上涨,但你
    不以为意,因为大家都知道有元月效应这回事
     (历年来一月间股价涨多跌少)。
     到了 2月1日,你又接到另一封信,向你表示,市场将下跌。这一次,又给那封信说中
    了。
     3月1日再接到一封信,情形一样。7月,你对那位匿名人士的先见之明很感兴趣,对方
    邀你投资某个海外基金。
     于是你把全部的储蓄拿出来投资, 两个月以后,那些钱有如肉包子打狗,一去不回。
     你伏在邻居的肩膀上嚎啕大哭,他告诉你,他也接过两封这种神秘信,但寄到第二封
    就停了。
     他说,第一封信的预测正确,但第二封不正确。
     这是怎么一回事?
     那些骗子玩的把戏是,他们从电话簿找出一万个人名,寄出后市看涨的信给其中一半
    的人, 后市看跌的信给另一半的人。
     一个月后,将有五千人接到的信预测正确, 然后再针对这五千人如法炮制。
     再一个月后,剩下二千五百人接到的信预测正确, 如此直到名单上剩下五百人,其中
    会有两百人受骗上当,
     因此骗子只要花几千美元的邮资,便可赚进数百万美元。
     把手法作些改变。
     某骗子假装投顾老师招收会员,跟你说你可以先加入一般会员,等你觉得准了再加入
    VIP会员。这改变更巧妙的地方在于,骗子一开始就能赚到钱,此外VIP会员还会帮骗子
    建立口碑,证明骗子有多准:存活者偏差(survivorship bias)。

     只要信息不流通, 其它人不知道这假的投顾老师有多么(不)准。
    --