DM presentation

   周二的DM大作业presentation,第一个出场,便在讲台上面狂讲了50分钟,中途貌似还被偷拍了一张pp…
   Mrs Liu竟然连Adaboost都不知道,直接导致我解释了好半天怎么调weak classifier和samples的权重,以及samples的权重如何影响weak classifier的选择…
    好不容易解释清楚samples的分布只和计算错误率有关,然后在准备一笔带过PCA时,又被抓住不放,使劲的问我78维->6维这个是怎么来的…其实就是求离散度矩阵的特征值,然后选前n个特征值总和占所有特征值总和大于预设阈值的n阿…
   然后终于切入了我原计划的主题,如何找weak classifier…Perceptron方法的比较好懂,所以很快解释清楚了,但是其实具体实现时,在数据本身不可分时,搜索一个使错误率最小的超平面是很困难的。当讲到后面的shanzhai法,Mrs Liu又是连珠发问,十万个为什么又来了…最后还是yangyan上来解释清楚了~~
   话说这次dm作业的数据真BT,来自KDD2004的physical particles,当时winner的正确率是73%,我们现在只跑到68%~~继续加油吧…
   总结一下,咳咳~
   这次上台讲project的感觉还是不错,越来越放的开了,一点也不紧张。主要还是胸有成竹,不怕质疑提问~~嘿嘿~~以后继续多锻炼演讲的能力!come on~
   share一份李开复的slides: 21 Secrets to Becoming A Good Speaker
   share一份我们组的slides: Physical Particles  classification 
   心平常,自非凡~~

PS: 
   周四听别的组的presentation,出来了2个NB的…
   一个组跑一遍程序要9天,做web分类直接去抓google的label,已有的训练集完全不用…
   一个组要花8G内存跑PCA,甚至搞到实验室的服务器上跑…无语,就算你是1000维属性,用的double数组,一个离散度矩阵也才1000*1000*8=8MB阿~~瞎搞~
   …

Creative Commons License
This work, unless otherwise expressly stated, is licensed under a Creative Commons Attribution-No Derivative Works 2.5 China Mainland License.
标签:, ,
此条目发表在 学无止境 分类目录,贴了 , , 标签。将固定链接加入收藏夹。

发表评论

电子邮件地址不会被公开。 必填项已被标记为 *

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>