标签归档:adaboost

DM presentation

   周二的DM大作业presentation,第一个出场,便在讲台上面狂讲了50分钟,中途貌似还被偷拍了一张pp…    Mrs Liu竟然连Adaboost都不知道,直接导致我解释了好半天怎么调weak classifier和samples的权重,以及samples的权重如何影响weak classifier的选择…     好不容易解释清楚samples的分布只和计算错误率有关,然后在准备一笔带过PCA时,又被抓住不放,使劲的问我78维->6维这个是怎么来的…其实就是求离散度矩阵的特征值,然后选前n个特征值总和占所有特征值总和大于预设阈值的n阿…    然后终于切入了我原计划的主题,如何找weak classifier…Perceptron方法的比较好懂,所以很快解释清楚了,但是其实具体实现时,在数据本身不可分时,搜索一个使错误率最小的超平面是很困难的。当讲到后面的shanzhai法,Mrs Liu又是连珠发问,十万个为什么又来了…最后还是yangyan上来解释清楚了~~    话说这次dm作业的数据真BT,来自KDD2004的physical particles,当时winner的正确率是73%,我们现在只跑到68%~~继续加油吧…    总结一下,咳咳~    这次上台讲project的感觉还是不错,越来越放的开了,一点也不紧张。主要还是胸有成竹,不怕质疑提问~~嘿嘿~~以后继续多锻炼演讲的能力!come on~    share一份李开复的slides: 21 Secrets to Becoming A Good Speaker    share一份我们组的slides: Physical Particles  classification     心平常,自非凡~~ PS:     周四听别的组的presentation,出来了2个NB的… … 继续阅读

发表在 学无止境 | 标签为 , , | 留下评论