2012 二月 一 二 三 四 五 六 日 « 一 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 分类目录
标签云
快速订阅
-
最近文章
近期评论
- 横坐标 在 换工位了 上的评论
- Stacy 在 心情不好 上的评论
- Elaine 在 4月体训记录 上的评论
- Ruby 在 心情不好 上的评论
- foelin 在 我经常使用的google服务 上的评论
- qq 在 ICCV小记 上的评论
- Buford Piela 在 我经常使用的google服务 上的评论
- Treadmill 在 back beijing 上的评论
- moncler piumino donna 在 照片 上的评论
- hh 在 ICCV小记 上的评论
朋友圈
Blogroll
友情链接
功能
分类目录归档:学无止境
基本矩阵之歌
上午在《Multiple View Geometry in Computer Vision》一书的主页上check errata,偶然发现一神曲《The fundamental matrix song》,竟然将computer vison里面外极几何和基本矩阵的内容融汇贯通于旋律之中…… orz…太赞了~ 老外真能折腾,这玩意儿也能谱曲填词,简直高深莫测啊… 直接看看视频吧: 标签:基本矩阵, 视频, 计算机视觉
突然
上午组会,持续到十点半,然后4个普博和我留下来与老板们讨论以后的方向。 被问及想做理论还是应用,答曰:偏理论一点吧。 遂被H老师带到办公室进一步探讨。 大致对白如下。 标签:实验室, 研究方向
[zz]和机器学习和计算机视觉相关的数学
新进实验室,急需恶补数学基础知识,goolge到此文,据说为某MIT大牛所感,转载于此,以便以后查阅。 感觉数学似乎总是不够的。这些日子为了解决research中的一些问题,又在图书馆捧起了数学的教科书。从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识。Learning和Vision都 是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说,往往是非常exciting的enjoyable的事情。不过,这 也代表着要充分了解这个领域并且取得有意义的进展是很艰苦的。 记得在两年前的一次blog里面,提到过和learning有关的数学。今天看来,我对于数学在这个领域的作用有了新的思考。 对于Learning的研究, 1、 Linear Algebra (线性代数) 和 Statistics (统计学) 是最重要和不可缺少的。这 代表了Machine Learning中最主流的两大类方法的基础。一种是以研究函数和变换为重点的代数方法,比如Dimension reduction,feature extraction,Kernel等,一种是以研究统计模型和样本分布为重点的统计方法,比如Graphical model, Information theoretical models等。它们侧重虽有不同,但是常常是共同使用的,对于代数方法,往往需要统计上的解释,对于统计模型,其具体计算则需要代数的帮助。 以代数和统计为出发点,继续往深处走,我们会发现需要更多的数学。 2、Calculus (微积分),只是数学分析体系的基础。其 基础性作用不言而喻。Learning研究的大部分问题是在连续的度量空间进行的,无论代数还是统计,在研究优化问题的时候,对一个映射的微分或者梯度的 分析总是不可避免。而在统计学中,Marginalization和积分更是密不可分——不过,以解析形式把积分导出来的情况则不多见。 3、Partial Differential Equation (偏微分方程),这主要用于描述动态过程,或者仿动态过程。这个学科在Vision中用得比Learning多,主要用于描述连续场的运动或者扩散过程。比如Level set, Optical flow都是这方面的典型例子。 4、Functional Analysis (泛函分析), 通 俗地,可以理解为微积分从有限维空间到无限维空间的拓展——当然了,它实际上远不止于此。在这个地方,函数以及其所作用的对象之间存在的对偶关系扮演了非 常重要的角色。Learning发展至今,也在向无限维延伸——从研究有限维向量的问题到以无限维的函数为研究对象。Kernel … 继续阅读
开心
晚上视觉课回来后 Gmail里收到了TOP100面试通过的邮件 幸福真的来的很突然 渴望的一切终于成为了事实 好开心,好兴奋 和ww和kevin一起喝了点小酒庆祝下 今年终于做成了一件渴望做成的事情 真的很开心~ 标签:top100
come on
周二通知我笔试通过了,跨过第一槛 今天去办公室找Professor Hu,很热心,也很乐意接收我,2个条件:1.原所放人;2.硕士转硕博…okay~第二槛也算通过了。 明天第三槛,面试!!下午2点40分,玉泉办公楼第二办公室! come on!man!! 标签:top100
top100考试归来
top100考试归来~ 2个半小时的综合测试… 132道选择题,每题1分,涵盖数学、物理、化学、生物、地理、计算机、逻辑七大块… 3道数学建模,每题6分,只要求写出数学模型,不要求求解.. 时间完全不够用,做完前面40多道数学选择题,大概就花了80分钟~~其实不是很难,纯粹高中的知识,排列组合、解析几何、三角函数,二次函数、复数等等..主要是很久没做这些题目了,都有点生疏。估计高考那段时间来做的话至少快1倍… 干掉数学,然后就开始紧张了~毕竟还有90多道选择和3道大题,时间只剩下1小时10分钟了…已经做好全选C的准备了~~ 还好物理、化学、生物的题目比较少,一共不到30道,20秒没想到答案直接就猜了。比如说生物吧,什么有丝分裂中姐妹染色体如何移动都考来了,还有什么核苷酸、进化论、隐性基因遗传之类的东西…ft~~~骤然非常怀念高中~~~唉,当年做这些题目还不是如果切西瓜一样顺利,现在的记忆都模糊了…物理考的什么没印象了,原子核?mabye~~化学才BT,肯定是考的大学的内容,好多都没听说过,连化学符号都没有见过,直接晕菜了~~不过也有些简单的高中题目,比如什么如何鉴定用自来水假冒的矿泉水,把乙醛、乙酸、乙醇按酸性排序等等~~ 标签:top100, 考试
DM presentation
周二的DM大作业presentation,第一个出场,便在讲台上面狂讲了50分钟,中途貌似还被偷拍了一张pp… Mrs Liu竟然连Adaboost都不知道,直接导致我解释了好半天怎么调weak classifier和samples的权重,以及samples的权重如何影响weak classifier的选择… 好不容易解释清楚samples的分布只和计算错误率有关,然后在准备一笔带过PCA时,又被抓住不放,使劲的问我78维->6维这个是怎么来的…其实就是求离散度矩阵的特征值,然后选前n个特征值总和占所有特征值总和大于预设阈值的n阿… 然后终于切入了我原计划的主题,如何找weak classifier…Perceptron方法的比较好懂,所以很快解释清楚了,但是其实具体实现时,在数据本身不可分时,搜索一个使错误率最小的超平面是很困难的。当讲到后面的shanzhai法,Mrs Liu又是连珠发问,十万个为什么又来了…最后还是yangyan上来解释清楚了~~ 话说这次dm作业的数据真BT,来自KDD2004的physical particles,当时winner的正确率是73%,我们现在只跑到68%~~继续加油吧… 总结一下,咳咳~ 这次上台讲project的感觉还是不错,越来越放的开了,一点也不紧张。主要还是胸有成竹,不怕质疑提问~~嘿嘿~~以后继续多锻炼演讲的能力!come on~ share一份李开复的slides: 21 Secrets to Becoming A Good Speaker share一份我们组的slides: Physical Particles classification 心平常,自非凡~~ PS: 周四听别的组的presentation,出来了2个NB的… … 继续阅读
My Projects
最近有些朋友通过留言、Email和我讨论一些项目,例如毕业设计里面的关于摄像机参数估计的内容、隐蔽通道分析等等。 本着opensource的精神,决定在blog上开辟一个版块,用于和大家分享我曾经写过的一些小程序以及做过的一些小项目,同时也是对自己的一个很好的总结。 这两天忙着data mining的project,有点忙,所以估计五一期间抽空来做这件事情,敬请期待。 标签:project
Failed
gsoc意外的挂掉了。 费了很多心血,熬了几个通宵,2周的时间里面读了很多项目相关的open source的code,写好了2个demo,完成了code chanllege… 结果还是挂了,并且是以这样一种奇怪而郁闷方式: athme组织在GSOC主页上挂出了3个项目, Audacious、Conspire以及NASPRO。26号考完分布式后,开始申请Tagging Library,结果写好了code chanllege后被告知“we have had 2 applications for this proposal and encourage you to look at other ideas as wel”,简单的说就是you are late! 正在郁闷的时候,Aman(其中一个mentor)站出来,告诉我Conspre的OTR插件是他很想做的一个项目,如果有兴趣的话可以申请它。于是我便在还有3天deadline的时候华丽的转身,开始做OTR plugin的code chanllege~~回想那几日废寝忘食的惨状,简直不堪回首,可以说是被狠狠的摧残了一把。其间一周之内闭关不出,甚至英语B的半期考试也翘了,但想想未来的4500刀,硬是挺了过来,在deadline之前提交了proposal,然后在Amen限定的时间内做好了demo。Amen的要求只是用libotr做好信道加密和解密,我不但完成了这两点,顺带连认证功能也一并实现了。然后便是漫长的10天左右等待消息的日子。在IRC在询问Amen是否有戏,但也没有得到明确的答复,不过自我感觉尚好,毕竟在这个组织上顺利提交了2个proposal和code chanllege。没有功劳也有苦劳阿,况且requirement都实现了。 4月20日(the judgment day)终于到来了,熬到凌晨3点,小心翼翼而满怀希望的用略带颤抖的手指点开了Accpeted页面,却没有发现我的名字。失望,已经不能形容我的心情。Athme组织一共选了4个子项目,其中Audacious的三个子项目全部上榜,NASPRO的两个子项目上榜了一个,重点项目Conspire包含6个子项目,居然一个也没有上榜!!! god damage! 顿时有一种被忽悠的感觉。完全没有想到是这样一个结局,竟然整个项目被咔嚓掉,Amen作为负责人居然也一个项目也不带!一番心血顿时付之东流~~ 其实不被Accpeted也可以接受,技不如人我也就认了。但是总不能一个人都不选吧?似乎这个项目根本就没有指标,根本就不存在过,但是我却为之努力了2周,牺牲了大量的时间…唯一的解释就是google否决了这个项目,但为什么要等到20号呢?为什么还要将这种项目挂出来呢?? 刚知道结果的几天一直在IRC上等Amen,希望他能给个说法,告诉我原因。其他认识的几个朋友申请没有成功,别的组织都给发了封邮件,感谢他们的参与,并告诉他们没有被选择的原因,然而我却没有收到任何邮件,甚至在IRC上留言询问,也是如石沉大海,渺无音讯… … 继续阅读
windows 环境下使用GSL
GNU Scientific Library(GSL)是一个为C和C++程序员提供的科学数值运算库。该科学计算库异常强大,提供了如下方面的支持: Complex Numbers Roots of Polynomials Special Functions Vectors and Matrices Permutations Sorting BLAS Support Linear Algebra Eigensystems Fast Fourier Transforms Quadrature Random Numbers Quasi-Random Sequences Random Distributions Statistics Histograms N-Tuples Monte Carlo Integration Simulated Annealing Differential Equations … 继续阅读




