分类目录
标签云
快速订阅
-
最近文章
近期评论
- 商业模式 在 初识小五 上的评论
- 商业模式 在 更新缓慢的原因 上的评论
- 商业模式 在 [zz]Hartley教授回信–论摄影测量与计算机视觉 上的评论
- 苹果手机价格 在 第一次组会报告 上的评论
- yaya 在 ASEG2010招新小结 上的评论
- foelin 在 ASEG2010招新小结 上的评论
- yaya 在 ASEG2010招新小结 上的评论
- 非主流 在 2010.8 体训记录 上的评论
- LD 在 2010.9 体训记录(持续更新ing) 上的评论
- foelin 在 夜遁京城 上的评论
朋友圈
Blogroll
友情链接
功能
分类目录归档:学无止境
<MVGCV> chapter 21.9 小结
看<<MVGCV>> 一书时,觉得21.9 Which points are in front of which阐述的不是很明晰,并且最后没有给出一个完整的算法。反复看了2、3遍,和SKF讨论良久,才总结出了作者提出的方法应该如何使用,现总结如下: 此节大意是假设由若干幅图像得到了一个射影重建{Pi, Xj},问假如现在人工的新增一个摄像机P’,此时空间中某些点在P’中对应同一个图像点(即这些点相互遮挡),问如何判定哪个点更接近P’? 现在考虑2个点的情况,即假设现在空间点X1,X2在P’中的像同为x,判定X1和X2哪个更接近P’。 情况1:若当前射影重建下存在一个平面A,能把所有的摄像机Pi、P’与空间点X1、X2分隔在A两边时,此时存在2种方向(orientation)相反的strong realization,故这种情况下,若没有先验知识时,则不能确定X1、X2谁在谁之前; 情况2:若当前射影重建下不存在一个平面A,能把所有的摄像机Pi、P’与空间点X1、X2分隔A两边时,此时只存在一种strong realization,故这种情况下,不需要先验知识,即可确定X1、X2谁在谁之前。 基于上述结论,作者提出了一种在情况2时,在射影重建下判定在欧式重建下X1、X2谁更接近P’的方法。 首先是证明了引入了一个函数Y=1/(depth),即深度的倒数。并且证明了射影变换是Y的单调函数,即当H的行列式detH>0时,H是Y的单增函数;当detH<0时,H是Y的单减函数。现假设当前射影重建到欧式重建的射影变换为H,根据在当前射影重建下判定的Y的大小,以及单调性,可以得到Y在欧式重建下的大小。由于Y是深度的倒数,故可以得到X1和X2在欧式重建下深度的大小关系。 再结合前面的知识,可以得到一般情况下,在射影重建下判定在欧式重建下X1、X2谁更接近P’的方法: 1.首先根据P527页的Algorithm21.1计算v有几个解,即有几个strong realization。 2.若v只有1个解,说明为情况2。由于只有1个解,故此时strong realization和欧式重建必然是同向的。因此假设从射影重建到strong realization时的射影变换为H’,则此H’确定了射影重建到欧式重建的射影变换H的行列式的正负性。 当detH’=1时,有解,则H’是Y的单增函数;当detH’=-1时有解,则H’为Y的单减函数。然后根据Y的大小关系,确定depth的大小关系,即确定在P’中具有相同图像点的空间点X1、X2谁更接近P’。 3.若v有2个解,说明为情况1,则此时需要已知一对点X0、X0′谁更接近P’,然后根据此先验知识,确定2个解中哪一个是和欧式重建方向相同的解。此时,再用情况2的方法来判定其余的在P’中具有相同图像点的空间点X1、X2谁更接近P’。 OK,大致如此。欢迎看过此节的同学讨论。 标签:MVGCV, … 继续阅读
学习近况
最近科研进展缓慢,在<<MVGCV>>一书的Part 4 N-View Geometry上已经纠缠二周了~ 主要的时间花费在了反复考究细节上,而不是理解大体思路。很多细节性的东西,书上说的比较简略,需要下载相关引用文献才能理解的比较明白。 很久没写专业相关的文章了,就随便扯两句最近看的内容。 对于射影重建而言,基于tensor的方法,推广到4焦张量就是极限了,如果是N View,就直接用bundle adjustment了,不过此法需要一个较好的初始估计作为迭代初值,可用的方法就有基于factorization的,基于已知空间平面信息的等等~ 所谓摄影机自标定,就是在不使用场景信息,仅仅根据图像匹配点对来确定摄像机内参数的过程。一旦内参确定,则可由射影重建恢复到度量重建(即只和真实场景相差一个相似变换)。 为什么确定了内参数,就可以达到度量重建呢? 首先,这是因为绝对二次曲线在相似变换下具有不变性,换句话说,它是相似变换下的固定曲线,其代数形式在相似变换下是固定的。由此,一旦确定了射影空间中的绝对二次曲线,那么通过一个射影变换,将其变换到其在相似空间中的固有位置,那么此时得到的重建必然是度量重建。其次,绝对二次曲线的像曲线仅与内参数有关,确定了内参数就等于确定了绝对二次曲线的像曲线,将像曲线反投影到射影空间中的无穷远平面,则可以得到当前射影空间中的绝对二次曲线。 由以上2点可见,一旦确定了内参数,度量重建即可完成。所以估计内参数具有重要的意义。 那么如何估计内参数呢?也就是说如何自标定呢? 一般而言,有基于对偶绝对二次曲面的方法,基于Kruppa方程的方法,分步法(首先确定欧氏空间中无穷远平面在射影空间中的代数形式,以此得到仿射重建;然后再确定绝对二次曲线,以此得到度量重建和内参数)。这三种方法都必须利用内参数已知的一些固有约束,例如skew为0,已知主点,或者内参数在N view中保持不变等等。 其实,上面的很多内容,在当初做毕业设计的时候也有所涉及,只不过当初只是抓了其中一条脉络,做了一种方法的实现,而没有从整体上把握最本质的原理,并对比各种方案的优劣,因此理解的也自然比较浅薄。 还有大约2个月放假,目前计划12月中旬结束<<MVGCV>>的第一遍阅读,然后剩余时间重新读一遍本书。 第一遍时,为了把握主干,不拘泥于旁支细节,所以遗留了一些小问题有待解决,课后思考题也都没有深究,第二遍则要注重理解每一个细节,并且要前后瞻顾,把相关的内容对比参考,达到融汇贯通的效果。 研二的上学期,大致学习计划就这样了。可以说,这半年就只干了一件事,就是读<<MVGCV>>。不过如果能读透彻,那么Geometry方面的基础应该说是打结实了,以后开展后续研究就容易一些了。 李开复曾经很多次在大会上告诉员工:“我们看到今天中国有很多成功的商业公司,我觉得可以用一个字来描述它们的成功,那就是快。但另外一方面呢,我希望大家也要看到那些真正基业长青的公司,其成功秘诀则在于它恪守价值观。一个企业绝不能因为过于强调快速发展而丧失使自身基业常青的理念。” 或许这段话略作修改,应用到科研上,也同样适用。古人云:“欲速则不达,欲小利则大事不成! ”也是同一个道理。 … 继续阅读
随笔
来科苑以后,已经有六七次接待川大软院的学弟学妹们来北京,或是保研、或是找工作、或是参加各类竞赛。 饭席间互相聊天,总感到他们都对北京、对未来满是憧憬与希望,有很强的上进心,努力的再争取各种机会,渴望毕业后能有更好的发展空间。 大学初期的失落与迷茫,总会让一些人永远的堕落,虚度时光而一无所获,也会有那么一些人在大二、大三逐渐的找回自我,树立目标,积极向上进取。 我知道,每次来北京的学弟学妹们,必然都是后者。并且从他们身上,我也能看到自己07年时的影子。 回想当初,也是一头的迷茫与雾水,不知路在何方,只是知道自己不甘心无所作为,于是便积极的参加竞赛、争取实习、保研的机会。那个时候没有很多的信息渠道,也没有师兄师姐的帮助提携,一切只能靠自己憋着一股劲争取。于是“细节决定成败”成了我奉行的准则。一改平日懒散、无所谓的作风,尽可能的在网上收集一些蛛丝马迹的信息为己用,准备竞赛、笔试、面试各种环节也力求尽善尽美。最后,所做的各种努力也没有白费,无论是竞赛、实习、保研都取得了满意的结果,07年,便是我的分水岭。 出于这样的原因,现在我很乐意和来京的学弟学妹们一起交流,畅谈现状与未来,我想,或多或少,会开阔他们一些眼界,对他们总会有一些的启发,并且我也可以强烈的感受到他们的青春与激情。 这一次,是07级别的3个学弟和1个学妹来京参加IBM大型主机决赛。晚上连同谭Fei一起,我们6人在怡宾餐厅聚了聚,谈了谈读研、读博以及工作那些事儿。很巧的是,两年前07级的辅导员曾邀请我给大一新生做一个关于大学学习与生活的讲座(详见此文:讲座有感),在座的一个学弟两年前曾经去听了,还记得我讲的关于实习和竞赛的那些事儿,然后今晚还把我认出来了~~~~ 时光啊~转眼就是两年,当年的小菜鸟新生,如今也来北京参加比赛了,呵呵~ 我也得抓紧了! 标签:交流, 感想, 聚会
十一月四日,风雨大作
今天,风和日丽,气温回暖,并没有疑似风雨大作的迹象。 只是在实验室看文献时,突然想起初中学过的一首诗。 《十一月四日,风雨大作》 ——– 陆游 僵卧孤村不自哀,尚思为国戍轮台。 夜阑卧听风吹雨,铁马冰河入梦来。 突然感觉,汉字博大精深,2维平面结构不但能达意,还能传形,并且寥寥几字组合在一起意境则更显深远。所以中文实在适合作诗赋词,搞搞文学创作。而英文就不同了,表达比较直白。例如形容某个物体或者状态,就只有那么几个词可选,基本上谈不上什么意境,并且没有什么成语、歇后语之类的存在,感觉形式也比较单一。不过英文的优点也在于此,在表达思想的时候可以表述的很直接、很通俗,几个定语从句that、that的加在一起就能结构清晰的表述出含义,让人易于理解。因此英文在表达学术方面,可能就比较适合了。 最近看文献看得比较多,总觉得英文文献易懂,可以让你很容易的理解一个概念,而中文文献似乎比较吝啬字数,并且似乎作者是觉得写的太直白浅显反而没有了水平,所以大多是很精练的陈述,让人看着脑子里就打结…由于所谓的“精炼”,自然可能就会产生一定的歧义,所以那个结,很可能就成了死结…… 不过这个想法或许有些偏颇。毕竟现在看CV方面的文献,几乎全是英文的,思维已经毕竟顺应英文的表述方式了,而剩下寥寥的中文文献,又少有原创,内容几乎大半是翻译或转述的英文文献,难免有纰漏误译,所以读着不顺畅也难免了 … 标签:感想, 论文, 诗
基本矩阵之歌
上午在《Multiple View Geometry in Computer Vision》一书的主页上check errata,偶然发现一神曲《The fundamental matrix song》,竟然将computer vison里面外极几何和基本矩阵的内容融汇贯通于旋律之中…… orz…太赞了~ 老外真能折腾,这玩意儿也能谱曲填词,简直高深莫测啊… 直接看看视频吧: 标签:基本矩阵, 视频, 计算机视觉
突然
上午组会,持续到十点半,然后4个普博和我留下来与老板们讨论以后的方向。 被问及想做理论还是应用,答曰:偏理论一点吧。 遂被H老师带到办公室进一步探讨。 大致对白如下。 标签:实验室, 研究方向
[zz]和机器学习和计算机视觉相关的数学
新进实验室,急需恶补数学基础知识,goolge到此文,据说为某MIT大牛所感,转载于此,以便以后查阅。 感觉数学似乎总是不够的。这些日子为了解决research中的一些问题,又在图书馆捧起了数学的教科书。从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识。Learning和Vision都 是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说,往往是非常exciting的enjoyable的事情。不过,这 也代表着要充分了解这个领域并且取得有意义的进展是很艰苦的。 记得在两年前的一次blog里面,提到过和learning有关的数学。今天看来,我对于数学在这个领域的作用有了新的思考。 对于Learning的研究, 1、 Linear Algebra (线性代数) 和 Statistics (统计学) 是最重要和不可缺少的。这 代表了Machine Learning中最主流的两大类方法的基础。一种是以研究函数和变换为重点的代数方法,比如Dimension reduction,feature extraction,Kernel等,一种是以研究统计模型和样本分布为重点的统计方法,比如Graphical model, Information theoretical models等。它们侧重虽有不同,但是常常是共同使用的,对于代数方法,往往需要统计上的解释,对于统计模型,其具体计算则需要代数的帮助。 以代数和统计为出发点,继续往深处走,我们会发现需要更多的数学。 2、Calculus (微积分),只是数学分析体系的基础。其 基础性作用不言而喻。Learning研究的大部分问题是在连续的度量空间进行的,无论代数还是统计,在研究优化问题的时候,对一个映射的微分或者梯度的 分析总是不可避免。而在统计学中,Marginalization和积分更是密不可分——不过,以解析形式把积分导出来的情况则不多见。 3、Partial Differential Equation (偏微分方程),这主要用于描述动态过程,或者仿动态过程。这个学科在Vision中用得比Learning多,主要用于描述连续场的运动或者扩散过程。比如Level set, Optical flow都是这方面的典型例子。 4、Functional Analysis (泛函分析), 通 俗地,可以理解为微积分从有限维空间到无限维空间的拓展——当然了,它实际上远不止于此。在这个地方,函数以及其所作用的对象之间存在的对偶关系扮演了非 常重要的角色。Learning发展至今,也在向无限维延伸——从研究有限维向量的问题到以无限维的函数为研究对象。Kernel … 继续阅读
开心
晚上视觉课回来后 Gmail里收到了TOP100面试通过的邮件 幸福真的来的很突然 渴望的一切终于成为了事实 好开心,好兴奋 和ww和kevin一起喝了点小酒庆祝下 今年终于做成了一件渴望做成的事情 真的很开心~ 标签:top100
come on
周二通知我笔试通过了,跨过第一槛 今天去办公室找Professor Hu,很热心,也很乐意接收我,2个条件:1.原所放人;2.硕士转硕博…okay~第二槛也算通过了。 明天第三槛,面试!!下午2点40分,玉泉办公楼第二办公室! come on!man!! 标签:top100
top100考试归来
top100考试归来~ 2个半小时的综合测试… 132道选择题,每题1分,涵盖数学、物理、化学、生物、地理、计算机、逻辑七大块… 3道数学建模,每题6分,只要求写出数学模型,不要求求解.. 时间完全不够用,做完前面40多道数学选择题,大概就花了80分钟~~其实不是很难,纯粹高中的知识,排列组合、解析几何、三角函数,二次函数、复数等等..主要是很久没做这些题目了,都有点生疏。估计高考那段时间来做的话至少快1倍… 干掉数学,然后就开始紧张了~毕竟还有90多道选择和3道大题,时间只剩下1小时10分钟了…已经做好全选C的准备了~~ 还好物理、化学、生物的题目比较少,一共不到30道,20秒没想到答案直接就猜了。比如说生物吧,什么有丝分裂中姐妹染色体如何移动都考来了,还有什么核苷酸、进化论、隐性基因遗传之类的东西…ft~~~骤然非常怀念高中~~~唉,当年做这些题目还不是如果切西瓜一样顺利,现在的记忆都模糊了…物理考的什么没印象了,原子核?mabye~~化学才BT,肯定是考的大学的内容,好多都没听说过,连化学符号都没有见过,直接晕菜了~~不过也有些简单的高中题目,比如什么如何鉴定用自来水假冒的矿泉水,把乙醛、乙酸、乙醇按酸性排序等等~~ 标签:top100, 考试




