分类目录归档:学无止境

天行健,君子以自强不息

上课

    这学期开始修博士学分,选了老板在所里开的《CV中的数学方法》一课。     上了有3周,都是在很抽象的层面讨论空间和变换。     前面关于线性空间与线性变换的内容,仗着本科线性代数的基础还能理解的比较清楚,引入拓扑的概念后,就觉得很抽象了,全是各种定义和证明绕来绕去,所以后面关于拓扑空间与拓扑变换,距离空间,拓扑线性空间,赋范线性空间,Hilbert空间的讨论都比较迷迷糊糊,听的很郁闷。。     只能下来抽时间找书看了,不过这些内容大多属于短期只能依葫芦画瓢、难以深入理解,必须长期反复推敲、死抠来龙去脉才能顿悟其精妙的东西,也不是那么容易看到成效的~     感慨一下,老板果然是数学科班出身,功力就是不一样啊!     恩,最后预报一下周末的活动:     周五实验室组织香山玩真人CS,团队建设;周六Trekking版狗牙山探路;周日休整一天,考虑下五一的安排~     又一周结束了!吼吼吼~ 标签:思考, 数学

发表在 学无止境 | 标签为 , | 留下评论

转博了

    花了一周多时间准备的转博答辩昨天终于结束了。     虽然只是以组会的形式进行,考核评审组的老师都是来自组里,但由于是第一次在组里做报告,所以还是比较认真准备了一下。考虑到转博答辩以文献综述为主,所以结合看过的几篇综述性的文章,比较宏观的介绍了一下30年立体视觉的发展情况,主要包括了以下几个方面:为解决匹配二义性而提出的常用约束(camera-based and scene-based), 根据利用约束信息的不同对立体匹配算法进行分类(Local method and Global method)以及解决遮挡的一些常用方法。     自我感觉思路还算比较清晰,也比较符合综述的要求,结果还是被批了。     一曰:讲的内容不具体,太泛泛而谈,不能体现出对领域已有了深入理解。并且大多数内容来自于某篇PAMI上的文章,缺少自己的理解……     二曰:不遵守实验室规定,多次迟到,午睡时间过长。。。     囧了…     原以为考核的以文献综述的形式,所以才这样准备,早知道就讲几种具体的匹配方案,提一下改进思路,说不定还会认为你读的比较认真。。。     至于迟到,真是倒霉。上学期就两次查迟到,我就正好都迟到了,然后就被推论经常迟到。。。     ok,无论如何,转博这事儿算是告一段落了。     接下来的日子,抓紧时间读paper,发paper才是王道! 标签:答辩, 组会, 转博

发表在 学无止境 | 标签为 , , | 6 条评论

随便写点

    恩,随便记录一下最近:        1.上午找老板汇报近2周工作。这2周主要是在抽象的向量空间和线性映射的角度下回顾了线性代数的内容,然后看了利用微分几何方面的知识来实现surface stereo的一篇paper和若干引用文献。     线代方面唯一想说的就是国内的教材太垃圾,大多着力了讲解具体的计算方法,而非从本质上讲解向量空间与线性映射的性质以及推导,所以学了后除了会笔算矩阵乘法、行列式,来龙去脉前因后果一概不知,几乎等于白学,对于研究没有一点用处。     至于paper,其中关于微分几何的内容几乎没看懂,下来慢慢补基础知识;关于stereo correspondence·的内容也比较棘手,主要是要参考很多引用文献。在不熟悉某个领域的时候,最好的办法就是找一篇review的文章,然而看这种review又是最痛苦的。介绍了N多方法,相互分类比较,其中每一种又必须去查相关引用文献,然后引用文献的又引用别的,别的再引用别的,子子孙孙无穷匮也…     深度or广度优先?that’s a question!     2.上周趁着卓越搞活动,一口气在上面订了八本书,结果今天才送到…faint!竟然是从广州发货过来的,真慢!还好质量没问题,包装也比较到位。     《一九八四》、《动物农场》、《我与父辈》属于小说性质,打发放假在火车上的无聊时光。其中前2本是奥威尔的2本反乌托邦的传世之作,慕名已久,终于入手。后一本是卓越的赠品,作者阎连科也比较有来头,看看也无妨。     《数学:确定性的丧失》和《逻辑的引擎》这两本是类似科普性的读物,在豆瓣上评分颇高。前者讲述数学真理的起源、繁荣、科学的数学化、数学向何处去等内容,后者从逻辑角度讲述计算机的发展,以及发展这些内容的著名人物。数学+计算机都是我现在专业最相关的学科,从科普角度直观的了解这2门学科我认为很有必要。     《改变心理学的40项研究:探索心理学研究的历史》是一本介绍影响心理学发展的重要研究成果的书。最近对心理学比较感兴趣,源于前段时间看了《影响力》一书,以及pongba的强烈推荐。想进一步了解心理学更多的内容,此书就成了不二选择。     《怀斯曼生存手册》很非常NB的一本关于户外自救、自我保护的生存手册。看看介绍吧:“有这么一本书,仅凭一把刀和书中的知识,就可以在任何地方、任何天气、任何条件下生存下去。这就是《怀斯曼生存手册》”。对于户外活动频繁的我来说,了解一些基本的户外生存技巧是非常必要的,因此也没有理由拒绝这样一本书。      《给研究生的学术建议》则纯粹是我为了凑够卓越赠书活动消费下限的产物。不过既然要读博了,看看一些经验以及建议还是不错。     3.最近每天晚上狂打PES2010,和实验室2个师兄对战到深夜。从14年前的PS1上的《J联赛》,到如今蔓延值PS3的《实况2010》;从小学四年级的路边游戏厅打到研究生二年级的实验室,我也算是骨灰级玩家了。实况一点一点的改进确实难能可贵,如今画面效果几乎不可挑剔,物理引擎也越来越贴近事实,AI系统虽然还有不少瑕疵,但也比FIFA高出一大截~~~再加上我是新配置的4核PC,简直流畅的一塌糊涂……     恩,得控制一下游戏频率了。下周就放假了,还是抓紧时间做点事情~     最后,今天被告知春节回来做一次组会报告,惨… 标签:学习, 游戏, 读书

发表在 学无止境, 生活点滴 | 标签为 , , | 6 条评论

二三言

    今天终于把《MVGCV》的7个附录也看完了…     从九月底到现在,历时三个多月,600多页+若干引用文献…     此书是毋庸置疑的经典之作,是对04年以前15年左右CV领域Geometry方向大部分工作的总结,深入浅出,非常适合入门巩固基础。强烈建议搞这块的同学仔细研读,反复体会,必然会让你对该领域的认识提高若干层次。     目前自己是大体上对多视几何已经有所把握了,但是书中很有些细节还没有搞明白,原计划本是放假之前review一遍,并试着做一下课后思考题,继续阅读此书引用的文献。但是由于老板已经布置的3篇论文的阅读任务,估计这个review的计划得放一放了~~~     在实验室的头半年,发现是知道的越多,然后发现不知道的更是越来越多。转专业后要补的基础课程暂且不提,光是数学上很多东西都要重头学。    sign,本科的时候果然是见识太肤浅了,认为对搞计算机软件的人来说数学就是屠龙之技,所以很不重视,敷衍了事,没好好学一把。并且研一都没有选一门数学课,现在转专业过来了,不搞软件开发搞点理论研究了,顿时感觉书到用时方恨少!看点paper吧,这个概念不知道,那个定义也不清楚,知识体系可以说是千疮百孔,说白了就是数学基础不行。    话说周二的组会,博三和博二的师兄师姐们分别作中期答辩和开题答辩,发现有好几人都是本科或是硕士是数学系出身的,甚至还有是大学的数学老师过来读博的,牛X啊…    遗憾的是,答辩时,已经博三的LT师兄直接被H老师告知90%拿不到博士学位,即使延期也不行,顶多发个硕士学位…    sign,太残酷了,5年的硕博很可能就这么废了,并且拿不到学位,可能这半年找工作的时间也白费了…    ok,继续努力吧…    放假之前的大体工作计划如下:    1.重温线性代数,看矩阵分析。    2.阅读老板布置的3篇论文(2篇关于立体匹配,1篇关于分层自标定的全局最优算法)以及相关引用文献。    3.看vgg的多视几何库,研究下MVGCV中算法的matlab实现。    4.抽时间看一下数字图像处理的matlab实现。    come on,man! 标签:MVGCV, 计划

发表在 学无止境 | 标签为 , | 留下评论

小结2009

     2009匆匆已过,略作小结,算是回忆下自己这一年的经历。     一、学习篇          09年在学业上虽无大成,但相比过去而言,我投入了更多的精力。上半年例行公事的春季、秋季的课程学习就不多费笔墨,虽然无聊,但毕竟有可能是人生最后坐在教室里的时候了。二月份末开始准备10月的GRE,其间听了bebeyond的一次大牛云集的讲座,再加上对当前专业极度失望,以及对做工程前景的担忧,出国读phd的渴望空前强烈~~奋战一月左右,红宝书背到List 31。三月份末申请GSOC,GRE单词暂时中断。GSOC申请的2周中,连续多日通宵coding,最终赶在deadline之前搞定了2个demo。满怀希望的等到google放榜的那天,结果却是牺牲的不明不白。当我还来不及狠狠郁闷一把,然后重拾GRE的时,TOP-100转专业考试的通知又贴了出来。经过几天慎重的权衡考虑,决定报名,说服自己的理由也很简单:如果能早一点换到自己感兴趣的专业,何尝不可?于是其后的一个半月,精力的重心大半部分和top100相关。笔试、面试的突围并不困难,困难是在于单枪匹马说服原来研究所的导师放人,然后让新研究所的导师同意接收。其间的种种挫折不在详述,单就背水一战的心理压力就让我一段时间内很郁闷。还好这一次的努力没有白费,费尽周折后终于转到一个感兴趣的方向:计算机视觉。不过GRE之路也就此终结,因为在和新导师的交涉中,我已经同意了硕博连读。2个月的暑假算是最后一次彻底的放松,九月份到新实验室报道后,很快便融入了新的环境。余下的3个多月便奉献给了Hartley的MVGCV一书,直至12月底才看完22章正文。虽不敢说融会贯通,但对于CV里Geometry这一块的认识还是有了长足提高。     09年也读了些业余的书。《明朝那些事儿》让我燃起了对历史的浓浓兴趣,随后又抽时间读了《万历十五年》和《汉朝那些事儿》。读史明志,此言不虚。历史记录下来的人物大多都是一个时代的杰出代表,无论正邪。了解他们生平行事对己颇有启发意义。并且历史作为既定发生的事实,对于后人也非常具有借鉴意义。成功励志的书籍方面,主要读了《世界因你不同:李开复自传》、《李彦宏的百度世界》、《成长-微软小子的教育》、《微软的梦工厂》几本,主要是了解一下大牛们的成长之路,并鼓励自己继续努力。武侠仍然是我打发无聊时光的选择之一。在若干个夜深人静的夜晚独自躺在床上,在ACDN的呼噜声中,用手机重温了金庸的6、7部,然后读了不下10本古龙。现在虽然没有初中看武侠那种疯狂劲头,不过一旦打开一本,也是不看完不罢休的。目前金庸的每本至少都读了2遍以上、古龙、卧龙生的小说各读了十之五六。再我看来,这三位各有偏攻,古龙细腻而善于心理描写、金庸大气善于场面渲染、卧龙生老练而善于悬念铺设,综合而论,古龙>金庸>卧龙生。至于其他类别的,还读了《囚徒的困境》、《影响力》、《少有人走的路》、《国家地理之选美中国特辑》等几本,都非常不错。特别是《影响力》一书,是我读的第一本关于心理学的著作。此书通过很多案例的分析,揭示了生活中存在的6种影响力武器—-互惠、承诺与一致、社会认同、喜好、权威以及短缺。很意思,也值得推荐。     二、生活篇     09年的生活波澜不惊。     各种体育运动锐减,20岁之前热衷的篮球、足球几乎淡出生活。这应该是读初中以来,第一次一整年没有打一场正式的篮球赛并且没有踢一场正式的足球赛。关于这方面的记忆,最多的还是高中。年级篮球赛冠军,年级足球赛冠军,乐山市高中足球联赛冠军,那些一起拼搏、战斗的兄弟们,很多都不知现在何方…至于一直以来比较爱好的台球、游泳还在间或的进行,不过一年下来也不超过10次。信誓旦旦要坚持的健身,也是虎头蛇尾。这一年,唯一的亮点就是真正意义上踏入了户外的大门。无论是出行次数和装备上都投入了相当的精力和财力。简单罗列一下09年大致出行情况:     户外性质         1月11日,金山岭-司马台长城穿越         5月17日,天仙瀑-豪宅-京都第一瀑穿越         5月28、29日,啤酒溪-小海陀-大海陀村扎营2日         6月20日,公涧铺-百花顶-百花草甸穿越         9月19日,后河穿越         10月4日,京西古道徒步         10月18日,香山邮局-老望京-挂甲塔-水库-八大处穿越       旅游性质         2月7日,太阳岛烧烤         2月10、11日,望鱼古镇、碧峰峡2日         3月21日,玉渊潭公园赏花         … 继续阅读

发表在 学无止境, 生活点滴, 记忆留痕 | 标签为 | 4 条评论

方向

    上周五和SKF去老板办公室谈话,考察了一下我们对<MVGCV>的理解情况。由于书看得还算仔细,所以基本上也能回答提问,老板还算比较满意。     最后给了我们3篇近年来的论文,让下去后仔细研读。2篇关于立体匹配,1篇关于分层重建中的全局最优化算法。要求是以后每2周主动去汇报一下情况,讨论读paper过程中遇到的问题。     恩,看来老板认为我们对立体视觉已经有了一定程度的理解和认识了,下一步就是确定研究兴趣,选一个切入点深入搞下去了…     不过自己感觉数学功力还是不够啊,准备看一下最优化算法和微分几何…… 标签:科研

发表在 学无止境 | 标签为 | 4 条评论

<MVGCV> chapter 21.9 小结

    看<<MVGCV>> 一书时,觉得21.9 Which points are in front of which阐述的不是很明晰,并且最后没有给出一个完整的算法。反复看了2、3遍,和SKF讨论良久,才总结出了作者提出的方法应该如何使用,现总结如下:     此节大意是假设由若干幅图像得到了一个射影重建{Pi, Xj},问假如现在人工的新增一个摄像机P’,此时空间中某些点在P’中对应同一个图像点(即这些点相互遮挡),问如何判定哪个点更接近P’?     现在考虑2个点的情况,即假设现在空间点X1,X2在P’中的像同为x,判定X1和X2哪个更接近P’。     情况1:若当前射影重建下存在一个平面A,能把所有的摄像机Pi、P’与空间点X1、X2分隔在A两边时,此时存在2种方向(orientation)相反的strong realization,故这种情况下,若没有先验知识时,则不能确定X1、X2谁在谁之前;     情况2:若当前射影重建下不存在一个平面A,能把所有的摄像机Pi、P’与空间点X1、X2分隔A两边时,此时只存在一种strong realization,故这种情况下,不需要先验知识,即可确定X1、X2谁在谁之前。     基于上述结论,作者提出了一种在情况2时,在射影重建下判定在欧式重建下X1、X2谁更接近P’的方法。     首先是证明了引入了一个函数Y=1/(depth),即深度的倒数。并且证明了射影变换是Y的单调函数,即当H的行列式detH>0时,H是Y的单增函数;当detH<0时,H是Y的单减函数。现假设当前射影重建到欧式重建的射影变换为H,根据在当前射影重建下判定的Y的大小,以及单调性,可以得到Y在欧式重建下的大小。由于Y是深度的倒数,故可以得到X1和X2在欧式重建下深度的大小关系。     再结合前面的知识,可以得到一般情况下,在射影重建下判定在欧式重建下X1、X2谁更接近P’的方法:     1.首先根据P527页的Algorithm21.1计算v有几个解,即有几个strong realization。     2.若v只有1个解,说明为情况2。由于只有1个解,故此时strong realization和欧式重建必然是同向的。因此假设从射影重建到strong realization时的射影变换为H’,则此H’确定了射影重建到欧式重建的射影变换H的行列式的正负性。 当detH’=1时,有解,则H’是Y的单增函数;当detH’=-1时有解,则H’为Y的单减函数。然后根据Y的大小关系,确定depth的大小关系,即确定在P’中具有相同图像点的空间点X1、X2谁更接近P’。     3.若v有2个解,说明为情况1,则此时需要已知一对点X0、X0′谁更接近P’,然后根据此先验知识,确定2个解中哪一个是和欧式重建方向相同的解。此时,再用情况2的方法来判定其余的在P’中具有相同图像点的空间点X1、X2谁更接近P’。     OK,大致如此。欢迎看过此节的同学讨论。 标签:MVGCV, … 继续阅读

发表在 学无止境 | 标签为 , , , | 一条评论

学习近况

    最近科研进展缓慢,在<<MVGCV>>一书的Part 4 N-View Geometry上已经纠缠二周了~     主要的时间花费在了反复考究细节上,而不是理解大体思路。很多细节性的东西,书上说的比较简略,需要下载相关引用文献才能理解的比较明白。     很久没写专业相关的文章了,就随便扯两句最近看的内容。     对于射影重建而言,基于tensor的方法,推广到4焦张量就是极限了,如果是N View,就直接用bundle adjustment了,不过此法需要一个较好的初始估计作为迭代初值,可用的方法就有基于factorization的,基于已知空间平面信息的等等~     所谓摄影机自标定,就是在不使用场景信息,仅仅根据图像匹配点对来确定摄像机内参数的过程。一旦内参确定,则可由射影重建恢复到度量重建(即只和真实场景相差一个相似变换)。     为什么确定了内参数,就可以达到度量重建呢?     首先,这是因为绝对二次曲线在相似变换下具有不变性,换句话说,它是相似变换下的固定曲线,其代数形式在相似变换下是固定的。由此,一旦确定了射影空间中的绝对二次曲线,那么通过一个射影变换,将其变换到其在相似空间中的固有位置,那么此时得到的重建必然是度量重建。其次,绝对二次曲线的像曲线仅与内参数有关,确定了内参数就等于确定了绝对二次曲线的像曲线,将像曲线反投影到射影空间中的无穷远平面,则可以得到当前射影空间中的绝对二次曲线。     由以上2点可见,一旦确定了内参数,度量重建即可完成。所以估计内参数具有重要的意义。     那么如何估计内参数呢?也就是说如何自标定呢?     一般而言,有基于对偶绝对二次曲面的方法,基于Kruppa方程的方法,分步法(首先确定欧氏空间中无穷远平面在射影空间中的代数形式,以此得到仿射重建;然后再确定绝对二次曲线,以此得到度量重建和内参数)。这三种方法都必须利用内参数已知的一些固有约束,例如skew为0,已知主点,或者内参数在N view中保持不变等等。     其实,上面的很多内容,在当初做毕业设计的时候也有所涉及,只不过当初只是抓了其中一条脉络,做了一种方法的实现,而没有从整体上把握最本质的原理,并对比各种方案的优劣,因此理解的也自然比较浅薄。     还有大约2个月放假,目前计划12月中旬结束<<MVGCV>>的第一遍阅读,然后剩余时间重新读一遍本书。     第一遍时,为了把握主干,不拘泥于旁支细节,所以遗留了一些小问题有待解决,课后思考题也都没有深究,第二遍则要注重理解每一个细节,并且要前后瞻顾,把相关的内容对比参考,达到融汇贯通的效果。     研二的上学期,大致学习计划就这样了。可以说,这半年就只干了一件事,就是读<<MVGCV>>。不过如果能读透彻,那么Geometry方面的基础应该说是打结实了,以后开展后续研究就容易一些了。     李开复曾经很多次在大会上告诉员工:“我们看到今天中国有很多成功的商业公司,我觉得可以用一个字来描述它们的成功,那就是快。但另外一方面呢,我希望大家也要看到那些真正基业长青的公司,其成功秘诀则在于它恪守价值观。一个企业绝不能因为过于强调快速发展而丧失使自身基业常青的理念。”     或许这段话略作修改,应用到科研上,也同样适用。古人云:“欲速则不达,欲小利则大事不成! ”也是同一个道理。     … 继续阅读

发表在 学无止境 | 标签为 , , , , | 24 条评论

随笔

    来科苑以后,已经有六七次接待川大软院的学弟学妹们来北京,或是保研、或是找工作、或是参加各类竞赛。     饭席间互相聊天,总感到他们都对北京、对未来满是憧憬与希望,有很强的上进心,努力的再争取各种机会,渴望毕业后能有更好的发展空间。     大学初期的失落与迷茫,总会让一些人永远的堕落,虚度时光而一无所获,也会有那么一些人在大二、大三逐渐的找回自我,树立目标,积极向上进取。     我知道,每次来北京的学弟学妹们,必然都是后者。并且从他们身上,我也能看到自己07年时的影子。     回想当初,也是一头的迷茫与雾水,不知路在何方,只是知道自己不甘心无所作为,于是便积极的参加竞赛、争取实习、保研的机会。那个时候没有很多的信息渠道,也没有师兄师姐的帮助提携,一切只能靠自己憋着一股劲争取。于是“细节决定成败”成了我奉行的准则。一改平日懒散、无所谓的作风,尽可能的在网上收集一些蛛丝马迹的信息为己用,准备竞赛、笔试、面试各种环节也力求尽善尽美。最后,所做的各种努力也没有白费,无论是竞赛、实习、保研都取得了满意的结果,07年,便是我的分水岭。        出于这样的原因,现在我很乐意和来京的学弟学妹们一起交流,畅谈现状与未来,我想,或多或少,会开阔他们一些眼界,对他们总会有一些的启发,并且我也可以强烈的感受到他们的青春与激情。     这一次,是07级别的3个学弟和1个学妹来京参加IBM大型主机决赛。晚上连同谭Fei一起,我们6人在怡宾餐厅聚了聚,谈了谈读研、读博以及工作那些事儿。很巧的是,两年前07级的辅导员曾邀请我给大一新生做一个关于大学学习与生活的讲座(详见此文:讲座有感),在座的一个学弟两年前曾经去听了,还记得我讲的关于实习和竞赛的那些事儿,然后今晚还把我认出来了~~~~     时光啊~转眼就是两年,当年的小菜鸟新生,如今也来北京参加比赛了,呵呵~     我也得抓紧了! 标签:交流, 感想, 聚会

发表在 学无止境 | 标签为 , , | 6 条评论

十一月四日,风雨大作

    今天,风和日丽,气温回暖,并没有疑似风雨大作的迹象。     只是在实验室看文献时,突然想起初中学过的一首诗。                        《十一月四日,风雨大作》                                                            ——–  陆游                   僵卧孤村不自哀,尚思为国戍轮台。                   夜阑卧听风吹雨,铁马冰河入梦来。     突然感觉,汉字博大精深,2维平面结构不但能达意,还能传形,并且寥寥几字组合在一起意境则更显深远。所以中文实在适合作诗赋词,搞搞文学创作。而英文就不同了,表达比较直白。例如形容某个物体或者状态,就只有那么几个词可选,基本上谈不上什么意境,并且没有什么成语、歇后语之类的存在,感觉形式也比较单一。不过英文的优点也在于此,在表达思想的时候可以表述的很直接、很通俗,几个定语从句that、that的加在一起就能结构清晰的表述出含义,让人易于理解。因此英文在表达学术方面,可能就比较适合了。     最近看文献看得比较多,总觉得英文文献易懂,可以让你很容易的理解一个概念,而中文文献似乎比较吝啬字数,并且似乎作者是觉得写的太直白浅显反而没有了水平,所以大多是很精练的陈述,让人看着脑子里就打结…由于所谓的“精炼”,自然可能就会产生一定的歧义,所以那个结,很可能就成了死结……     不过这个想法或许有些偏颇。毕竟现在看CV方面的文献,几乎全是英文的,思维已经毕竟顺应英文的表述方式了,而剩下寥寥的中文文献,又少有原创,内容几乎大半是翻译或转述的英文文献,难免有纰漏误译,所以读着不顺畅也难免了 … 标签:感想, 论文, 诗

发表在 学无止境 | 标签为 , , | 一条评论