分类目录
标签云
快速订阅
-
最近文章
近期评论
朋友圈
Blogroll
友情链接
功能
分类目录归档:学无止境
第一次组会报告
31日做完了自己的第一次组会报告。 记得去年是9月1日正式搬进实验室,算来刚好是一年的最后一天。 报告的内容主要是图像特征描述子相关。 首先是Introduction,介绍了下特征点的应用场合,比如wide-baseline matching,3-D reconstruction,object reconizition,image retrieval,panoramic stitching等等 其次是State-of-art里介绍了经典的SIFT,GLOH,以及近两年来cvpr上发表的Daisy,OSID,HRI-CSLTP描述子 然后就是主要介绍了下我之前2个月一直在做的内容。大概就是基于一种局部不变坐标系下的某种不变量度量,来对特征点领域进行描述。 接着就是实验室结果,和SIFT进行多种场景变换下的对比,例如视角变化,尺度变化,光照变化,旋转,模糊,JPEG压缩等等。 最后就是Conclusion和Future work,总结了一下目前的结果,以及下一步研究思路。 大概花了4天时间来做PPT,跑实验结果,还是耗了些心力。本来想借此机会扭转下在胡core心目中经常迟到的形象,结果讲到一半他便有事走了,去清华参加一个博士答辩。。杯具啊。 接下来老板点评的时候,质疑我怎么都是一个月前的结果,然后问我最近干嘛了。解释了半天,原来他误以为我没有回家,一直待着实验室。囧,还好他知道我是回家了后,表示是他冤枉我了,总体评价了下我现在的工作还是不错的。 恩,新的一学年了又开始了,工资也涨了,博士也转了,好好加油吧,准备投11月的CVPR。 come on! PS:考虑到组会报告里面的实验室内容还没有整理成文发表,暂不上传ppt,有兴趣的童鞋可以私下交流。 标签:presentation, 实验室, 组会
[zz]Hartley教授回信–论摄影测量与计算机视觉
转载一篇文章,Harley给某位武大学生的回信~ 恩,CV里geometry这块确实已经比较成熟了,基本框架已经奠定,剩下的无非就是探寻若干约束条件,然后鲁棒求解。近年各大CV会议上这方面的paper都比较少。咱们组是不是该考虑一下其他topic了? 原文链接: http://hi.baidu.com/simbaforrest/blog/item/8f23161c994af78086d6b62a.html 三个月前写的信,他老人家昨天才回,不过看后确实收获很多哟 总结他老人家的意思: 1.摄影测量和计算机视觉在十年前是结合的黄金时段 2.目前计算机视觉主流已经走入recognition的时代 3.Geometry和recognition的结合目前鲜有人做,但不是没有可能 标签:他山之玉
小结
开学以来,除了看paper和写程序,其余时间看书就比较少了。 转眼六月在即,这个学期似乎又要过去了,回头审视一番,发现这3个多月的积累与收获远不如上学期。 概括起来,2底到4月底主要看了些dense match方面的文章,包括很80年代很old的基于area的local method以及90年代到20世纪初比较多的基于最小化能量函数的global method,5月初到现在则转型看sparse matches,并做了一些描述子的实验。 除此之外,上学期期末买的一些科普,小说类的书籍也没来及看,至于列了很久的恶补数学的计划更是束之高阁,倒是每天中午和晚上睡前断断续续的看了7、8部古龙的小说。。。。 这几天组里面的该毕业的师兄们都顺利答辩完了,一代新人换旧人,看似遥远的毕业似乎离我也不远了。 逐渐感受到了论文的压力,组里的同仁们都在准备纷至沓来的种种会议,赶各种deadline,忙得不亦乐乎。这种会议驱动的研究方式也把自己想静心做基础学习的念头慢慢的淡化。国外诸多大牛通常都从conference的指挥棒中跳了出来,沿着一条主线,按照自己的思路和计划做系统的研究,实实在在的进行有意义的探索。每当会议征稿,随手挑几个比较成熟的想法,做几个demo,然后汇成文章就能轻松发表。那是怎样一种从容淡定,怎样一种闲庭信步~~~ 恩,话不多说,最近找点时间,看看Richard Szeliski新写的一本CV的书,尚未出版~ 链接在此,感兴趣的同学可下载draft:http://szeliski.org/Book/ 标签:书籍, 思考, 总结
汇报
做了2个多星期的描述子实验,试了多种参数的情况组合,也想了些别的统计方法,得出了一大堆数据。昨晚整理成文档后,今天下午和FB一起去给老板汇报结果了。 总体说来,效果比老板预想的好,他预估的新描述子在32维这么个维度上能达到SIFT的一半左右就不错了,但实验表明性能差距大部分在10%左右,不过对于光照改变的情况鲁棒性不好,差了25%。 然后和老板一起讨论了下原因,以及下一步研究的思路,恩,继续好好搞吧,希望能在维度相对较低的情况进一步提高性能,发篇处女paper~ 恩,看来是从稠密匹配转向基于描述子的稀疏匹配了~ ps:上午组会报告,听了新来的助研的报告,去年底刚从上交毕业的博士,大牛啊,三年半发了5篇国际期刊,6篇国际会议,还独立完成了一个机器人手术系统的开发。。。组里终于注入新鲜血液了~~ 标签:匹配, 汇报, 科研
上课
这学期开始修博士学分,选了老板在所里开的《CV中的数学方法》一课。 上了有3周,都是在很抽象的层面讨论空间和变换。 前面关于线性空间与线性变换的内容,仗着本科线性代数的基础还能理解的比较清楚,引入拓扑的概念后,就觉得很抽象了,全是各种定义和证明绕来绕去,所以后面关于拓扑空间与拓扑变换,距离空间,拓扑线性空间,赋范线性空间,Hilbert空间的讨论都比较迷迷糊糊,听的很郁闷。。 只能下来抽时间找书看了,不过这些内容大多属于短期只能依葫芦画瓢、难以深入理解,必须长期反复推敲、死抠来龙去脉才能顿悟其精妙的东西,也不是那么容易看到成效的~ 感慨一下,老板果然是数学科班出身,功力就是不一样啊! 恩,最后预报一下周末的活动: 周五实验室组织香山玩真人CS,团队建设;周六Trekking版狗牙山探路;周日休整一天,考虑下五一的安排~ 又一周结束了!吼吼吼~ 标签:思考, 数学
转博了
花了一周多时间准备的转博答辩昨天终于结束了。 虽然只是以组会的形式进行,考核评审组的老师都是来自组里,但由于是第一次在组里做报告,所以还是比较认真准备了一下。考虑到转博答辩以文献综述为主,所以结合看过的几篇综述性的文章,比较宏观的介绍了一下30年立体视觉的发展情况,主要包括了以下几个方面:为解决匹配二义性而提出的常用约束(camera-based and scene-based), 根据利用约束信息的不同对立体匹配算法进行分类(Local method and Global method)以及解决遮挡的一些常用方法。 自我感觉思路还算比较清晰,也比较符合综述的要求,结果还是被批了。 一曰:讲的内容不具体,太泛泛而谈,不能体现出对领域已有了深入理解。并且大多数内容来自于某篇PAMI上的文章,缺少自己的理解…… 二曰:不遵守实验室规定,多次迟到,午睡时间过长。。。 囧了… 原以为考核的以文献综述的形式,所以才这样准备,早知道就讲几种具体的匹配方案,提一下改进思路,说不定还会认为你读的比较认真。。。 至于迟到,真是倒霉。上学期就两次查迟到,我就正好都迟到了,然后就被推论经常迟到。。。 ok,无论如何,转博这事儿算是告一段落了。 接下来的日子,抓紧时间读paper,发paper才是王道! 标签:答辩, 组会, 转博
随便写点
恩,随便记录一下最近: 1.上午找老板汇报近2周工作。这2周主要是在抽象的向量空间和线性映射的角度下回顾了线性代数的内容,然后看了利用微分几何方面的知识来实现surface stereo的一篇paper和若干引用文献。 线代方面唯一想说的就是国内的教材太垃圾,大多着力了讲解具体的计算方法,而非从本质上讲解向量空间与线性映射的性质以及推导,所以学了后除了会笔算矩阵乘法、行列式,来龙去脉前因后果一概不知,几乎等于白学,对于研究没有一点用处。 至于paper,其中关于微分几何的内容几乎没看懂,下来慢慢补基础知识;关于stereo correspondence·的内容也比较棘手,主要是要参考很多引用文献。在不熟悉某个领域的时候,最好的办法就是找一篇review的文章,然而看这种review又是最痛苦的。介绍了N多方法,相互分类比较,其中每一种又必须去查相关引用文献,然后引用文献的又引用别的,别的再引用别的,子子孙孙无穷匮也… 深度or广度优先?that’s a question! 2.上周趁着卓越搞活动,一口气在上面订了八本书,结果今天才送到…faint!竟然是从广州发货过来的,真慢!还好质量没问题,包装也比较到位。 《一九八四》、《动物农场》、《我与父辈》属于小说性质,打发放假在火车上的无聊时光。其中前2本是奥威尔的2本反乌托邦的传世之作,慕名已久,终于入手。后一本是卓越的赠品,作者阎连科也比较有来头,看看也无妨。 《数学:确定性的丧失》和《逻辑的引擎》这两本是类似科普性的读物,在豆瓣上评分颇高。前者讲述数学真理的起源、繁荣、科学的数学化、数学向何处去等内容,后者从逻辑角度讲述计算机的发展,以及发展这些内容的著名人物。数学+计算机都是我现在专业最相关的学科,从科普角度直观的了解这2门学科我认为很有必要。 《改变心理学的40项研究:探索心理学研究的历史》是一本介绍影响心理学发展的重要研究成果的书。最近对心理学比较感兴趣,源于前段时间看了《影响力》一书,以及pongba的强烈推荐。想进一步了解心理学更多的内容,此书就成了不二选择。 《怀斯曼生存手册》很非常NB的一本关于户外自救、自我保护的生存手册。看看介绍吧:“有这么一本书,仅凭一把刀和书中的知识,就可以在任何地方、任何天气、任何条件下生存下去。这就是《怀斯曼生存手册》”。对于户外活动频繁的我来说,了解一些基本的户外生存技巧是非常必要的,因此也没有理由拒绝这样一本书。 《给研究生的学术建议》则纯粹是我为了凑够卓越赠书活动消费下限的产物。不过既然要读博了,看看一些经验以及建议还是不错。 3.最近每天晚上狂打PES2010,和实验室2个师兄对战到深夜。从14年前的PS1上的《J联赛》,到如今蔓延值PS3的《实况2010》;从小学四年级的路边游戏厅打到研究生二年级的实验室,我也算是骨灰级玩家了。实况一点一点的改进确实难能可贵,如今画面效果几乎不可挑剔,物理引擎也越来越贴近事实,AI系统虽然还有不少瑕疵,但也比FIFA高出一大截~~~再加上我是新配置的4核PC,简直流畅的一塌糊涂…… 恩,得控制一下游戏频率了。下周就放假了,还是抓紧时间做点事情~ 最后,今天被告知春节回来做一次组会报告,惨… 标签:学习, 游戏, 读书
二三言
今天终于把《MVGCV》的7个附录也看完了… 从九月底到现在,历时三个多月,600多页+若干引用文献… 此书是毋庸置疑的经典之作,是对04年以前15年左右CV领域Geometry方向大部分工作的总结,深入浅出,非常适合入门巩固基础。强烈建议搞这块的同学仔细研读,反复体会,必然会让你对该领域的认识提高若干层次。 目前自己是大体上对多视几何已经有所把握了,但是书中很有些细节还没有搞明白,原计划本是放假之前review一遍,并试着做一下课后思考题,继续阅读此书引用的文献。但是由于老板已经布置的3篇论文的阅读任务,估计这个review的计划得放一放了~~~ 在实验室的头半年,发现是知道的越多,然后发现不知道的更是越来越多。转专业后要补的基础课程暂且不提,光是数学上很多东西都要重头学。 sign,本科的时候果然是见识太肤浅了,认为对搞计算机软件的人来说数学就是屠龙之技,所以很不重视,敷衍了事,没好好学一把。并且研一都没有选一门数学课,现在转专业过来了,不搞软件开发搞点理论研究了,顿时感觉书到用时方恨少!看点paper吧,这个概念不知道,那个定义也不清楚,知识体系可以说是千疮百孔,说白了就是数学基础不行。 话说周二的组会,博三和博二的师兄师姐们分别作中期答辩和开题答辩,发现有好几人都是本科或是硕士是数学系出身的,甚至还有是大学的数学老师过来读博的,牛X啊… 遗憾的是,答辩时,已经博三的LT师兄直接被H老师告知90%拿不到博士学位,即使延期也不行,顶多发个硕士学位… sign,太残酷了,5年的硕博很可能就这么废了,并且拿不到学位,可能这半年找工作的时间也白费了… ok,继续努力吧… 放假之前的大体工作计划如下: 1.重温线性代数,看矩阵分析。 2.阅读老板布置的3篇论文(2篇关于立体匹配,1篇关于分层自标定的全局最优算法)以及相关引用文献。 3.看vgg的多视几何库,研究下MVGCV中算法的matlab实现。 4.抽时间看一下数字图像处理的matlab实现。 come on,man! 标签:MVGCV, 计划
小结2009
2009匆匆已过,略作小结,算是回忆下自己这一年的经历。 一、学习篇 09年在学业上虽无大成,但相比过去而言,我投入了更多的精力。上半年例行公事的春季、秋季的课程学习就不多费笔墨,虽然无聊,但毕竟有可能是人生最后坐在教室里的时候了。二月份末开始准备10月的GRE,其间听了bebeyond的一次大牛云集的讲座,再加上对当前专业极度失望,以及对做工程前景的担忧,出国读phd的渴望空前强烈~~奋战一月左右,红宝书背到List 31。三月份末申请GSOC,GRE单词暂时中断。GSOC申请的2周中,连续多日通宵coding,最终赶在deadline之前搞定了2个demo。满怀希望的等到google放榜的那天,结果却是牺牲的不明不白。当我还来不及狠狠郁闷一把,然后重拾GRE的时,TOP-100转专业考试的通知又贴了出来。经过几天慎重的权衡考虑,决定报名,说服自己的理由也很简单:如果能早一点换到自己感兴趣的专业,何尝不可?于是其后的一个半月,精力的重心大半部分和top100相关。笔试、面试的突围并不困难,困难是在于单枪匹马说服原来研究所的导师放人,然后让新研究所的导师同意接收。其间的种种挫折不在详述,单就背水一战的心理压力就让我一段时间内很郁闷。还好这一次的努力没有白费,费尽周折后终于转到一个感兴趣的方向:计算机视觉。不过GRE之路也就此终结,因为在和新导师的交涉中,我已经同意了硕博连读。2个月的暑假算是最后一次彻底的放松,九月份到新实验室报道后,很快便融入了新的环境。余下的3个多月便奉献给了Hartley的MVGCV一书,直至12月底才看完22章正文。虽不敢说融会贯通,但对于CV里Geometry这一块的认识还是有了长足提高。 09年也读了些业余的书。《明朝那些事儿》让我燃起了对历史的浓浓兴趣,随后又抽时间读了《万历十五年》和《汉朝那些事儿》。读史明志,此言不虚。历史记录下来的人物大多都是一个时代的杰出代表,无论正邪。了解他们生平行事对己颇有启发意义。并且历史作为既定发生的事实,对于后人也非常具有借鉴意义。成功励志的书籍方面,主要读了《世界因你不同:李开复自传》、《李彦宏的百度世界》、《成长-微软小子的教育》、《微软的梦工厂》几本,主要是了解一下大牛们的成长之路,并鼓励自己继续努力。武侠仍然是我打发无聊时光的选择之一。在若干个夜深人静的夜晚独自躺在床上,在ACDN的呼噜声中,用手机重温了金庸的6、7部,然后读了不下10本古龙。现在虽然没有初中看武侠那种疯狂劲头,不过一旦打开一本,也是不看完不罢休的。目前金庸的每本至少都读了2遍以上、古龙、卧龙生的小说各读了十之五六。再我看来,这三位各有偏攻,古龙细腻而善于心理描写、金庸大气善于场面渲染、卧龙生老练而善于悬念铺设,综合而论,古龙>金庸>卧龙生。至于其他类别的,还读了《囚徒的困境》、《影响力》、《少有人走的路》、《国家地理之选美中国特辑》等几本,都非常不错。特别是《影响力》一书,是我读的第一本关于心理学的著作。此书通过很多案例的分析,揭示了生活中存在的6种影响力武器—-互惠、承诺与一致、社会认同、喜好、权威以及短缺。很意思,也值得推荐。 二、生活篇 09年的生活波澜不惊。 各种体育运动锐减,20岁之前热衷的篮球、足球几乎淡出生活。这应该是读初中以来,第一次一整年没有打一场正式的篮球赛并且没有踢一场正式的足球赛。关于这方面的记忆,最多的还是高中。年级篮球赛冠军,年级足球赛冠军,乐山市高中足球联赛冠军,那些一起拼搏、战斗的兄弟们,很多都不知现在何方…至于一直以来比较爱好的台球、游泳还在间或的进行,不过一年下来也不超过10次。信誓旦旦要坚持的健身,也是虎头蛇尾。这一年,唯一的亮点就是真正意义上踏入了户外的大门。无论是出行次数和装备上都投入了相当的精力和财力。简单罗列一下09年大致出行情况: 户外性质 1月11日,金山岭-司马台长城穿越 5月17日,天仙瀑-豪宅-京都第一瀑穿越 5月28、29日,啤酒溪-小海陀-大海陀村扎营2日 6月20日,公涧铺-百花顶-百花草甸穿越 9月19日,后河穿越 10月4日,京西古道徒步 10月18日,香山邮局-老望京-挂甲塔-水库-八大处穿越 旅游性质 2月7日,太阳岛烧烤 2月10、11日,望鱼古镇、碧峰峡2日 3月21日,玉渊潭公园赏花 … 继续阅读




