ICCV小记

    从巴塞罗那回来差不多一周了,一直忙着release code,还没闲暇记录记录此行的一些感受。趁着周末,随笔一二。
    ICCV的全称是International Conference on Computer Vision,即国际计算机视觉大会,是计算机视觉领域最高级别的会议,通常每两年召开一次。第一届于1987年在伦敦举行,至今已是第十三届。
    本届ICCV在巴塞罗那召开,参会人数约1400人,其中学生超过400人,均为往届之最。本次会议共收到投稿论文1433篇,最终录取339篇,录稿率为23.6%,其中oral 45篇(3.1%),poster 294篇(20.5%)。各研究方向的详细统计数据见下图,可以看出,识别、跟踪、分割、统计机器学习和基于几何的视觉这些传统视觉方向还是占据了投稿和录取的大半江山。
    papers_per_topic
    paper per topic

    本次会议议程共计8天,其中1天toturial,3天workshop和4天conference,每天从早到晚,非常之紧凑。
    tutorial和workshop都是multi-track的形式,多个不同的topic在不同的会议室同时进行,可以根据自己的研究方向选择感兴趣的内容来听。这两个环节都很不错,可以遇到很多和自己从事相关工作的人,有些workshop还请了一些大牛来panel meeting,共同切磋讨论目前视觉研究遇到的一些问题或者瓶颈。
    Hotel Catalonia Plaza
    workshop和tutorial的主场馆,Hotel Catalonia Plaza
    nEO_IMG_IMG_2629
    某个tutorial的会议室,PCL

    conference则是以single-track的形式召开,45篇oral按不同的方向划分为若干个session,在一个很大的会议厅里依次的上台做18分钟的报告。这样虽然能够一个不漏的都听一遍,但是对观众而言,由于没有选择性,遇到某些不感兴趣的topic或者某些presentation做得不够interesting时,那就很煎熬了。以我为例,和自己研究较为接近的paper,基本还能把握住作者的思想,能有一些收获,但是对于一些完全陌生方向的paper,或者遇到有些英语发音不标准、语速特别快的speaker时,很快就会不知所云,甚至昏昏欲睡。所以,总体感觉single-track这种形式,更适合对多个方向都有涉及的大牛,便于他们总体概览整个领域的发展动向,然而对于大部分人来说,想全程hold住还是很困难的。
    不过本届ICCV,为了尽可能的缩小oral和poster的差别,首次引入了spotlight presentation环节。每个poster的作者都有80秒的上台演讲的时间,通过一页ppt来给自己的文章打个广告,吸引台下的观众在poster session环节到自己的poster前了解更多的信息。我和同行的朋友都感觉这是非常有意思的一个环节,能够让大家在很短的时间内对整个会议录取文章的大体动向有个把握。遇到感兴趣的paper标注一下,下来去poster前进一步了解,不感兴趣的也是80秒一晃而过,并不那么无聊。这样整个spotlight过程中不停有新的内容闪现,大脑也高度的兴奋,收获反而更多。80秒的时间虽然短暂,1页的ppt虽然短小,但其实一篇paper最本质的东西,本就应该几句话能解释清楚。具体的细节对于从事相关方向工作的人来说才有意义,对于大多数人而言,能够掌握核心的思想就已经足够了。所以这就要求作者精心策划ppt,呈现文章最精华的部分,传递最有用的信息。由于这次是第一次引入spotlight环节,很多同学对此没啥概念,要么图省事,要么不足够重视,在ppt里简单地放了一个poster的缩略版,或者是一大堆根本无法在80秒内解释清楚的图表和文字,导致做完presentation后,观众甚至连他的工作解决了什么问题都不清楚,这样的spotlight无疑是失败的。遗憾的是,这样的例子不少。
    从整个spotlight上场情况来看,本次ICCV paper中华人占的比例非常大,甚至经常出现连续4、5个spotlight都是华人出场的情况。尽管其中主力还是留学生或者留洋学者,来自大陆的相对较少,但这也是非常令人兴奋的事情~~
    poster session是每天oral结束后的重头戏,大约从5点半持续到8点半,每个poster的作者都会在自己的展台前给感兴趣的观众讲解自己的文章,答疑解惑。由于ICCV绝大多数文章都是poster,所以每晚此时会场都是人头攒动,热闹非凡。参观者中常有各路传闻中的大牛身影出没,而poster展台前也经常是大牛们亲自披挂上阵,现身说教。所谓各路好手共聚一堂,指点江山、激扬文字,想来也不过如此了。由于参观者众多,各自背景也有所不同,因此讲解者通常需要提供不同程度的解答。有的观众走马观花,有的观众刨根问底,有的甚至直接对你的工作提出质疑,于是自然免不了一番唇枪舌剑。如此你来我往,3个小时下来,也真是个体力活~~不过这种面对面的直接交流,对于作者和观众而言,收获都是非常大的。就我个人而言,自己的poster环节,是第一次连续3小时全英语和别人交流学术问题,压力很大。幸好自己对相关领域的工作还比较熟悉,场面基本还能hold住。除了不停的讲解答疑之外,还偶遇大牛Matas过来comment我的实验结果。话说当时只见一老人立足poster之前,凝视实验结果部分半晌不言,随后便上前与我讨论,大概意思是不相信实验结果竟然如此之好。。。于是我们就很多细节问题争论一番,后来他提到我所描述的patch大小,我便答道用的是oxford提供affine region检测程序,patch都是41*41的大小,没想到他竟然冒了一句他就是该程序的作者。。当时心头便是一震,悄悄瞄了一眼他胸前的挂牌,才发现原来是MSER的作者Matas~~~回国后,发现Matas的学生又发邮件向我要code,后话略过不表~~
    Fire de Barcelona
    conference的主场馆,Fire de Barcelona 5号楼
    nEO_IMG_IMG_2830
    会议正式开始了,台上坐着几个chair
    nEO_IMG_IMG_2873
    某篇paper的oral presentation
    nEO_IMG_IMG_2928
    我的spotlight presentation,真是台上1分钟,台下1年功啊~
    nEO_IMG_IMG_2939
    poster场地的一角,中午的时候很多poster还没贴出来,不过已经有不少人围观了
    nEO_IMG_IMG_2959
    我的poster presentation,自我感觉还不错,三个小时内一刻也没有停歇,吸引了有二三十人围观:)

    正式的conference开始前一天,以及结束前一天,组委会分别组织了一次light reception和一次light banquet,邀请所有的参会人员共聚一堂。由于人数太多,举办的确实比较轻量化,提供的食物种类并不多,不过其主要目的也只是为了给大家一个更随意、更自由的交流环境。banquet选定在一个非常古典的宫殿里举行,不仅邀请了当地乐队演唱伴奏,还安排了西班牙特有的“搭人塔”表演助兴。异域风情、佳肴美酒、觥筹交错、众宾皆欢,倒也是很不错的体验
     nEO_IMG_IMG_3098
    宫殿的一个大厅
     nEO_IMG_IMG_3076
    乐队尽情的演奏
    IMG_3095
    楼上别有洞天
    IMG_3092
    cheers!
    IMG_3106
    搭人塔表演~秉承着西班牙人民“力量、沉着、勇敢、理智”的座右铭

    小结一下,第一篇paper,第一次开会,第一次出国,收获不少~
    一切都刚刚开始,希望自己能够再接再厉,博士期间斩获更多的paper!
    fighting!

Creative Commons License
This work, unless otherwise expressly stated, is licensed under a Creative Commons Attribution-No Derivative Works 2.5 China Mainland License.
标签:, ,
此条目发表在 学无止境 分类目录,贴了 , , 标签。将固定链接加入收藏夹。

ICCV小记》有 168 条评论

  1. hh 说:

    羡慕。。。。

    回复

  2. qq 说:

    偶像级的人物啊,原来你在这里还有一个天地

    回复

发表评论

电子邮件地址不会被公开。 必填项已被标记为 *

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>