Hi all! Well come to the home of @foelin !

[zz]三年硕士五年博

星期四, 二月 4th, 2010

    转载一诗,出处不详。

                    三年硕士五年博

        三年硕士五年博,霜染青丝纹上额。
        十年寒窗难破壁,一朝毕业讨生活。
        东西外企疑无路,南北国企人也多。
        忍看私企门不入,笑闻牛人进院所。
        无头苍蝇空扑翼,丧家之犬进油锅。
        一骑红尘心暗笑,错把据信当offer。
        汗透重衣梦难醒,一进一退失所措。
       自思年年求学事,无花无酒亦无歌。
        红袖冥冥无觅处,象牙塔中难造车。
        两处茫茫皆不见,四面碰壁无逃脱。
        未经悬梁刺股痛,悔把岁月空蹉跎。
        今朝有梦今朝作,莫待无梦呼奈何。
        三年硕士五年博,身变皮骨腰变驮。
        昨日豪情遭磨难,今朝两鬓见斑驳。
        囊中通货常恨少,腹内草莽日渐多。
        墙上芦苇浅根底,山间竹笋空外壳。
        有心飘洋求深造,无奈拦路有G 托。
        终日昏昏书中死,彻夜迷迷网上活。
        人依电脑哥俩个,情寄足球心一颗。
        偶有红袖添香事,南柯梦醒愁更多。
        不毛之地空求雨,梧桐树矮愧凤落。
        寄言诸位同窗友,莫效小子这般活。
        轻浮小舟难下海,空虚岁月易蹉跎。
        此中言语皆肺腑,敬请大家细琢磨。

标签:,

[zz]09年盘点

星期一, 一月 11th, 2010

    精辟,网友很强大!

以下内容为转载,出处不明:

    正月十五,央视添堵,预示今年,难以靠谱;
    三月开始,甲流如虎,全球人民,六神无主。
    经济危机,大象变鼠,世界各国,心里打鼓。
    杭州飙车,巴东抗辱,上海钓鱼,新疆七五。
    猫猫刚躲,楼倒黄浦,纸币开铐,民心难抚。
    老太自焚,以身守土,楼价狂飙,回应政府。
    本山住院,阳仔递补,女排不灵,男足涉赌。
    律师辩黑,自遭逮捕,高管落马,如何防腐?
    学森辞世,羡林作古,不堪寂寞,曹操出土。

标签:

[zz]和机器学习和计算机视觉相关的数学

星期五, 九月 4th, 2009

新进实验室,急需恶补数学基础知识,goolge到此文,据说为某MIT大牛所感,转载于此,以便以后查阅。

感觉数学似乎总是不够的。这些日子为了解决research中的一些问题,又在图书馆捧起了数学的教科书。从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识。Learning和Vision都 是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说,往往是非常exciting的enjoyable的事情。不过,这 也代表着要充分了解这个领域并且取得有意义的进展是很艰苦的。 记得在两年前的一次blog里面,提到过和learning有关的数学。今天看来,我对于数学在这个领域的作用有了新的思考。 对于Learning的研究,

1、 Linear Algebra (线性代数) 和 Statistics (统计学) 是最重要和不可缺少的。这 代表了Machine Learning中最主流的两大类方法的基础。一种是以研究函数和变换为重点的代数方法,比如Dimension reduction,feature extraction,Kernel等,一种是以研究统计模型和样本分布为重点的统计方法,比如Graphical model, Information theoretical models等。它们侧重虽有不同,但是常常是共同使用的,对于代数方法,往往需要统计上的解释,对于统计模型,其具体计算则需要代数的帮助。 以代数和统计为出发点,继续往深处走,我们会发现需要更多的数学。

2、Calculus (微积分),只是数学分析体系的基础。其 基础性作用不言而喻。Learning研究的大部分问题是在连续的度量空间进行的,无论代数还是统计,在研究优化问题的时候,对一个映射的微分或者梯度的 分析总是不可避免。而在统计学中,Marginalization和积分更是密不可分——不过,以解析形式把积分导出来的情况则不多见。

3、Partial Differential Equation (偏微分方程),这主要用于描述动态过程,或者仿动态过程。这个学科在Vision中用得比Learning多,主要用于描述连续场的运动或者扩散过程。比如Level set, Optical flow都是这方面的典型例子。

4、Functional Analysis (泛函分析), 通 俗地,可以理解为微积分从有限维空间到无限维空间的拓展——当然了,它实际上远不止于此。在这个地方,函数以及其所作用的对象之间存在的对偶关系扮演了非 常重要的角色。Learning发展至今,也在向无限维延伸——从研究有限维向量的问题到以无限维的函数为研究对象。Kernel Learning 和 Gaussian Process 是其中典型的例子——其中的核心概念都是Kernel。很多做Learning的人把Kernel简单理解为Kernel trick的运用,这就把kernel的意义严重弱化了。在泛函里面,Kernel (Inner Product) 是建立整个博大的代数体系的根本,从metric, transform到spectrum都根源于此。

5、Measure Theory (测度理论),这 是和实分析关系非常密切的学科。但是测度理论并不限于此。从某种意义上说,Real Analysis可以从Lebesgue Measure(勒贝格测度)推演,不过其实还有很多别的测度体系——概率本身就是一种测度。测度理论对于Learning的意义是根本的,现代统计学整 个就是建立在测度理论的基础之上——虽然初级的概率论教科书一般不这样引入。在看一些统计方面的文章的时候,你可能会发现,它们会把统计的公式改用测度来 表达,这样做有两个好处:所有的推导和结论不用分别给连续分布和离散分布各自写一遍了,这两种东西都可以用同一的测度形式表达:连续分布的积分基于 Lebesgue测度,离散分布的求和基于计数测度,而且还能推广到那种既不连续又不离散的分布中去(这种东西不是数学家的游戏,而是已经在实用的东西, 在Dirchlet Process或者Pitman-Yor Process里面会经常看到)。而且,即使是连续积分,如果不是在欧氏空间进行,而是在更一般的拓扑空间(比如微分流形或者变换群),那么传统的黎曼积 分(就是大学一年级在微积分课学的那种)就不work了,你可能需要它们的一些推广,比如Haar Measure或者Lebesgue-Stieltjes积分。

6、Topology(拓扑学),这 是学术中很基础的学科。它一般不直接提供方法,但是它的很多概念和定理是其它数学分支的基石。看很多别的数学的时候,你会经常接触这样一些概念:Open set / Closed set,set basis,Hausdauf, continuous function,metric space, Cauchy sequence, neighborhood, compactness, connectivity。很多这些也许在大学一年级就学习过一些,当时是基于极限的概念获得的。如果,看过拓扑学之后,对这些概念的认识会有根本性的拓 展。比如,连续函数,当时是由epison法定义的,就是无论取多小的正数epsilon,都存在xxx,使得xxx。这是需要一种metric去度量距 离的,在general topology里面,对于连续函数的定义连坐标和距离都不需要——如果一个映射使得开集的原像是开集,它就是连续的——至于开集是基于集合论定义的,不 是通常的开区间的意思。这只是最简单的例子。当然,我们研究learning也许不需要深究这些数学概念背后的公理体系,但是,打破原来定义的概念的局限 在很多问题上是必须的——尤其是当你研究的东西它不是在欧氏空间里面的时候——正交矩阵,变换群,流形,概率分布的空间,都属于此。

7、Differential Manifold (微分流形), 通 俗地说它研究的是平滑的曲面。一个直接的印象是它是不是可以用来fitting一个surface什么的——当然这算是一种应用,但是这是非常初步的。本 质上说,微分流形研究的是平滑的拓扑结构。一个空间构成微分流形的基本要素是局部平滑:从拓扑学来理解,就是它的任意局部都同胚于欧氏空间,从解析的角度 来看,就是相容的局部坐标系统。当然,在全局上,它不要求和欧氏空间同胚。它除了可以用于刻画集合上的平滑曲面外,更重要的意义在于,它可以用于研究很多 重要的集合。一个n-维线性空间的全部k-维子空间(k

8、Lie Group Theory (李群论),一 般意义的群论在Learning中被运用的不是很多,群论在Learning中用得较多的是它的一个重要方向Lie group。定义在平滑流行上的群,并且其群运算是平滑的话,那么这就叫李群。因为Learning和编码不同,更多关注的是连续空间,因为Lie group在各种群中对于Learning特别重要。各种子空间,线性变换,非奇异矩阵都基于通常意义的矩阵乘法构成李群。在李群中的映射,变换,度量, 划分等等都对于Learning中代数方法的研究有重要指导意义。

9、Graph Theory(图论),图, 由于它在表述各种关系的强大能力以及优雅的理论,高效的算法,越来越受到Learning领域的欢迎。经典图论,在Learning中的一个最重要应用就 是graphical models了,它被成功运用于分析统计网络的结构和规划统计推断的流程。Graphical model所取得的成功,图论可谓功不可没。在Vision里面,maxflow (graphcut)算法在图像分割,Stereo还有各种能量优化中也广受应用。另外一个重要的图论分支就是Algebraic graph theory (代数图论),主要运用于图的谱分析,著名的应用包括Normalized Cut和Spectral Clustering。近年来在semi-supervised learning中受到特别关注。

标签:, , ,

[zz]不平凡的2008

星期五, 十二月 12th, 2008

资料来源http://www.google.com/intl/en/press/zeitgeist2008/

google今天公布了全球各地2008年的热门关键词与上升最快关键词,涵盖了诸多方面。鉴于2008的特殊性,故转载下文,以示纪念:

没有什么比2008年的中国更让人刻骨铭心了。”雪灾”、”山东火车相撞事故”、”四川地震”,这些沉重的字眼将一次次突如其来的灾难永远铭刻在了2008年的史册上,同时也成为了所有中国人勇气、爱心、凝聚力和大无畏精神的最好写照。尽管我们在前进过程中遭遇了”西藏暴乱”等坎坷和风波,尽管”金融危机”的阴云笼罩在全世界的上空,中国人始终用高昂的头颅和积极向上的精神迎接2008年的挑战。面对新闻巨无霸中国人喊出了”做人不能太CNN”的话语,中国人也用最果断、最严厉的方式处置了那些靠”三聚氰胺”谋财害命的不法之徒。”奥运会开幕式”和”神七”是我们对 2008年的最美好记忆,更是对我们一年来不懈努力的最好回报!

年度上升最快 (Fastest Rising)

  1. 陈冠希
  2. 奥运会开幕式
  3. 四川地震
  4. 不合格奶粉名单
  5. 艳照门
  6. 画皮
  7. 赤裸特工f.b.i
  8. 国足欢迎你
  9. 刘翔退赛
  10. 神七

(全文…)

标签:, , ,

[zz]计算机科学与技术学习反思录

星期天, 五月 4th, 2008

刚看了一篇关于反思计算机学习的文章,大有相见恨晚之感。个人认为此文见解非常之深刻,站在一个统领全局的高度上对计科学习方法做了一个引导,没有雄厚的数学功底和计科领域十余年浸淫可能难有此见地。几乎不感相信当年此文出至于一大三学生之手,不由地自叹弗如。后来在网上考证了一番,才发现原来其中大部分内容引至南京大学小百合BBS里Sir博士(现为耶鲁大学副教授)的若干帖子。不过无论如何,也是一篇值得转载,弘扬的好文。

题目:计算机科学与技术学习反思录
作者:曾毅
时间:2003年7月
源网址:http://www.frontfree.net/view/article_746.html
原文如下:

计算机科学与技术这一门科学深深的吸引着我们这些同学们,上计算机系已经有近三年了,自己也做了一些思考,原先不管是国内还是国外都喜欢把这个系分为计算机软件理论、计算机系统、计算机技术与应用。后来又合到一起,变成了现在的计算机科学与技术。我一直认为计算机科学与技术这门专业,在本科阶段是不可能切分成计算机科学和计算机技术的,因为计算机科学需要相当多的实践,而实践需要技术;每一个人(包括非计算机专业),掌握简单的计算机技术都很容易(包括原先Major们自以为得意的程序设计),但计算机专业的优势是:我们掌握许多其他专业并不”深究”的东西,例如,算法,体系结构,等等。非计算机专业的人可以很容易地做一个芯片,写一段程序,但他们做不出计算机专业能够做出来的大型系统。今天我想专门谈一谈计算机科学,并将重点放在计算理论上。

1、计算机理论的一个核心问题–从数学谈起:

(全文…)

标签:,

[zz]戏说乐山

星期五, 四月 11th, 2008

去年便在QQVideo上看到了这个乐山话版命运呼叫转移,非常强大。为进一步弘扬乐山本土小吃文化,所以特此在这里转载:

说真的,太有才了~~

标签:, ,

[zz]报考中科院十大理由

星期五, 九月 28th, 2007

转载一篇中科院研究生院网站上的文章,坚定一下信念!

1. 至高的学术机构,理想的科学殿堂

中国科学院是国家最高学术机构,是中国的科学殿堂。中国科学院研究生院是一所研究生院型大学,她只有硕士博士研究生而没有本科生。学生全部来自全国各个高校,因而能够兼容并蓄,海纳百川,促成各种学术思想、各种学术流派的彼此交融,有利于新思想的形成,新方法的诞生,有利于创新人才的培养。在这样的殿堂里学习,接受培养、训练和洗礼,岂不荣耀和自豪?

2. 大师领衔,名家荟萃,培养实力雄厚

中国科学院大师云集,人才济济。有300多位两院院士、2000余位博士生导师、4500余位教授和研究员参与研究生的培养和指导工作。他们有培养研究生的丰富经验。俗话说,名师出高徒。在这里读研究生,能得到大师点化,一流科学家真传。你想经常与大师切磋么?你想与久仰的大师朝夕相处么?你想时刻聆听大师的教诲么?你想让大师指点迷津么?你想成为明天的大师么?报考中国科学院,走近科学大师!  (全文…)

标签:,

[zz]学院统一安排的实习~~

星期四, 七月 12th, 2007

转载学院一位同学博客上发表的文章,关于我们八月的实习:

地点:四川华迪信息技术有限公司(创立于2003年12月15日)
为期时间:8.28至9.6,为期10天,夏季
上下班时间:上午9:00分—11:50分,下午14:00分—16:50分
工资:¥0.00
加班费:¥-2.00/小时,作为超额使用电脑的费用

(全文…)

标签:, ,