学术人生 | 在人工智能的赛道上奔跑
2019-06-28

编者按

5月18日,2019 ACM 中国图灵大会在中国成都召开。大会期间,全球著名计算机视觉专家、统计与应用数学家、人工智能专家、马尔奖及赫尔姆霍茨奖获得者朱松纯教授受邀与众多青年学子见面,并分享科研经历,解答成长困惑。

本文由胡君整理,以朱松纯教授自述的角度,展现和分享其在见面会上的个人经历和人生感悟等话题。并于2019年6月发表在“视觉求索”与“暗物智DMAI”公众号。

朱松纯教授在ACM中国图灵大会上与青年学子谈话
阴差阳错,走上人工智能求索之路

1986年,我考入位于安徽合肥的中国科技大学(顺便说一句,那一届有20来位高考理科的省状元上了科大,社会上,科大就单指中国科大)。科大是科学院的直属单位,1979打开国门后,最早一批教师出国进修,科学院就给了科大很多名额。随着这些出国进修的教师陆续回国,他们开设了一些比较前沿的课题,学科设置在当时国内大学中算是走在最前端的,也率先接触到了不少西方的思想,同时在科大形成了出国留学的风气。

我记得,当时高考志愿填报的是现代物理学。我当时对物理大一统理论非常向往,觉得应该投身到这一伟大的事业当中去。但我填了志愿后回到小镇,我哥哥就到学校把我填的志愿划掉了,改报了计算机专业。要知道,上世纪八十年代,我们根本没有见过计算机,用于科学计算的穿孔纸带编程模式才刚刚退役。大家还在谈论多少吨重的大型机、中型机、第一代至第四代计算机。现在,这些都是过时的古董了。

80年代末,微型计算机(personal computer)在中国刚刚兴起。其实你们今天选人工智能专业跟当时我选计算机专业情形很类似,都是方兴未艾的领域。最近几年,一些学生家长经常问我,尤其是我一回到老家,家里的亲戚朋友就把孩子带来见我,问我小孩以后怎么发展?

我觉得,今天你们在座的都是学计算机专业的,是否选择人工智能很有可能是你人生发展的一个分水岭。人工智能还有大量未知的问题,它的发展潜力无疑是巨大的。人的一生往往只有几次重大选择的机会,入错行有可能成为人生莫大的遗憾。

我以前问计算机系的同事,当然他们不喜欢听这个带有挑衅味道的问题:“为什么要有一个计算机系? 你看看,有电话机系、电视机系吗?”

计算机学科里面有很多问题,但你要看什么是最大的问题,哪里是未开垦的土地。我认为,人工智能就是最大的问题、最有潜力的领域。我在大会报告中特别提到,人工智能的发展会极大冲击传统的计算机科学,尤其是在知识表达、算法设计与分析、操作系统、网络通讯、编程语言、体系结构与芯片等领域,这些领域都要向新兴的概率统计范式转型,需要以新的视角来研究大量与人工智能相关的课题。

三十年前,我开始学人工智能的时候,这个行业还处在漫长寒冷的低谷期。但我看到了一个大的局势,现在我做的很多科研问题,其实在我读大学后期就在思考了。下面我简略讲一下我是如何找到一条路径的。

发现科研的大趋势,找到人生的长赛道

上了计算机系,我到底要学什么呢?科大当时是五年制,我们前两年就是学一些数学、物理等基础课程,其中包括一些现代物理的实验课。我记得班上有同学一边做物理实验,一边骂道:我就是来读计算机的,你让我做这些个物理实验有什么用?社会上有人在谈计算机的各种配置和修个人电脑的技术,说得一套一套的,很实用。班上不少同学比较困惑,觉得自己堂堂计算机系大学生(那时候,大学生还是很高的称号),怎么不如修电脑的。

记得大学二年级的时候,我曾召集班上同学与系主任有过一次对话,主题就是我们计算机系的学生到底要学什么。系主任说,嗨,咱们科大的学生就不要去学那些卖电脑、修电脑的知识,要思考科学前沿的问题。当时,老师有个安慰我们的说法,我们都将信将疑:科大培养的学生,是老狗爬墙头,有后劲!现在回头看,这些数学、物理课程我们班上大多数同学都没用上,因为他们不搞前沿的科研,但于我而言,至关重要!

之后,我大部分同学还是去搞实用的东西:算法、编程、系统、网络等等,那时候还没有出现“码农”一词。我觉得,这些计算机的核心问题虽然是很有用的工程问题,非常重要,但都不是未来科学发展的大趋势。我一进大学就在寻找一个比较深刻的专业,一条很长的赛道。

其实,你们每个人都要找到自己的一条赛道,这条赛道最好能够让你跑几十年。如果你前面的赛道跑几年就到了尽头,跟别人拉不开差距,而后又要转型去跑其它赛道,这似乎不是明智的选择。可惜,绝大多数的大学生,临到毕业了都不知道自己要做什么。

当然,那时候大家也知道,最难的问题就是脑科学,也就是人脑计算的机制。人脑的智能是一种现象,表现在各种层面,但当时无从着手。怎么去定义这个问题?更不要说想搞一个简单统一的框架去解决人工智能。当时的我,就跟屈原写《天问》的心境那样,内心有很多疑惑,充满了好奇。

那个年代还没有互联网,图书馆里的很多书和期刊都是过时的,美国开学术会议,我们都不知道。也是从那时起,我开始大量阅读神经科学、认知科学等方面的书籍,选修了一门外系给研究生开设的人工智能课。一次偶然的机会,我读到一篇期刊文章,是科大生物系一位老师发表的,文章本身不打紧,我惊喜地发现了可能是中国当时最早甚至是唯一的认知科学实验室。我就写信给这位老师,请求去实验室实习,这位老师也很高兴有一位计算机系的学生对他们感兴趣,就接收了我。

我曾经写过一篇博文《初探视觉的三个源头》,文章中提到过计算机视觉的一大源头是David Marr(马尔),他的一本遗作奠定了这个学科的格局。我在认知实验室干了一学期,放寒假的时候(记得是1988年底),这位老师借给我David Marr这本书的中译本,让我回家读一读。正是这本书为我打开了科学殿堂的大门。以我当时的功力,根本读不懂这本书,但我知道,这就是我要投入的事业和科研赛道。后来,我研究的第一阶段的工作,就是与合作者花了十来年,为马尔的思想建立数理模型,获得了2003年的马尔奖,以及1999年和2007年两次马尔奖荣誉提名。

▲ 朱松纯教授分享个人科研成长经历

我决定要学计算机视觉,但是当时中国还没有这个学科,那时候大家还没听说这个名词,没有人能指导我。我从科大毕业的时候,成绩在班上70人中排第二名,可以保送到中科院跟学部委员(也就是现在的院士)读研,但我放弃了去科学院的机会,因为这些导师都不是这个方向的。我就留在合肥读研,导师是陈国良教授。陈老师人特别好,答应让我自由选题,他也知道我就是浪费他的招生名额。几个月后,我干脆破釜沉舟,从科大退学了。因为以后如果能出国的话,要按学期交培养费用,而我家里显然是交不起的。那时候我父亲已退休,镇上的工作单位倒闭了,退休工资都没有了。

当时出国留学非常困难,科大学数理化和生物的同学,成批去美国名校读博士,但学计算机的同学根本出不了国。尤其是1989年后,政府收紧护照发放。申请美国研究生院的报名费也超出了我们的支付能力,要25美元到60美元,而中国80年代的月工资水平才50到100人民币,大概是10美元左右。

放弃读硕士机会,我也不想去找工作,出国留学也很无望。1991年底,我成了无业游民,一边读书,想些人工智能的问题,一边骑着自行车在合肥的大街上转,办出国护照。这是人生最黑暗的时刻,万念俱灰。

人生转折,敲开人工智能大门

当时,我不敢申请一流大学,只是尝试二、三流的大学。我记得1990-1991年期间申请了新墨西哥州矿业大学,结果还是被拒绝。后来,陈国良老师跟我说,你就不能试一所好学校吗,听说一流大学可以免除申请费。所以,我就填了哈佛大学的申请材料。

我把过去几年对脑科学、计算机视觉、认知科学、神经科学、人工智能等领域的一些思考,总结成三页纸的个人陈述,并且提出了一些表达理论和计算框架的设想。我相信,人工智能的现象虽然纷繁复杂,但这里必定有一个类似物理学的大一统理论。当然,这些不是我凭空写的,而是读了很多东西之后的感悟。

然后,我人生重要的转折点出现了。我的博士导师、哈佛大学的David Mumford教授,当时从数学系转到人工智能领域,从计算机视觉入手,想用数学的方法把这些问题弄明白。David Mumford教授看了我的材料之后,就录取了我,并且在读博期间提供全额奖学金。我记得1992年哈佛发放的每月生活津贴是1150美金,当时一美元兑换8.3元人民币。我自己学会做饭,把省下来的钱寄给父母,从那时起我开始供养父母。

现在回过头来看,感觉自己非常幸运。那时没有互联网,看不到外面的信息,我甚至不知道我的这个导师是谁。他原先是学代数几何的,在数学领域拥有包括菲尔兹奖得主在内的一堆世界顶级头衔,是一个传奇人物。当他在80年代中期决定转向视觉和人工智能研究时,我听说他把全部的数学书下架,放在走廊让别人拿走,再也不看了。而一些数学家来访,他也不接待。

他重新开始学习概率统计。他是个新手,我也是个新手,他就带着我一起学习概率和统计,遇到搞不懂的问题,就去敲一些统计系教授的门,非常有意思。

▲ 2007年,导师 David Mumford70岁寿庆时,于罗德岛合影

当时适逢人工智能由逻辑向统计的转型期,而我们抓住了这个机遇。现在,人工智能所有的研究方向都是运用概率和统计,而我们是最早把概率和统计引入计算机视觉的。现在很多深度学习里面的模型和算法,也是简化了我们的一些工作,这一点,以后我会专门撰文来澄清。

我以前讲过,计算机视觉其实是人工智能的大门。人脑皮层大约70%都在处理视觉信息,没有视觉,人工智能就只是停留在符号推理的范畴,无法研究现实世界。博士毕业后,我跟导师去布朗大学读了一年博士后,在那里继续学习应用数学。我认为,打好数学功底让我很受益。

直到现在,我还在不断地往纵深处扩展,从视觉到认知,到统计学习,到语言理解与对话,到机器人,到AI,再到人文科学。也有幸领导了一些大的跨学科合作项目。这是我在大学时代根本不敢想象的。

摸清方位,脚踏实地留下人生轨迹

现在有很多人对人工智能感兴趣,但是从哪儿开始着手呢?我给大家提两个建议,首先是摸清方位,在人工智能热潮中找到地图。从哪儿开始学习很重要,否则就会盲目。今天这个领域热起来了,就一起挤进这个领域;明天那个算法火了就涌过去,这是现在很多学生的通病。其次,在人工智能领域做研究,还要有小切口大纵深的态度。西方科学一个重要的哲学思想是归约,就是把大问题分成小问题,这是他们的思维方式。但是,解决小问题的过程中还要时不时抬头看看大局势,不要迷路了。

如果你定位是做学术研究的话,就先不要着急动手干,更不要先想着去赚钱,而是要带着好奇心,试图理解、琢磨问题。当你看清楚大局,脑中有了战略地图后,你就见怪不怪了,就不用每天为层出不穷的新闻和新生事物而慌张。

大家都知道做科研要有定力,而定力其实来源于对大局的认识和坚定的信念。胸有成竹,心中不慌,才能够坚持做自己的事情,跑出一条赛道来。

这么多年来,我发现一个规律,就是很多名校出身的高才生,最终并没有什么大的成就,反而是一些天资稍微差一些的学生,能够做出成绩。越聪明的学生机会越多,而好的机会越多,他们就越难定得住。选择了一条赛道,做了两年之后就放弃了,换一条再做两年又放弃了。这就是为什么有些聪明的学生刚开始比较出色,但是到最后往往难成大事。

我的学生里面,在科研方面让我感到欣慰的,大都不是顶级名校出身。

我一直以来都很欣赏的一位学生,叫吴田富。他是一个大专生。其实他人很聪明,但是一到考试就考砸,高考失利上了大专。他内心想做科研,很多人会问:那你都到了读大专的地步了,这辈子还有什么机会做科研呢?

2005年底,我在UCLA收到了他发过来的一封很长的电子邮件。他在邮件里讲述了自己的经历,说自己读了很多文章,但依然有很多困惑,他想不清楚。

我每天都要收到好几封学生求学的邮件,大多数就是直接问能不能读研究生,还有很多邮件是撒传单式的,我都直接删除。

他的邮件不同,没有谈考TOEFL、GRE要留学的事,仅仅提出自己思考的问题,就像我1991年申请研究生院的个人陈述。我读完很感动,仰面沉思。恰好那年,我在老家湖北鄂州成立了非营利性机构——莲花山研究院,给中国很多研究生提供了一个学习计算机视觉的平台。于是,我在邮件里问他愿不愿意去湖北看看。

他当时并没有立刻回复。一个多星期之后,莲花山研究院的工作人员给我打电话,说是有一个人拉着行李箱来报到了,那个人正是他。那时他在深圳公司的年薪也有十来万,而研究院每月只发放2000元生活补贴。他一门心思要做科研,带领其他研究生做课题。他在莲花山做了两年之后,我就给UCLA的院长写了一封信,要求特批他来UCLA读博士,至于TOEFL、GRE,能考多少就算多少了。

后来他在这个领域发表了一些颇有影响力的文章,敢啃硬骨头,比如 top-down/bottom-up 算法调度问题, 就是大家说了几十年但是没有人敢去做的事。今年的CVPR大会,他发表的论文是关于与或图网络AOGnet结构的,把其他的深度学习网络结构,包括ResNet、DenseNet、DualPathNet等都比下去了,而且有很好的可解释性。吴田富现在在美国做助理教授,他的身上有一种难能可贵的精神,就是不受外界干扰,把做科研当成人生乐趣。我讲这个例子,就是想告诉大家,只要你心中有科研,找准定位和方向,坚持努力,自然会有人帮你,也一定能有一番成就。

▲ 2016年,朱松纯与吴田富(右)在家中交谈
找到信仰,支撑人生,坚持奔跑

我在老家鄂州看到,很多人到50岁左右就已经内退。不少人白天打麻将,晚上跳广场舞,在小城市生活得也挺惬意。

在座的各位都是名校的高材生,肯定是有追求的,但是估计对于要追求什么,可能挺纠结的。其实,我的科研之路能够坚持至今,信仰和价值观起到了重要作用。

人活一世,我们活着到底是为了什么?这是一个哲学问题,肯定有很多聪明人想过这个问题。那么做学问的人,又是为了什么呢?我下面引述两个人的观点。

1919年,也就是100年前,爱因斯坦在Max Planck(量子理论的奠基人、1918年诺贝尔奖获得者)60岁生日时有一个讲话,这一点我在《文章千古事、得失寸心知》一文中也提到过。

爱因斯坦说,建造科学殿堂的有三种人。第一种人,他们具有超常的智力,做科研就是他们的强项,能使他们得到快乐、满足抱负。第二种人是出于纯粹功利的目的,他们把科研当做一个营生,就是用脑力劳动来换取经济利益。而第三种人,他们做科研就是想逃避生活的痛苦和悲催,来到宁静的山顶,用简约的语言来勾画和描绘这个世界。做科研的目的就在于理解这个世界。在我看来,“理解这个世界”是科研的最高境界。

另外一个人是胡适,他是1919年五四运动的学术领袖。他有一篇文章叫做《我的宗教:不朽》,提到中国人都是无神论者,不信宗教,也不信天堂、地狱、来世这一套。那信什么呢?他追求的就是一种不朽。古代有所谓的人生三不朽:立德、立功、立言。人都是向死而生,每个人都面临死亡,唯有思想可以不朽。

在《文章千古事、得失寸心知》一文中,我提到人生黑洞。绝大多数人都会掉入这个人生黑洞,死后一切信息都传不出来。只有极少数人,想从这个黑洞中逃逸,达到不朽。

现在的小孩有电视、作业、网络、游戏等打发时间,估计都来不及去想这些问题了。我小的时候,农村常常没有电,一到晚上就四处漆黑,我就十分恐惧死亡。在当时困苦的生活条件下,也见到了很多大家族里面的人间悲剧。

现在,我一方面希望继续探究科学的未知,去描绘整个人工智能领域的地图和框架,这是我学术上的追求,在山顶练功;另一方面,我也希望通过运用人工智能技术,为提升人类福祉而努力,这是为什么我要创立DMAI公司,想到山下做一番事业。

这大概解释了我这么多年来一直在人工智能赛道上奔跑的动力,也是我的个人信仰。

我由衷地希望,这次分享能对在座的各位有所启发,让你们中的一些人不要慌张,真正沉下心来,利用人生最宝贵的读研阶段找到自己的定位和赛道,跑出精彩的人生轨迹!

上一篇
人工智能时代如何进行职业规划?听听AI大咖怎么说
下一篇
暗物智能:打造强认知AI,让“虚拟教师”成为现实