研究生期间如何成为科研大佬?

作者 |  叶小飞@北美奔驰研究员 

整理 | NewBeeNLP

由于不清楚小伙伴们的研究方向,以下分享只针对ML/DL/CV/NLP方向。

先泼个冷水,如果你本科积累不多,也不是天赋异禀,硕士成为真正的科研大佬是不太可能的,成为“灌水大佬”倒是有可能。因为在我看来,只有真正做出能对学术界与工业界有很大启发的研究作品的人才能被称作大佬(比如搭积木提高一两个百分点就别拿出来吹了吧。。。),而没有很多积累与好的指导是很难做到的。

我在北美研究生一年零三个月期间零基础入门计算机视觉,发了两篇还可以的应用向ML论文,毕业后还在湾区找到了待遇不错的算法岗位。按照我下面这套操作来,可以让你三年硕士期间 进可发质量不错的文章,为读博铺好道路,退可毕业后进入工业界拿到不错的offer。 

第一阶段:确定大致研究方向

进实验室之后第一步一定是先大概了解师兄师姐们都在做什么,同时和老师聊一下他大概希望你做的课题方向。也许这个方向并不是你最后的方向,但是会让你大概有个sense。

只有你知道了实验室做什么,你自己可能做什么之后,才能针对性地夯实基础知识。比如你们实验室一直做联邦学习,那么你去恶补太多CV方向的知识用处就不大,毕竟CV在这里只是一个应用场景,并非主体。同样,如果你要做Visual Question Answering, 那么除了CV,你还要弥补NLP方向的知识。

第二阶段:基础知识恶补

如果你对自己将要研究的领域所知不多,我很不建议一开始就啃论文,在你没有基础的情况下去读各种最新的论文就像啃天书,事倍功半。

举我自己的亲身例子,我在CV领域读的第一篇论文是supervised descent method for face alignment. 当时我也不懂SIFT,也不懂PCA, 也不懂gradient descent, 花了很久也没搞明白,后来把相关课程恶补一下之后,结合着代码很轻松就懂了。

所以在最初的三个月强烈建议多上些网课,针对性地弥补基础的理论与相关的编程知识。这个阶段不需要花太多精力深挖理论,大概知道怎么回事即可,所以找的网课尽量以应用为主,先找到些感觉和自信再说。

对于刚入坑CV的小伙伴,我一般强烈推荐“三件套”网课:Coursera Andrew的深度学习系列课程,Udacity 的intro to CV(在这里你能学到图像处理最基本的知识)以及MIT老爷子著名的线性代数。

第三阶段 大量阅读文献/代码+帮师兄师姐打杂

这一阶段我个人认为是成为“潜力大佬”最重要的环节。只有你文献读的足够多,才能判断出自己的方向是不是个坑,自己的idea是不是别人都做过,并最终提出一个改进前人工作的idea。这一阶段注意事项如下:

  1. 读文献是有技巧和优先级的,不要一脑袋就扎进去瞎读。具体优先级如下:

  • 近一到两年你大致研究方向的文献综述。这种综述一般会帮你把各种流派以及最先进的方法整理出来,读完后你会有一个大概的big picture

  • 近五年内该方向的经典著作(高引用,具有启发性的)。这类文章一般也有很多博客讲解,原文读不懂可以看别人的博客。

  • 带开源代码,近两年的顶会sota.

  • 无开源代码,近两年的顶会sota.

  • 对于质量较高的文章,强烈建议对着源码一起阅读。有些你看不懂的公式,读完代码就能大彻大悟。同时,学会把公式转化为代码也是一项核心能力。

  • 列个表,纪录你读的论文的名称、核心要点,你所看到的它存在的缺陷或未来可延伸的点。

  • 你在阅读过程中很可能会想到一些新的方向、idea,或者发现原来要做的方向是个坑,这个时候要多和导师沟通。导师都很忙,沟通前要做好准备。比如你觉得原来的方向不好做,一定要给出你读了哪些论文之后得出了这样一个结论,为什么是这样的一个结论,而不是说“我感觉这方向不行”。

  • 在你阅读文献的同时,主动接触你优秀的师兄师姐们,提出帮他们打下手。这个并不是为了蹭个四五作或者讨好同门,而是在这个时候你还没有经历过一次完整的科研,通过这种站在巨人肩膀的方式,你可以快速了解到做一次完整的科研是什么样的经历同时开始下手写一些实际的代码,最后还能蹭个作者,只要负荷不是太大,何乐而不为?

  • 除了你主攻方向的论文,相似领域也可以阅读。比如你是要做超分辨,那么图像去噪有很多论文可能也会对你有所启发。

  • 第四阶段 开始实验你的idea

    你从近乎零基础进行到这一步时,大概已有半年多一点了,这时候的你有了一定理论基础,完成了一些课程代码,并且阅读了大量文献和开源代码,和导师进行了几次讨论,这时候还留在你筐子里ideas很有可能是可行的,现在就需要把你的idea实现了。如果你还是无从下手,不知道该怎么实现自己的idea, 可以参考我这个回答的三四步(一二步你已经在第三阶段度过了)。

    • 对自己深度学习方向的论文有idea,可是工程实践能力跟不上,实验搞不定怎么办?1203 赞同 · 51 评论回答[1]

    当然,在这个阶段你也不必孤军奋战,可以寻找同组的小伙伴一起合作,你负责核心部分,他负责一些零散的部分,到时候挂他二作。同理,你也可以多找同组或组外的小伙伴主动寻求合作,作为辅助贡献一些,这是能快速拿到二三作的捷径。

    第五阶段 论文撰写

    当你的idea基本证实有效之后,就可以动手写论文了。都21世纪了,建议不要用word来写论文,强推线上多人合作版“LATEX”——Overleaf。一开始刚写论文的时候有几个误区特别容易陷入:

    1. 不列大纲,上来就开干。我发现很多认识的大佬都会把每一章节甚至每一段大概要写什么,论点是什么会先列上,这样写起来事半功倍。

    2. 第一遍初稿就极度追求完美,写的每一句话都斟酌很久,精心选词。第一遍如果过于注重语法与修饰,很容易写到崩溃,写了一周都没把前两章写完。一般来说,第一遍只要能把自己要写的大概内容表达清楚即可,甚至有些句子是由单蹦的词语组成也没事,后面一遍遍修改。

    3. 作图草率,稀里哗啦随便画。现在很多reviewer极度缺乏耐心,你图做的不好看基本就被判死刑了。

    4. 自己孤军奋战,不会借助外力。正如前面选题、读文献、实现idea一样,写论文也要学会借助外力。起了草稿之后,多多“骚扰”师兄师姐提意见,让他们帮忙修改(当然你要挂人家名字),然后差不太多了再找老师修改。

    另外推荐一个答主对关于如何写好英文论文的分享,我从这篇回答里学到了颇多。

    • 如何开始写英文论文?1 万赞同 · 164 评论回答[2]

    第六阶段 乘胜追击

    当你进行到这一阶段时,你已经投出去一篇一作,运气好的话还蹭到了同门的一到两篇论文。接下来就是如法炮制,你可以接着上一个idea做更深的挖掘,或者更高维度的挖掘(比如从图像超分辨到视频超分辨)或者换一个有些类似但又不一样的方向,接着开始下一篇创作。然后依旧要多和组里甚至组外的人合作,研究生期间一作能有两篇就很不错了,要想数量更多只有去给别人打下手,寻求场外合作。

    在这一阶段,我还大力推荐在继续攻克下一篇论文的同时,系统地提升下自己的数学+计算机理论知识。之前上网课对理论理解不够透彻,读论文则是容易只有碎片化知识,借这个机会对一些基础的数学理论和计算机理论好好系统学一下(比如概率论,凸优化,数据结构,算法概论),对你以后申请博士(很多老师看重你的理论基础)或者找工作(不懂数据结构你怎么刷题?)都有很大的好处。

    写在最后

    如果一切顺利,你的运气还不错,按我这几个阶段做下来后,在第三年开始不久,你已经投了/中了两篇质量不错的一作论文(读了大量文献+与导师同门经常沟通后的科研产物质量一定不会差了),N篇二三作,其实成果已经蛮不错了,这个时候最重要的是想好未来的选择。

    是继续深造读博士呢还是到工业界去工作?

    如果打定主意要读博,那么接下来的最后一些时间你就要把精力放在申请、connect上。如果你想去工作,那就要多刷题刷面经,凭借你硕士期间的这些产物,拿到面试机会不成问题。

    最后的最后说一点自己的个人价值观,我认为科研带来的最大收益就是它本身带来的纯粹的乐趣,千万不要为了灌水而科研,很难走远、走得开心。

    一起交流

    想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定要备注信息才能通过)

    本文参考资料

    [1]

    对自己深度学习方向的论文有idea,可是工程实践能力跟不上,实验搞不定怎么办?1203 赞同 · 51 评论回答: https://www.zhihu.com/question/348376942/answer/1923857788

    [2]

    如何开始写英文论文?1 万赞同 · 164 评论回答: https://www.zhihu.com/question/23684933/answer/125467391

    END -



    三大视角,聊聊我眼中的广告系统

    2021-09-06

    谈谈文本匹配和多轮检索

    2021-09-05

    跨越『时空』的难样本挖掘!

    2021-09-03

    2021 年各家大厂的 AI Lab 现状如何?

    2021-09-01

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/351978.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

野生瓜还是裂口瓜?

这是学习笔记的第 2404篇文章 最近刷视频的时候看到了《杀瓜》的片段,虽然我在豆瓣确认了下这电影的分数不高,但是里面有一段话感觉很不错: 瓜农陈草:“今年啊,我这地里的裂口瓜特别多,你说这是为什么呢&am…

清华NLP实验室刘知远:如何写一篇合格的NLP论文

Datawhale干货 作者:刘知远,清华大学,来源:大数据文摘 本文作者刘知远为清华大学计算机科学与技术系副教授 。刘老师总结了研究者在写NLP论文时常见的几类问题,并写成了这篇文章。除了对于NLP研究者,这篇文…

打开程序员心理B面,这些黑红话题他们亲自回应丨1024特辑

1024对于程序员的特殊意义大概只有程序员才懂,正如外界对程序员的刻板印象永远停留在“高收入”、“低情商”、“发际线”、“格子衫”等特殊标签上,无论是光环还是恶名,背后实际都藏着太多只有程序员才懂的无奈与辛酸。 不求被全世界理解是程…

让人瞩目的插画设计秘诀在哪?为你揭开3D辅助绘画技术面纱!

插画设计秘诀到底在哪?3D技术如何辅助绘画技术?今天,硅谷洞察(原硅谷密探, ID:guigudiyixian)有幸请来了疯景老师,并对他进行了一次独家的专访。希望可以对喜欢和从事插画的你们得到一些帮助和启发。 —— …

安卓不知道怎么学?看十年码农如何回答这个问题。

有很多朋友问过怎么学习 Framework,之前写了三篇文章,主要说的是之前开发应用的如何过渡到开发 Framework 。喜欢的可以通过下面的链接阅读。 Android 如何从应用深入到Framework (一) Android 如何从应用深入到Framework &…

对话南科大沈平:在人工智能开源中,高校能扮演什么角色?

2021-04-20 01:47:54 作者 | 陈彩娴 采访整理 | 刘冰一 2020年被称为深度学习框架开源的元年。 那一年,继百度飞桨之后,旷视开源天元(MegEngine),华为推出MindSpore,清华大学计算机系的图形学实验室也发…

创造天赋:达·芬奇的7种天才特质

心理学家与专业魔术师迈克尔格尔博提出了“达芬奇与众不同的7种天才特质”。他阐述为好奇心、悟性、艺术和科学、关联、开阔、细致和合作精神。然而,这些特质本身并没有什么超前性,它们却使达芬奇能够从不同的角度看事物,从而能够去思考不同的…

网络安全入门必学内容

随着时代的发展,经济、社会、生产、生活越来越依赖网络。而随着万物互联的物联网技术的兴起,线上线下已经打通,虚拟世界和现实世界的边界正变得模糊。这使得来自网络空间的攻击能够穿透虚拟世界的边界,直接影响现实世界的安全。 网…

时序数据库InfluxDB快速入门使用

推荐博客: Influxdb中文文档 linux安装influxdb Influxdb安装、启动influxdb控制台、常用命令、Influx命令使用、Influx-sql使用举例、Influxdb的数据格式、Influxdb客户端工具 1.安装 1、influxdb数据库官网的下载链接: https://portal.influxdata.c…

数据分析--Numpy初级(二)

Numpy初级 Numpy数组属性Numpy的routines函数 Numpy数组属性 Numpy数组的维数成为秩(rank),即轴的数量,一维数组的秩为1…。在Numpy中,每一个线性的数组称为是一个轴(axis),也就是维…

桶装水小程序怎么做

微信送水小程序是一款基于微信平台开发的送水服务应用程序,它可以帮助用户方便快捷地订购水产品,并且提供上门配送服务。下面我们来介绍微信送水小程序的主要功能。 一、商品展示 微信送水小程序提供了丰富的水产品展示,包括矿泉水、纯净水…

小程序开发同步缓存、异步缓存

目录 一、uni.setStorage(Object) 二、uni.setStorageSync(Key, Data) 三、使用 四、uni.getStorage(OBJECT) 五、uni.getStorageInfo(OBJECT) 一、uni.setStorage(Object) 将数据存储在本地缓存中指定的 key 中,会覆盖掉原来该 key 对应的内容&…

草图大师模型 sketchup模型下载 sketchup模型免费下载 SU模型下载

草图模型网提供最全面的SU模型资源下载,为广大sketchup设计师打造一个高精度实用SU素材库,有上万个sketchup模型,并且每天更新!让你更快的找到想要SU模型。像草图模型网,个人很少去这个网站模型较为过时,还有定鼎网、sketchup博客、3DNEW、谷歌草图模型库等等诸如此类的设计网站…

Tomcat部署

目录 Tomcat 什么是 servlet? 什么是 JSP? Tomcat 功能组件结构: Container 结构分析: Tomcat 请求过程: ---------------------Tomcat 服务部署------------------------- 1.关闭防火墙,将安装 Tomcat 所需软…

SU插件|TopoShaper生成地形 免费下载及介绍(SketchUp草图大师必备)!

TopoShaper(生成地形) —————— 插件基本描述: 这是一个生成地形的插件,常用于景观、建筑专业建模,从CAD或者其他绘图工具中制作好的等高线、高程点导入SketchUp,此插件可以快速使用线条或点云直接生…

sketchup 2018下载与安装教程

sketchup 2018下载地址: 链接:https://pan.baidu.com/s/1iH7gISr6sTJRRNFPzsIF0A 提取码:duf4 注意:安装之前应该检查电脑是不是64位的操作系统,本软件只针对64位操作系统。 安装步骤: 1.下载完成之后&am…

Enscape 出 Mac 版本了,适用于SketchUp 2021免费公测版,附下载地址

Enscape 宣布推出适用于 Mac 的 Enscape 免费公测版本,这是其流行的实时渲染和虚拟现实插件的新原生 macOS 版本,适用于建筑和 CAD 软件。新版本于上周的Envision 2021用户活动中宣布,将于 2022 年发货。跟着Renderbus瑞云渲染小编小瑞一起来…

SketchUp-2022版本

伴随着SketchUp Pro和LayOut的更新,2022年SketchUp迎来了一个新的时代,尤其是在新版本中,新增和改进了诸多的建模工具以及额外的搜索功能,以及增强了时间布局的效果,从而减少设计师们所消耗的时间以及操作流程&#xf…

STL-string-2

Iterators Capacity resize void resize (size_t n);void resize (size_t n, char c); Resize string 将字符串的大小调整为n个字符的长度。 如果n小于当前字符串长度,则当前值将缩短为其第一个n字符,删除第n个字符之后的字符。 如果n大于当前字符串长…

[操作系统]1.计算机系统概述

写在前面:这篇是为了复习基础知识准备的,而不是根据学校的教材走的,所以叙述有些出入的地方请见谅,该系列旨在快速梳理操作系统的基础知识和一些常见的问题点,知识框架来自于王道操作系统,后续有机会的话会继续补充 1.操作系统的基本概念 一个计算机系统可以自上而下分成四个…