算法老司机癸卯年社会服务工作回忆录
发布时间: 2024-02-29 浏览次数: 10

过去这一年,除了日常的教学与科研工作,我还做了不少以算法为主题的社会服务工作。趁着年末静心思考,我简单总结了一些有意思的共性要点,希望对大家有参考价值。


一、研究生篇

作为大学教授,我工作的常态是和学生打交道。我自己名下有很多研究生,有时候做完学术报告也会有不少学生加我微信,还有同行朋友会安排我指导他们的研究生。过去一年,我在指导学生撰写学术论文与学位论文上做了不少工作,指导学生的人次累计达三位数。接下来,我将分享一些经验。

1. 主观能动性与按期毕业的矛盾

研究生都是比较聪明的年轻人,也是比较有探索和尝新积极性的一代人。因此,在刚读研究生的时候,孩子们经常尝试各种技术的学习和应用,特别喜欢在实践中验证自己的一些方法,无论是学到的还是原创的。在这方面,我名下的研究生表现最为明显,一般保送或者考上我们实验室研究生的孩子都是比较优秀的,无论是知识基础还是动手能力都是杠杠的。但是,作为导师,我也看过很多孩子在最后一学期为学位论文工作而忙碌和焦虑,大多源于在之前两年多时间里没有为学位论文工作做好积累。因此,每年寒假总有研三的孩子突然很喜欢跟我讨论研究,追着让我快速甚至是秒回复他在研究上的问题,因为学生希望能按期顺利毕业,但又感觉自己可能做不完研究或者做不好研究。更有甚者,一些孩子是等到研三才明确选题,也就是在这个时候才收心考虑自己的学位论文主题。不过,孩子选择和我多讨论是好事。我一般都会劝他们不要太焦虑,以我的水平指导他们写学位论文还是可以确保他们顺利毕业的。事实上,每年我也是以这种方式让不少学生顺利毕业。每次答辩通过后,他们都会迫不及待地感谢我,还叮嘱师弟师妹要从研一就开始听导师的指导。然而,研一的孩子基本都喜欢按照自己的思路体验生活,听了师兄师姐的建议后,只觉得反正研三最后有导师在,只要抱抱佛脚冲刺下就可以毕业。我很感谢孩子们对我能力的信任,但我还是希望带着有为的年轻人多做一些国家和社会需要的研究工作,而不是用自己的智商来支撑每个抱佛脚孩子顺利毕业而已。

建议:研究生尽早向导师请教研究经验,规划好自己的学习和研究工作,可以探索和尝试自己感兴趣的工作,但不能荒废学位论文这个主业。另外,不是每个导师都像黄老师这样可以秒回研三学生提出的各种技术或非技术问题。

2. 对老师的建议阳奉阴违的困局

研究生在做研究的过程中经常会遇到各种技术问题,如果他们问我如何解决,我一般都会给一些适合他们接受的建议。但是,我发现不少孩子会表面答应接受老师的建议,事后又不当一回事,还是按照自己的想法去做。等到最后研究做不下去了才跟导师说,导师也懵了:“你怎么没按照我的建议去做?”学生说:“我还是想试试自己的想法,只是没想到试了那么久都不成功,老师您有没有可以快速成功的方案,我想按期毕业。”一般遇到这种情况,我都很无语,不过,还是要考虑怎么帮孩子们。我跟学生说:“孩子,当你拒绝我的建议时,也要告诉我。尝试自己的想法是很好,但还是要把你的选择告诉导师。”在我们实验室,研究生做的课题都不是容易攻克的技术主题,靠学生自学或者复现别人论文的方法是很难达到预期目标的。导师的建议一般都是比较有经验基础的,也是有实力作为支撑的,而学生不太重视这一点,反而会觉得导师不一定熟悉自己感兴趣的技术主题,因而放弃导师的建议。我个人觉得无论是否接受导师的建议,都要保持沟通。科学研究没有对错,只有真相。

建议:多和导师讨论自己的研究课题,研究工作不是本科生做作业,及时沟通是很重要的。无论是否按照导师建议的方案开展研究,都要明确告诉导师你的选择,遇到困难及时找导师。我们实验室的孩子很多地方做得不太够,但是研三毕业有压力时都会及时跟我分享这个压力。感谢孩子们的信任,但在以后的工作中,你们的老板也许就不一定会喜欢你们这种信任了。


二、学术同行篇

这里提到的学术同行不仅包括和我合作写论文的研究生,还泛指一切跟我交流学术研究和学术写作的老师和学生。大家可能会觉得大学教授已经可以不在一线做研究和写论文了,但我觉得自己反而因为研究经验丰富了,所以每年做的算法学术研究与学术论文撰写工作还不少。过去一年,我参与过的论文超过170篇次(同一篇论文可能有多次修改和探讨),在这里也总结一些可能对大家有用的要点。

1. 侥幸心理要不得

我一般会对学术论文的修改提很多意见和要求,主要是源于自己多年来担任国际学术期刊副主编和审稿人的职业病,当然也有自己被审稿人虐了20年的经验总结。但是,一些老师和学生们不一定对我的建议买账。最常见的说法是:“我看别的论文都没有这么要求,为什么我一定要按照这个要求写呢?”更有甚者会直接说:“黄老师一定是不熟悉我研究的领域才会提出这种要求。”无论说什么,反正就是不想按照我的建议修改,对审稿人的包容怀有幻想。多年来,我亲眼看到因为作者不愿意落实写作上的修改,导致本身很好的研究工作从尝试投顶刊但被多次拒稿,沦落到投三四区的不知名刊物,甚至最后不了了之。

建议:学术论文的发表是交流分享学术观点的一种重要形式。因此,我们要很严谨地对待学术论文的写作,千万不要有任何侥幸心理。黄老师看出来的问题,审稿人大概率都可以看出来;黄老师会包容你对问题的态度,而审稿人不太可能包容你的这些问题。

  1. 选择大于努力

学术论文的选题至关重要,但很多人往往不太重视这一点,总是想做完实验,得到好的结果,然后再写论文报道这个结果。在学术界,针对一些热门话题,很多人会跟风式地发论文。国内普通大学的科研团队在做这类跟风研究时一定要慎重,毕竟咱们不太可能像一些国际级别的团队那样有充足的资源和机会来快速生产和发表这类学术成果。因此,学术研究的选题是做研究的首要工作。像算法类的研究,千万不要认为只要看很多论文,然后找一些改进的点,就可以作为研究主题。这样的技术改进论文很难体现原创价值与学术贡献。有不少同行把论文给我修改,我看了主题之后会告诉他们:这个题目不太讨喜,想发表顶刊是有压力的。除了选题要慎重之外,科学问题一定要清晰,一定要明确写这篇论文是为了分享针对哪个科学问题的观点,千万不能含糊。不过,我一般都会将错就错,用自己的智商还是硬着头皮帮忙把论文修改到有那么点意思,毕竟要珍惜大家对我的信任。这年头,信任真的来之不易。

建议:写论文时,要以分享学术观点和科学发现的态度去写,而不是为了汇报自己的技术工作和实验结果。选择一个读者感兴趣的主题,分享自己的观点比做实验和强调结果的优势更加重要。

  1. 坑一般都是自己挖的

虽然写学术论文是抱着分享观点的态度去写的,但毕竟学术是严谨的,one paper one selling point。分享的观点一般要凝练和严谨,不能太随意。有不少同行在写论文时容易把观点写成自己看过的论文里面的观点,觉得这种观点更安全,殊不知人云亦云是没有原创性的。还有同行会写一些笼统的观点,例如算法通用性比较好、算法达到了精度与速度的平衡、算法有一定的优势、算法有竞争力等。从口头汇报的角度来看,这些观点是没有问题的,但是在书面的学术论文场景下,这些观点其实有无数种理解,导致这些观点是无效的。这两种问题往往会成为论文被拒稿的主要原因。还有一个很常见的问题,一些同行特别是研究生会把观点集中在实验结果上,例如认为自己的算法是求解某个问题最有优势的方法。这个观点其实本意没有错,错就错在结论超越了实验对象和测试集的范围。因此,审稿人看到这种观点后往往会要求对比各种算法,补充各种测试集。其实,这些坑基本都是作者自己挖的。

建议:观点的陈述要具体、详实、准确、严谨,并且这个观点在论文中要有论证或者实验结果验证的支撑。不要写没有依据支撑的观点;可以用别人论文里的观点,但不要作为论文的结论;不要混淆实验结果和研究结论。


三、企业篇

熟悉我的朋友都知道,我对于算法技术落地应用比较感兴趣。因此,每年我都会花不少时间和精力在算法应用的社会服务上。过去一年,因为有团队几位博士和全职助理的得力支持,我以技术咨询和算法设计的方式支持了50多家企业的工作。

  1. 时间比金钱宝贵

去年我技术支持的时间最短不超过1分钟,破了多年的记录。7月份学校组织了天河区20多家企业来实验室参观交流,我一个人“舌战群儒”般地回答他们车轮战般的技术提问。我记得其中一位老板问了一个3D打印算法的可行性问题,我只用了不到30秒就给了答案。那位老板随即起身跟我握了手,加了微信,并告诉我说,他已经从我这里得到了很有价值的答案,他觉得不用再耽误彼此的时间了,很感谢我。事后,为了表示感谢,他多次邀请我赴宴,都被我婉拒了。毕竟,我付出的时间不多,如果不需要我做什么技术支持,只是吃饭,我是

太想花这个时间的。虽然我们彼此之间没有达成什么交易,但我的建议发挥了作用,我已经很满足了。最关键的是企业家尊重我对时间的态度,没有浪费我的时间,我很感谢这一点。

然而,有一些人到我的工作室洽谈时跟我说:“教授,你跟我合作没有什么成本的,就是花点时间聊聊,喝喝茶,吃吃饭。”殊不知,时间就是我最大的成本。还有企业很不客气地给我列了一个清单,得到书面答复后还两次上门讨教,得到答案后满意得连谢意都忘了表达,搞得介绍人多次要请我吃饭答谢。我想,如果企业不是不满意或者经营困难,还是要适当地对知识进行付费。我自己满足于解决实际问题的成就感,但我的团队还是需要一些经济上的支持。因此,恳求各位老板非必要不要想着来“白嫖”技术,更别让我免费为企业的商业活动支持站台,这更加说不过去。如果是公益、社会紧急事件或者中小学科普,我是愿意免费支持的;但是在商言商,市场行为还是用市场价值来说话。

建议:洽谈和咨询都要先讲好大致的时间,毕竟时间是不可再生资源,就像我今天写这个推文的目的也是希望节省大家以后无效踩坑的时间。一些人觉得我的工作很轻松,应该有很多时间,但实际上我有时间就会思考我感兴趣的问题。如果你有需要我解决的技术或者研究问题,我会很乐意花时间跟你交流,但闲聊对我来说是一种奢侈。

  1. 学生能做的基本都可以在市场上买到

一些企业在做AI类产品时会急于找教授团队合作。我们团队一般都会对企业的规划、动机与实力做好分析,确定为他们提供的建议和方案。很多企业都存在认知误区,以为高校实验室的实力主要是源于优秀的研究生,这一点在我们团队是不存在的。

我经常会讲到“九年技术积累天花板”,即本科四年+硕士博士五年的技术积累是市场上技术人才的天花板。也就是说,企业需要的技术只要是九年积累以内的,都可以从高校招聘到,或者从市场上买到。因此,企业需要的技术是否可以由研究生来解决,取决于需要的技术层次和要求,当然,不排除清北上交的一些天才型学生可以突破这个天花板,但毕竟凤毛麟角,不是社会的常态资源。曾经某个知名通讯龙头企业请我设计了两个算法,效果显著,该企业就萌发了招聘我们团队研究生的想法。连续三年从我们实验室招聘了五个学生,年薪都给了40+w/年,结果去了该企业后在算法设计上没有达到企业的预期,学生说:“我们实验室关键算法的设计都是黄老师搞定的,我们主要负责实现。”后来,学生都转岗到后端开发了。还有朋友找我合作,怕耽误我的时间,就找我的研究生去做算法,结果三四个月过去了,连数据模型都没搞清楚。后来这个朋友找我讨论了一次,发现我这个教授还是有用处的。由此看来,社会对教授的一线工作能力存在不少误解。

建议:企业要搞清楚自己需要的技术层次是多少年功力水平的,九年以内的都可以找各类学生解决或者从市场采购;10年以上的就要找高校院所有实力、有经验的团队合作;超过20年的一般要找资深专家。我本人在算法设计与分析能力上有超过20年的经验积累,欢迎大家找我这个算法老司机探讨有难度的技术问题。

  1. 老板格局与工程师视野之间的矛盾

在做企业技术咨询与技术支持时,有时候会遇到格局很大的老板,他们有抱负做一些大事业,例如AI应用的突破。但是,在落实老板的部署时,工程师往往会局限于自己的技术栈和研发的习惯。在这里,我需要提到一个常见的误区,老板很可能长时间处于这样的困局中。

工程师过渡依赖于开源技术或者学术论文的工作复现,这可能是在研究生阶段养成的一种习惯。企业老板希望公司有原创思维和自研技术,形成特色优势和壁垒,而手下的工程师则严重依赖于复现论文的方法。记得企业家任正非曾经讲过:卡脖子的原创技术都不是从发表的学术论文里找到的。这其实不是否定学术论文的价值,而是说通过复现学术论文实现的技术方法,别的企业的工程师也可以实现,可以作为技术手段,但是无法形成原创技术的优势。我们可以用好开源技术和论文方法,但是在遇到新的技术问题和研发需求时,除了复现方法,更应该分析问题,设计自己的方法来实现技术突破。我在做技术咨询时一般会重视引导企业的技术人员做好此项工作,当然,这需要企业领导的重视,老板有格局,也要工程师有相匹配的视野。不幸的是,很多企业的工程师总是局限于自己狭隘的思路,甚至一些技术路线有本质缺陷也不愿意更换,只是希望我在他错误的技术基础上提出修改建议,效果可想而知。

建议:企业的老板需明确企业在AI技术方面的定位。如果是快速应用,那就强调产品设计和商业模式,技术团队的组织除了强调复现能力,还要重视原创思维,重视解决问题的目标,而不是解决问题所采用的技术方法。在这个世界上,并不会永远有现成的技术来解决企业遇到的所有问题。如果有,那这家企业的技术优势是什么呢?你有,别人也有。


四、报告篇

过去一年,我在线上和线下一共做了近60场报告和讲座,几乎每周就有一场。其中,有几个主题是大家比较感兴趣的。

 “微搜索算法及应用”是今年汇报最多的学术报告,有90分钟的长版和40分钟的短版,还有企业版。毕竟这是原创的智能算法设计方法论,吸引了不少关注,加上有不少应用案例,大家评价颇高。好几次大会报告都超时了,当然都是被要求延长报告时间,最严重的一次是超时30分钟,被学术大佬点名了,不过被点名后还是被表扬了一下。超时的习惯并不好,从2024年开始,一定不能超时了。在做报告时,经常有一些同行粉丝在现场帮我拍下美照,本人并不上镜,愿意把镜头对准我的都是我应该珍惜的,在此表示感谢。

 “高效率算法设计与分析”是我最满意的学术与教学结合的讲座主题,本来是应CCF领航计划的邀请、面向全国大学生做的线上讲座,结果被全国的孩子们投票到排名前三,我也收获了一枚“领航者”奖牌,倍感光荣。之后有好几个组织与学校邀请我做线下报告,每次作报告时大会议室都坐得满满的,讲完之后还与听众有不少互动,收获也满满的。感谢我的好朋友黄书强教授的邀请,使得我这个报告提早了一年面世。

 “从知识的表示看人工智能”是我今年做了最多次的科普类讲座,一般是讲1-2小时,根据听众的情况来安排时长。GPT面世后,大家对AI替代人类工作以及大模型技术很感兴趣。我也因此上广东卫视做了一次科普节目,还在学界、工业界做了十几次这个主题的讲座。印象最深的一次,莫过于在小米主办的活动中与我的偶像金连文教授同场做了一次报告,那次报告的PPT也是定制的,我没有再讲过第二次。每次讲完报告,我都跟听众说,可以忘记我讲的内容,但是大家都记住了“人工智能的本质是知识的表示”,我心足矣。

还有其他关于研究生如何培养、年轻教授如何走向成功、学术研究如何开展、学术论文撰写经验等等,也是大家很关注的主题。我把其中一些讲座变成了讲义,制作了数字人,准备在2024年开放线上的讲座资源,让更多有需要的人受益。

2024年,我对自己学术报告和讲座的要求就是:不管组织者或者主席的要求和建议如何,都不要再超时。请大家共同监督。


总结到此结束,希望大家在新的一年有更大的收获。我是黄老师,一个喜欢研究算法、用算法解决问题、愿意分享收获的“老司机”。感谢关注智能算法研究中心的工作,期待未来有机会合作。



总编:黄翰

责任编辑:袁中锦

文字:黄翰

校稿:何莉怡

时间:202425