原文链接:
https://www.xiaohongshu.com/explore/69f22aa2000000001a02c87c?xsec_token=AB7Mw_JAnWwUtuPwaicTBeUma18i2iKx0Gbpou2fGDewk=&xsec_source=pc_collect
两万人看过的“混进”算法岗后续
主包背景:
学历符合大厂要求,非计算机科班非天坑专业,半路转码
转码初始实力: - 高数线代很熟, - 数据结构本科学过但忘得差不多了, - 传统机器学习基础理论较好
转码耗时:
3 个月,日均 12h+ 学习时长(含周末节假)
面试历程:
3 月 1 开始投简历,最初从腾讯到不知名小公司无任何响应,遂知道硬实力不够,边学边调整简历,第一次约面小厂,体会到了真实岗位需求,锻炼了心态,后面针对性速补相关知识,持续约面,每一场利用面试官的提问和反馈调整自己的学习方向,强化自己的心态,不断 booststrap,最终拿到较为满意的 offer。期间所有约的面试都过了。
具体做法: 1. 理论篇:啃苏剑林博客,初看难看懂,能看一点是一点,看不懂的,到外面兜一圈学学其他的,回过头来说不定就能看懂了;苏神站的理解角度很高,读懂了苏神博客会有肃然起敬的感觉。读博客过程中跳转某些核心论文的核心部分,耐心读一下。 2. 项目篇:核心就一个 minimind,都说这玩意很拉,但一个简单且全面的项目,非常适合新手,没有垃圾的项目,只有枯竭的灵感,minimind 从 tokenizer 到 RL 后训练,全链路每个地方都能换一个任务魔改,minimind 涵盖了 LLM 主线流程的所有,挑一些地方找点最新的论文成果换上去,就多了一个项目,最终把简历写满看上去不那么空就行。 3. 力扣篇:hot100 数组类型的我都刷了3遍,不能泛化的题我直接跳过(所谓泛化指的是,刷 1 道只能管这 1 道,甚至还占用脑容量损害对其他题的熟练度,比如技巧题,LRU 缓存这种,50 道题全 ac 跟 100 道题全记个大概我选前者),剩下的题基本 2 遍。
心态篇:
说“混进”其实有点标题党了,我很能祛魅,全世界做 LLM 的除了头部天才,剩下的十篇 A 也好一百篇也罢,每年几万篇 A 会,大部分没法落地,普通 LLM 实习工作内容没那么高技术水平,而且这 3 个月我付出了很多努力,所以我积极约面试,回答面试问题也很愿意表达自己的理解。区区互联网打工人,进去缺啥补啥,反而更高效,有啥不能胜任的。
Misc:
- 苏神博客和 minimind 涵盖我这几次日常实习面试中涉及的所有 LLM 八股
- 力扣撕不出来不一定过不了,写力扣本质上是验证你起码写过代码,所以写出个大概,有思路即可,当然还是推荐最好 ac。面试中可以把暴力的做法口头介绍一下,然后自己动手写一个稍微优化的版本,此乃中庸之道
- 找的是日常实习,恰逢某些组缺人,所以没论文没实习面试表现尚可也进了,仅供参考