原文链接:
https://www.xiaohongshu.com/explore/697c7eda000000000b00b684?xsec_token=ABgOSjVfMqAuME_QwO1sP6O8iZaN1-s9_fOsaCx35TkgM=&xsec_source=pc_search&source=web_search_result_notes
北大研一 | 转码经验贴(0基础转LLM找第一段实习)
梳理下主包0基础转llm找第一段实习的学习路线,主包转码也是摸着石头过河,希望能帮到大家。
个人背景
- 本科:C9(深圳)通信本
- 硕士:Top2(北京)集成硕
- 有一点点408和C语言基础但似乎没什么用
- 无论文、无项目、无机器学习背景
一、基础学习
看李宏毅的机器学习到第四、五章
学习目标:
- 初步了解自回归模型,transformer结构
- 跳过作业,可以不必硬啃局部细节
- 初步有印象后结合项目和八股理解
方法:
- 动手复现并消化一个基础项目和相关知识点
- 全程不懂多问AI
二、RL进阶(想投RL方向可选)
学习资源
- 看《动手学强化学习》(看到PPO那章就行)
- 剩下的GRPO等知识点可以通过相关论文、博客等资料学习
需要理解的内容
- PPO/GRPO等RL方法的损失函数
- 交叉熵、奖励函数等公式和异同
实践
- 做一个强化学习的项目
三、代码能力准备
LeetCode
- 刷Hot100(刷题顺便就学了Python)
- 刷两三遍,看到题目就有思路了
- 难题/不会的别硬推,找一个自己容易理解的题解刷几遍,一般也会了
- 主包推荐:灵茶山艾府的题解
手撕
- MHA(MQA、GQA)
四、八股与资料推荐
推荐资源
- 猛猿的大模型笔记:学习transformer和各训练框架(megatron/deepspeed等)
- 苏剑林的博客
- 各家大模型的技术报告:DeepSeek-v3/R1、Qwen、GLM等
- 热点论文:如DAPO等
- 牛客上的面经
- 根据面试官的提问补充
- Gemini老师
五、开源项目推荐
基础项目
minimind
- 特点:上手项目,易上手DIY
- minimind-v可拓展到多模态
nanochat
- 特点:苹果项目,更新颖更精妙
- 缺点:不好DIY
学习目标:
- 了解LLM各训练阶段
- 学习项目代码和相关八股(transformer的结构,RoPE,LayerNorm等组件,大部分是了解概念即可,不需要会手撕的)
- 数据集:▲数据集可能项目已经准备好了,但了解数据集如何选取、清洗、构造、混合蛮重要的
- 可以用wandb记录
进阶项目
RL方向
- Tinyzero
- medicalGPT
学习目标:
- 理解GRPO
- RL奖励函数的构造(基于规则/模型)
- on/off_policy
- verl训练框架等
生成式推荐方向
- minionerec(仅供参考)
主包后期接到小红书和京东的社区/平台搜索算法面试,于是突击复现minionerec项目和相关八股论文,虽没给offer但面试官反馈这个项目很好。
六、关于项目的时效性与创新点
项目时效性
- 好项目出来第一时间复现是眼前一亮的
- 比如minionerec刚发布时复现,感觉相关岗位面试官都很认可
- 但minimind主包身边看到很多简历都会有一个,建议可以与时俱进
创新点
问题:如果只是复现并消化了开源项目,眼尖的面试官会发现你只是跑了下别人的代码,而且没有可量化的结果。
解决思路(主包的尝试):
- 先在一些评测集上跑个指标(或者更简单点让大模型打个分)
- 然后尝试换更好的数据集/RL奖励规则/blabla
- 最后再跑个更好的指标对比
- 那就引入了一个创新点并得到了一个可量化的提升指标
- 妙哉妙哉
七、时间线
- 9.20:跑通minimind,boss上开始投中小厂
- 10月国庆:边投边跑通tinyzero
- 国庆结束:开始面北京的中小厂和一些大厂
- 以RL/后训练岗为主
- 少量多模态、基模和LLM搜索方向
- 11月初:拿到目前的offer
- 入职前把手头其他流程都面完了(许多无后续)
- 虽不是大厂和计划中的RL,但主包挺满意的,先沉淀下
详细过程主页往前翻就好
八、碎碎念与经验总结
关于找实习的机会
- 有熟人内推/缺人/时间点合适,找实习会容易不少
关于项目数量
- 推荐做两个项目,主要是面试有的聊
- 可以围绕项目展现八股基础和自己动手能力
- 不是必须,有时候只是复现一个基础玩具项目也能进面并拿offer
关于面试复盘
- 面试的时候可以录音复盘
关于反问阶段
- 可以向面试官多打听下组里情况
- 进去后主要工作是做什么的
- 组里显卡资源如何?blabla
- 同公司不同组工作内容可能差别很大
- 当时面的三个美团岗位,明显感觉第一个是偏research核心岗,后两个是偏业务方向的
关于赶进度的小技巧
一个阶段做60%就可以边着手做下一个阶段:
- 基础学差不多可以做项目边补基础
- 项目八股学差不多可以边面中小厂,边复盘巩固项目八股
- 这样进度推进和学习反馈都会快很多
- (好比抄了同学作业,再想办法跟老师解释为什么作业这样写,比从头写要容易)
最后
- 希望大伙都能体会到转码的乐趣 😂😂