跳转至

橙世闲游

15 其他大模型算法面经

15 其他大模型算法面经

链接地址：

https://www.xiaohongshu.com/explore/6989dd9c000000001a01cf36?xsec_token=ABLbMzmj8DF6QbtQfW2qQwuw2JJFR7JqYkG-1efbkSC-g=&xsec_source=pc_user

携程大模型算法实习面经(已oc)

背景：双九科班，1篇多模态相关论文(跟大模型有关系但不大)，1个github项目(MedicalGPT)

1️⃣一面：无八股无手撕，全程拷打简历

自我介绍
论文中所用的图像编码器是什么？
论文中方法的因果推理体现在哪里？
为什么使用跨模态对齐而不用多模态大模型？
项目为什么不用参数量更大的模型？
模型困惑度是什么，怎么计算？
项目数据如何获取，数据比例怎么确定？
怎么训练奖励模型，为什么要自己训？
如果针对业务从头进行大模型后训练，如何构造高质量CoT？
反问：业务算法流程，实习生负责什么工作

2️⃣二面：

自我介绍
论文中如何进行因果建模？对图像的干预方式是怎么设计的，为什么这么设计？
模型困惑度（一面没答上来所以又问了一次）
项目使用了哪些评估指标？
项目的DPO数据如何构造，为什么？
项目中的Reward模型怎么训练的，为什么自己训？
GRPO过程中遇到过什么问题，怎么解决的？
介绍DPO、PPO、GRPO过程和区别
GRPO中奖励值可以怎么得到，有哪些方法？
手撕MHA
反问：工作内容，打卡时间

总结：个人感觉更加倾向于项目和论文，八股问的很少而且偏简单，面试官非常nice，很好的面试体验