15 其他大模型算法面经
链接地址:
https://www.xiaohongshu.com/explore/6989dd9c000000001a01cf36?xsec_token=ABLbMzmj8DF6QbtQfW2qQwuw2JJFR7JqYkG-1efbkSC-g=&xsec_source=pc_user
携程大模型算法实习面经(已oc)
背景:双九科班,1篇多模态相关论文(跟大模型有关系但不大),1个github项目(MedicalGPT)
1️⃣一面:无八股无手撕,全程拷打简历
- 自我介绍
- 论文中所用的图像编码器是什么?
- 论文中方法的因果推理体现在哪里?
- 为什么使用跨模态对齐而不用多模态大模型?
- 项目为什么不用参数量更大的模型?
- 模型困惑度是什么,怎么计算?
- 项目数据如何获取,数据比例怎么确定?
- 怎么训练奖励模型,为什么要自己训?
- 如果针对业务从头进行大模型后训练,如何构造高质量CoT?
- 反问:业务算法流程,实习生负责什么工作
2️⃣二面:
- 自我介绍
- 论文中如何进行因果建模?对图像的干预方式是怎么设计的,为什么这么设计?
- 模型困惑度(一面没答上来所以又问了一次)
- 项目使用了哪些评估指标?
- 项目的DPO数据如何构造,为什么?
- 项目中的Reward模型怎么训练的,为什么自己训?
- GRPO过程中遇到过什么问题,怎么解决的?
- 介绍DPO、PPO、GRPO过程和区别
- GRPO中奖励值可以怎么得到,有哪些方法?
- 手撕MHA
- 反问:工作内容,打卡时间
总结:个人感觉更加倾向于项目和论文,八股问的很少而且偏简单,面试官非常nice,很好的面试体验