跳转至

15 其他大模型算法面经

链接地址:

https://www.xiaohongshu.com/explore/6989dd9c000000001a01cf36?xsec_token=ABLbMzmj8DF6QbtQfW2qQwuw2JJFR7JqYkG-1efbkSC-g=&xsec_source=pc_user

携程大模型算法实习面经(已oc)

背景:双九科班,1篇多模态相关论文(跟大模型有关系但不大),1个github项目(MedicalGPT)

1️⃣一面:无八股无手撕,全程拷打简历

  • 自我介绍
  • 论文中所用的图像编码器是什么?
  • 论文中方法的因果推理体现在哪里?
  • 为什么使用跨模态对齐而不用多模态大模型?
  • 项目为什么不用参数量更大的模型?
  • 模型困惑度是什么,怎么计算?
  • 项目数据如何获取,数据比例怎么确定?
  • 怎么训练奖励模型,为什么要自己训?
  • 如果针对业务从头进行大模型后训练,如何构造高质量CoT?
  • 反问:业务算法流程,实习生负责什么工作

2️⃣二面:

  • 自我介绍
  • 论文中如何进行因果建模?对图像的干预方式是怎么设计的,为什么这么设计?
  • 模型困惑度(一面没答上来所以又问了一次)
  • 项目使用了哪些评估指标?
  • 项目的DPO数据如何构造,为什么?
  • 项目中的Reward模型怎么训练的,为什么自己训?
  • GRPO过程中遇到过什么问题,怎么解决的?
  • 介绍DPO、PPO、GRPO过程和区别
  • GRPO中奖励值可以怎么得到,有哪些方法?
  • 手撕MHA
  • 反问:工作内容,打卡时间

总结:个人感觉更加倾向于项目和论文,八股问的很少而且偏简单,面试官非常nice,很好的面试体验