跳转至

参考链接:

  1. https://www.xiaohongshu.com/explore/69d1bc460000000022025e2e?xsec_token=ABEBoB-9CgfBNwUpJzW-DE_aHu0SureR_fWYEA0xN52Hw=&xsec_source=pc_search&source=web_profile_page
  2. https://www.xiaohongshu.com/explore/6968a896000000001a022b55?xsec_token=ABgzgnbi3mG6jnMzjEOSHSsZgsOGdYmY9Irzpeo83gHQE=&xsec_source=pc_search&source=web_search_result_notes
  3. https://www.xiaohongshu.com/explore/69b934b50000000021004e99?xsec_token=ABidoCPQNB-c2-ABQefcuvFjYKJzgs7P_Jz1tihO0fUcc=&xsec_source=pc_search&source=web_search_result_notes

TeleAI 大模型算法实习面经

主要是做agent方向的research,本次面经包含一二面整个流程。

一面面经

  1. 详细拷打实习
  2. 讲解一下你了解到的不同基座模型都用了什么不同的训练范式
  3. grpo的重要性采样公式是什么,如何理解
  4. off-policy和on-policy如何理解
  5. 如何理解dapo中的clip-higher

手撕:

找零问题(强制python)

二面面经

拷打实习

一面拷打了第一段实习,二面重点拷打第二段。

基本上没问八股

  • 手撕1:单词拆分
  • 手撕2:单词拆分 II
  • 手撕3:self-attention

建议大家以后刷题都用python。博主都是用c++,所以我的面经里都会标注强制python,有时候面试官为了查考你python到底行不行,还会让你多撕一道attention这种大模型算法相关的题目

看来确实需要关注主流模型的技术报告。

TeleAI bar

bar一般?主要看是不是缺人和眼缘?八股手撕少

Tele-AI大语言模型实习一面

技术问题

  1. 自我介绍
  2. 介绍下项目
  3. 你主要负责哪方面
  4. 仔细讲下这几大链路
  5. 有和其他智能体协作吗
  6. F1怎么做的,怎么计算的,是放到提示词做示例,还是微调了模型
  7. 幻觉验证是怎么做的
  8. RLHF和PPO的区别
  9. 在PPO训练过程有遇到什么问题吗
  10. 训练PPO需要几个模型
  11. 假设现在有一条query,你现在告诉我PPO的整个流程是怎么样训练的,这四个模型是怎么协作的
  12. 有了解其他ppo改进算法吗
  13. KL散度加在PPO损失的哪里

手撕代码
Leetcode.300 最长递增子序列

反问环节
业务线及团队情况?

感觉也是主要聚焦于项目和一些主流技术谈谈,原来自我介绍和项目介绍是分开的吗?我上次叽里咕噜说了一堆。