参考链接:
- https://www.xiaohongshu.com/explore/69d1bc460000000022025e2e?xsec_token=ABEBoB-9CgfBNwUpJzW-DE_aHu0SureR_fWYEA0xN52Hw=&xsec_source=pc_search&source=web_profile_page
- https://www.xiaohongshu.com/explore/6968a896000000001a022b55?xsec_token=ABgzgnbi3mG6jnMzjEOSHSsZgsOGdYmY9Irzpeo83gHQE=&xsec_source=pc_search&source=web_search_result_notes
- https://www.xiaohongshu.com/explore/69b934b50000000021004e99?xsec_token=ABidoCPQNB-c2-ABQefcuvFjYKJzgs7P_Jz1tihO0fUcc=&xsec_source=pc_search&source=web_search_result_notes
TeleAI 大模型算法实习面经
主要是做agent方向的research,本次面经包含一二面整个流程。
一面面经
- 详细拷打实习
- 讲解一下你了解到的不同基座模型都用了什么不同的训练范式
- grpo的重要性采样公式是什么,如何理解
- off-policy和on-policy如何理解
- 如何理解dapo中的clip-higher
手撕:
找零问题(强制python)
二面面经
拷打实习
一面拷打了第一段实习,二面重点拷打第二段。
基本上没问八股
- 手撕1:单词拆分
- 手撕2:单词拆分 II
- 手撕3:self-attention
建议大家以后刷题都用python。博主都是用c++,所以我的面经里都会标注强制python,有时候面试官为了查考你python到底行不行,还会让你多撕一道attention这种大模型算法相关的题目。
看来确实需要关注主流模型的技术报告。
TeleAI bar
bar一般?主要看是不是缺人和眼缘?八股手撕少
Tele-AI大语言模型实习一面
技术问题
- 自我介绍
- 介绍下项目
- 你主要负责哪方面
- 仔细讲下这几大链路
- 有和其他智能体协作吗
- F1怎么做的,怎么计算的,是放到提示词做示例,还是微调了模型
- 幻觉验证是怎么做的
- RLHF和PPO的区别
- 在PPO训练过程有遇到什么问题吗
- 训练PPO需要几个模型
- 假设现在有一条query,你现在告诉我PPO的整个流程是怎么样训练的,这四个模型是怎么协作的
- 有了解其他ppo改进算法吗
- KL散度加在PPO损失的哪里
手撕代码
Leetcode.300 最长递增子序列
反问环节
业务线及团队情况?
感觉也是主要聚焦于项目和一些主流技术谈谈,原来自我介绍和项目介绍是分开的吗?我上次叽里咕噜说了一堆。