跳转至

原文链接:

https://www.xiaohongshu.com/explore/6890b8ec0000000004007a1b?xsec_token=ABeX_3sKC3QIoWlEAhQf4KABP6VScEJiZbCvpt7a927bA=&xsec_source=pc_search&source=web_search_result_notes

2025转大模型算法最快路线(一)

在2025年怎么去学习大模型。在AI领域,不管是科研入门、保研项目、实习准备、秋招准备,入门大模型是几乎必不可少的一项了。而且如何快速入门大模型,然后开始看论文做项目的正向快速循环。这第一步,在2025怎么最快呢?


第一点:非科班同学的前置准备

如果是非科班同学,建议:

Linux

  • 黑马B站,两三天过一下就行

深度学习入门三件套(Python + PyTorch + 深度学习)

  • 这三个合三为一,直接做李沐的《动手学深度学习》
  • 在网上跟着notebook快速过一遍
  • 不要太纠结自己写PyTorch代码,现在都是AI
  • 不会的问AI,不会就问AI,直到问到会就行

环境配置

  • 配环境不行就花钱去某鱼让人装,不要在这个上面浪费时间

服务器推荐

  • 如果可以,最好在云服务器平台比如AutoDL租一个服务器
  • 不用GPU的很便宜,后续用GPU也可以很快适应
  • 用VSCode连服务器写代码运行jupyter
  • 用XShell来连服务器进行文件管理和用screen运行Python文件

第二点:入门大模型

入门深度学习一个月(或者快一点两三个星期)后,就可以看大模型相关的知识了。

推荐学习资源

  • 看GitHub的Datawhale,里面有很多好入门的教学项目
  • 主播亲测Datawhale的LLM项目路线,分享在评论区
  • Datawhale的项目看完了、做完了,基本算入门大模型了

期间要多看

  • Attention的论文
  • 其他技术blog(比如主播是数学系,很喜欢看苏剑林老师的blog

第三点:开始看论文做项目的正向循环

获取最新方向

  • 多刷小红书和看HuggingFace
  • 看最新的方向是啥(比如年初的DeepSeek的GRPO-R1、多模态生成理解统一等)
  • 好用的训练框架是啥(推荐阿里的ms-swift

看大厂招聘需求

  • 看大厂的需求是啥
  • 然后看对应方向的热门论文
  • 多看特定几篇论文就大概知道最近的方向了

复现选择

  • 看GitHub上提问最多的、⭐最多的
  • 这时候复现有把握
  • 如果模型太大、数据太多,选择小模型进行复现,只要方向会就行

一定要肯花钱

  • 去租GPU不便宜
  • 但是一定要狠心一下,不然永远做不了好的实验项目

动手学深度学习千万别一行一行跟着敲代码,看懂即可,可以选择性敲几个经典算法,也可以不敲,只是过一遍深度学习基础脉络,看懂Python和pytorch。切记快速过完,别拖得太久了。