← 返回专题知识点

MiniMind 学习笔记

更新于 2026-04-19

元信息:mindmind学习路线

mindmind学习路线

  1. 环境搭建与快速体验

  2. 理解 模型架构

  3. Tokenizer 分词器

  4. 预训练(Pretrain)

  5. 监督微调 SFT ? Supervised Fine-Tuning,指在已经预训练好的大模型上,用带标注的[输入->期望输出] 样本继续训练,让模型更贴近你想要的任务风格、格式或领域知识

  6. 强化学习对齐( RLHF ? Reinforcement Learning from Human Feedback / RLAIF ? RL from AI Feedback

  7. 模型蒸馏与推理模型

  8. 模型评估与部署

  9. 视觉多模态(minimind-V)