MiniMind 学习笔记

更新于 2026-04-19

元信息：mindmind学习路线

mindmind学习路线

环境搭建与快速体验
理解模型架构
Tokenizer 分词器
预训练（Pretrain）
监督微调 SFT ? Supervised Fine-Tuning，指在已经预训练好的大模型上，用带标注的[输入->期望输出] 样本继续训练，让模型更贴近你想要的任务风格、格式或领域知识
强化学习对齐（ RLHF ? Reinforcement Learning from Human Feedback / RLAIF ? RL from AI Feedback ）
模型蒸馏与推理模型
模型评估与部署
视觉多模态（minimind-V）