MiniMind 学习笔记
元信息:mindmind学习路线
mindmind学习路线
-
环境搭建与快速体验
-
理解 模型架构
-
Tokenizer 分词器
-
预训练(Pretrain)
-
监督微调 SFT Supervised Fine-Tuning,指在已经预训练好的大模型上,用带标注的[输入->期望输出] 样本继续训练,让模型更贴近你想要的任务风格、格式或领域知识
-
强化学习对齐( RLHF Reinforcement Learning from Human Feedback / RLAIF RL from AI Feedback )
-
模型蒸馏与推理模型
-
模型评估与部署
-
视觉多模态(minimind-V)