minimind：环境搭建与快速体验

2026-03-19

专注学习时间

20:21-23:50 3h29m

今日学习

目标：学习minimind

具体子目标：

明确minimind是什么
如何学习minimind

行动

配置Mac环境

第1个小时基本在配置环境了，电脑是新买的，需要配置很多东西

设置cherryStudio的服务商API
安装claude code
配置claude code
初始化github SSH
拉取GitHub项目

接下来开始搞啦！

运行minimind本地测试

解决了很多环境问题，然后终于跑通了，可以用本地大模型进行对话，感觉很棒！

回答

minimind是什么？

miniMind 是一个极简 LLM（大语言模型）训练项目，用最少的资源走通大模型训练的完整流程

┌─────────────────────────────────────┐
│            MiniMind 是什么？          │
├─────────────────────────────────────┤
│  🎯 目标：让普通人从零训练一个大模型    │
│  📦 大小：最小仅 25.8M 参数           │
│  💻 门槛：一台笔记本电脑即可           │
│  📖 原理：和 GPT / Llama 完全一致     │
│  🔓 开源：代码、数据、权重全部公开      │
└─────────────────────────────────────┘

如何学习minimind？

阶段	名称	一句话说明
1	环境搭建与快速体验 ✅	装好环境，下载现成模型，先跑通对话看看效果
2	理解模型架构	读懂模型的”身体结构”——Transformer 的每个零件是什么、怎么拼起来的
3	Tokenizer 分词器	理解模型怎么把人类文字转成它能处理的数字
4	预训练（Pretrain）	喂大量文本，让模型从零学会基本的语言能力（学会说人话）
5	监督微调（SFT）	用问答对数据教模型学会”有问有答”的对话能力
6	强化学习对齐（RLHF）	用人类偏好告诉模型哪个回答更好，让它学会”说正确的话”
7	模型蒸馏与推理	让小模型向大模型偷师学艺，并学会展示思考过程
8	评估与部署	考试打分，然后把模型部署成可用的在线服务
9	视觉多模态（进阶）	给模型装上”眼睛”，让它能看图说话

今日感想

专注于行动

《高效能人士的七个习惯》、《福格行为模型》、《纳瓦尔宝典》都在阐述同一个事情：最优先去做对你最有价值而且你也喜欢做的事。遵守这个原则就非常好，大多数情况下我们会做什么事？最容易做到的事，无论这件事是好是坏

好一点的情况就是最一些有价值但零碎的事情，这也是我过去相当一段时间存在的问题，如果我只在意学习时间，就会倾向做有价值但最轻松的事情

事实上，应该做最有价值且你可以做到的事情，以此为基本原则

我的专长

这几天我一直都在想《纳瓦尔宝典》里提到的“我的专长”

我的专长是什么呢？是我的前端技术吗？不是，我没有那么热爱，另一方面可取代性太高

是坚持的习惯和毅力，在AI时代我们可以更好发现自身的特质，我认为我的特质是坚持。

在我学习微习惯以来，至今已有2500天以上，没有一天我曾终止过学习，即使只有1分钟，我也绝不会放弃

事实上，大多数时间我都可以坚持1小时甚至两小时每天的学习

所以，想到这里我感觉自己有了一些自信，即使我失去一切，我想我还有一些有价值的东西，不是技术和知识，而是道德和品格。

反思

对于学习笔记的审查不够，下次要浏览一次之后至少审查更新一次。