← 返回每日学习

minimind:环境搭建与快速体验

2026-03-19

专注学习时间

  1. 20:21-23:50 3h29m

今日学习

目标:学习minimind

具体子目标:

  1. 明确minimind是什么
  2. 如何学习minimind

行动

配置Mac环境

第1个小时基本在配置环境了,电脑是新买的,需要配置很多东西

  1. 设置cherryStudio的服务商API
  2. 安装claude code
  3. 配置claude code
  4. 初始化github SSH
  5. 拉取GitHub项目

接下来开始搞啦!

运行minimind本地测试

解决了很多环境问题,然后终于跑通了,可以用本地大模型进行对话,感觉很棒!

回答

minimind是什么?

miniMind 是一个极简 LLM(大语言模型)训练项目,用最少的资源走通大模型训练的完整流程

┌─────────────────────────────────────┐
│            MiniMind 是什么?          │
├─────────────────────────────────────┤
│  🎯 目标:让普通人从零训练一个大模型    │
│  📦 大小:最小仅 25.8M 参数           │
│  💻 门槛:一台笔记本电脑即可           │
│  📖 原理:和 GPT / Llama 完全一致     │
│  🔓 开源:代码、数据、权重全部公开      │
└─────────────────────────────────────┘

如何学习minimind?

阶段名称一句话说明
1环境搭建与快速体验 ✅装好环境,下载现成模型,先跑通对话看看效果
2理解模型架构读懂模型的”身体结构”——Transformer 的每个零件是什么、怎么拼起来的
3Tokenizer 分词器理解模型怎么把人类文字转成它能处理的数字
4预训练(Pretrain)喂大量文本,让模型从零学会基本的语言能力(学会说人话)
5监督微调(SFT)用问答对数据教模型学会”有问有答”的对话能力
6强化学习对齐(RLHF)用人类偏好告诉模型哪个回答更好,让它学会”说正确的话”
7模型蒸馏与推理让小模型向大模型偷师学艺,并学会展示思考过程
8评估与部署考试打分,然后把模型部署成可用的在线服务
9视觉多模态(进阶)给模型装上”眼睛”,让它能看图说话

今日感想

专注于行动

《高效能人士的七个习惯》、《福格行为模型》、《纳瓦尔宝典》都在阐述同一个事情:最优先去做对你最有价值而且你也喜欢做的事。遵守这个原则就非常好,大多数情况下我们会做什么事?最容易做到的事,无论这件事是好是坏

好一点的情况就是最一些有价值但零碎的事情,这也是我过去相当一段时间存在的问题,如果我只在意学习时间,就会倾向做有价值但最轻松的事情

事实上,应该做最有价值且你可以做到的事情,以此为基本原则

我的专长

这几天我一直都在想《纳瓦尔宝典》里提到的“我的专长”

我的专长是什么呢?是我的前端技术吗?不是,我没有那么热爱,另一方面可取代性太高

是坚持的习惯和毅力,在AI时代我们可以更好发现自身的特质,我认为我的特质是坚持。

在我学习微习惯以来,至今已有2500天以上,没有一天我曾终止过学习,即使只有1分钟,我也绝不会放弃

事实上,大多数时间我都可以坚持1小时甚至两小时每天的学习

所以,想到这里我感觉自己有了一些自信,即使我失去一切,我想我还有一些有价值的东西,不是技术和知识,而是道德和品格。

反思

  1. 对于学习笔记的审查不够,下次要浏览一次之后至少审查更新一次。