minimind:环境搭建与快速体验
专注学习时间
- 20:21-23:50 3h29m
今日学习
目标:学习minimind
具体子目标:
- 明确minimind是什么
- 如何学习minimind
行动
配置Mac环境
第1个小时基本在配置环境了,电脑是新买的,需要配置很多东西
- 设置cherryStudio的服务商API
- 安装claude code
- 配置claude code
- 初始化github SSH
- 拉取GitHub项目
接下来开始搞啦!
运行minimind本地测试
解决了很多环境问题,然后终于跑通了,可以用本地大模型进行对话,感觉很棒!
回答
minimind是什么?
miniMind 是一个极简 LLM(大语言模型)训练项目,用最少的资源走通大模型训练的完整流程
┌─────────────────────────────────────┐
│ MiniMind 是什么? │
├─────────────────────────────────────┤
│ 🎯 目标:让普通人从零训练一个大模型 │
│ 📦 大小:最小仅 25.8M 参数 │
│ 💻 门槛:一台笔记本电脑即可 │
│ 📖 原理:和 GPT / Llama 完全一致 │
│ 🔓 开源:代码、数据、权重全部公开 │
└─────────────────────────────────────┘
如何学习minimind?
| 阶段 | 名称 | 一句话说明 |
|---|---|---|
| 1 | 环境搭建与快速体验 ✅ | 装好环境,下载现成模型,先跑通对话看看效果 |
| 2 | 理解模型架构 | 读懂模型的”身体结构”——Transformer 的每个零件是什么、怎么拼起来的 |
| 3 | Tokenizer 分词器 | 理解模型怎么把人类文字转成它能处理的数字 |
| 4 | 预训练(Pretrain) | 喂大量文本,让模型从零学会基本的语言能力(学会说人话) |
| 5 | 监督微调(SFT) | 用问答对数据教模型学会”有问有答”的对话能力 |
| 6 | 强化学习对齐(RLHF) | 用人类偏好告诉模型哪个回答更好,让它学会”说正确的话” |
| 7 | 模型蒸馏与推理 | 让小模型向大模型偷师学艺,并学会展示思考过程 |
| 8 | 评估与部署 | 考试打分,然后把模型部署成可用的在线服务 |
| 9 | 视觉多模态(进阶) | 给模型装上”眼睛”,让它能看图说话 |
今日感想
专注于行动
《高效能人士的七个习惯》、《福格行为模型》、《纳瓦尔宝典》都在阐述同一个事情:最优先去做对你最有价值而且你也喜欢做的事。遵守这个原则就非常好,大多数情况下我们会做什么事?最容易做到的事,无论这件事是好是坏
好一点的情况就是最一些有价值但零碎的事情,这也是我过去相当一段时间存在的问题,如果我只在意学习时间,就会倾向做有价值但最轻松的事情
事实上,应该做最有价值且你可以做到的事情,以此为基本原则
我的专长
这几天我一直都在想《纳瓦尔宝典》里提到的“我的专长”
我的专长是什么呢?是我的前端技术吗?不是,我没有那么热爱,另一方面可取代性太高
是坚持的习惯和毅力,在AI时代我们可以更好发现自身的特质,我认为我的特质是坚持。
在我学习微习惯以来,至今已有2500天以上,没有一天我曾终止过学习,即使只有1分钟,我也绝不会放弃
事实上,大多数时间我都可以坚持1小时甚至两小时每天的学习
所以,想到这里我感觉自己有了一些自信,即使我失去一切,我想我还有一些有价值的东西,不是技术和知识,而是道德和品格。
反思
- 对于学习笔记的审查不够,下次要浏览一次之后至少审查更新一次。