← 返回首页

📒 学习笔记

MiniMind — 学习进度总结

2026-03-25

📋 MiniMind 学习进度总结 学习者背景 Apple M5 MacBook Pro(32GB),无 NVIDIA GPU,使用 PyTorch MPS …

MiniMind — 阶段 2.5:Attention、Causal Mask

2026-03-24

两个回答都非常好!👏 精准度超出零基础水平。让我补充完善一下。 FFN FFN vs Attention 分别做了什么 | | 你的回答 | 更精确的说法 |…

MiniMind — 阶段 2.4:SwiGLU 激活函数

2026-03-23

RoPE 外积 torch.outer 的规则 回答:是 [[0,1,2],[0,0.1,0.2]]? 接近了!但行列搞反了 😊 ` outer(a, b) …

MiniMind — 阶段 2.3:RoPE

2026-03-22

mean(x) 和 std(x) 是什么? ① mean(x):均值(Mean) 就是求平均: ` x = [150.0, 200.0, 180.0] mean…

MiniMind — 阶段 2.2:RMSNorm

2026-03-21

Weight Tying 到底怎么共享的? -- 第一步:理解两个层各自长什么样 两个层的本质都是一个矩阵(一张表格): ` Embedding 矩阵:形状 […

MiniMind — 阶段 2.1:Transformer 整体架构

2026-03-20

Transformer 整体结构 知识点 1:什么是 Transformer? 在 2017 年之前,AI 处理文字主要靠 RNN(循环神经网络),它的学习方式…

MiniMind — 阶段 1:环境搭建与快速体验

2026-03-19

MiniMind 学习笔记 — 阶段 1:环境搭建与快速体验 项目地址:https://github.com/jingyaogong/minimind 设备环境…