连续再学习定义与hello-agent、minimind路线规划

2026-04-20

昨问今答

1. 连续再学习？

定义：主动回忆+分散学习=连续再学习

步骤：

新学习的时候，进行至少1-3次的主动回忆（写下来说出来教学做题抽卡）
间隔1天到1周（没有固定时间），再进行主动回忆
对于遗忘的部分，再次进行确认（反馈），并进行至少一次主动回忆
间隔一段时间，重复以上步骤

学习 hello-agent

学习 minimind

路线图

环境搭建与快速体验
理解模型架构
Tokenizer分词器
预训练（Pretrain）
监督微调（SFT）
强化学习对齐（RLHF/RLAIF）
模型蒸馏与推理模型
模型评估与部署
视觉多模态（minimind-V）

学习：AI Native Agent

定义

AI Native 是以 LLM 为决策核心，通过“感知 - 推理 - 行动”循环自主完成目标的智能体

自主推理范式和 Workflow 范式的区别

Workflow 范式是人预定义路径，机器按图执行；自主推理范式是人定义目标，机器动态规划路径。

Agent能代表自主推理范式吗？

不能直接画等号。

Agent 是一种实现形式，自主推理范式是背后的思想。 不是所有叫 “Agent” 的东西都在做自主推理——比如很多所谓的 Agent 本质上还是固定流程套了个 LLM，那它骨子里还是 Workflow 范式。

零碎想法

晚上面临一些抉择：是玩游戏还是学习

感觉上想继续玩游戏（因为正在游玩中，有推进的欲望），理性上希望学习，对于未来和自身，都是很有益的

并不冲突，而且我想在未来，也会多次遇到类似的情况。

决策模式很简单：

要事第一
在情况允许的情况下，可以适当娱乐

推进《上瘾式学习》

最近感觉这个有种迟滞的状态，这样并不好，从混乱梳理至清晰，这个过程是有益的

重要的不是时间，而是实际的收获和良好的感觉

悟

记住，我不需要完美的解答，重要的是回答这件事本身！

明日提问

抄写
标记
固定个人风格
精细提问和自我解释
交叉学习

想做的事

AI Native Agent