← 返回每日学习

连续再学习定义与hello-agent、minimind路线规划

2026-04-20

昨问今答

1. 连续再学习?

定义:主动回忆+分散学习=连续再学习

步骤:

  1. 新学习的时候,进行至少1-3次的主动回忆(写下来 说出来 教学 做题 抽卡)
  2. 间隔1天到1周(没有固定时间),再进行主动回忆
  3. 对于遗忘的部分,再次进行确认(反馈),并进行至少一次主动回忆
  4. 间隔一段时间,重复以上步骤

学习 hello-agent

目录

  1. 前言
  2. 智能体 和 语言模型基础
  3. 构建你的 大语言模型 智能体
  4. 高级知识 扩展
  5. 综合案例 进阶
  6. 毕业设计 及 未来展望

学习 minimind

路线图

  1. 环境搭建与快速体验
  2. 理解模型架构
  3. Tokenizer分词器
  4. 预训练(Pretrain)
  5. 监督微调(SFT)
  6. 强化学习对齐(RLHF/RLAIF)
  7. 模型蒸馏与推理模型
  8. 模型评估与部署
  9. 视觉多模态(minimind-V)

学习:AI Native Agent

定义

AI Native 是以 LLM 为决策核心,通过“感知 - 推理 - 行动”循环自主完成目标的智能体

自主推理范式 和 Workflow 范式的区别

Workflow 范式是人预定义路径,机器按图执行;自主推理范式是人定义目标,机器动态规划路径。

Agent能代表自主推理范式吗?

不能直接画等号。

Agent 是一种实现形式,自主推理范式是背后的思想。 不是所有叫 “Agent” 的东西都在做自主推理——比如很多所谓的 Agent 本质上还是固定流程套了个 LLM,那它骨子里还是 Workflow 范式。

零碎想法

晚上面临一些抉择:是玩游戏还是学习

感觉上想继续玩游戏(因为正在游玩中,有推进的欲望),理性上希望学习,对于未来和自身,都是很有益的

并不冲突,而且我想在未来,也会多次遇到类似的情况。

决策模式很简单:

  1. 要事第一
  2. 在情况允许的情况下,可以适当娱乐

推进《上瘾式学习》

最近感觉这个有种迟滞的状态,这样并不好,从混乱梳理至清晰,这个过程是有益的

重要的不是时间,而是实际的收获和良好的感觉

记住,我不需要完美的解答,重要的是回答这件事本身!

明日提问

  1. 抄写
  2. 标记
  3. 固定个人风格
  4. 精细提问和自我解释
  5. 交叉学习

想做的事

  1. AI Native Agent