连续再学习定义与hello-agent、minimind路线规划
昨问今答
1. 连续再学习?
定义:主动回忆+分散学习=连续再学习
步骤:
- 新学习的时候,进行至少1-3次的主动回忆(写下来 说出来 教学 做题 抽卡)
- 间隔1天到1周(没有固定时间),再进行主动回忆
- 对于遗忘的部分,再次进行确认(反馈),并进行至少一次主动回忆
- 间隔一段时间,重复以上步骤
学习 hello-agent
目录
- 前言
- 智能体 和 语言模型基础
- 构建你的 大语言模型 智能体
- 高级知识 扩展
- 综合案例 进阶
- 毕业设计 及 未来展望
学习 minimind
路线图
- 环境搭建与快速体验
- 理解模型架构
- Tokenizer分词器
- 预训练(Pretrain)
- 监督微调(SFT)
- 强化学习对齐(RLHF/RLAIF)
- 模型蒸馏与推理模型
- 模型评估与部署
- 视觉多模态(minimind-V)
学习:AI Native Agent
定义
AI Native 是以 LLM 为决策核心,通过“感知 - 推理 - 行动”循环自主完成目标的智能体
自主推理范式 和 Workflow 范式的区别
Workflow 范式是人预定义路径,机器按图执行;自主推理范式是人定义目标,机器动态规划路径。
Agent能代表自主推理范式吗?
不能直接画等号。
Agent 是一种实现形式,自主推理范式是背后的思想。 不是所有叫 “Agent” 的东西都在做自主推理——比如很多所谓的 Agent 本质上还是固定流程套了个 LLM,那它骨子里还是 Workflow 范式。
零碎想法
晚上面临一些抉择:是玩游戏还是学习
感觉上想继续玩游戏(因为正在游玩中,有推进的欲望),理性上希望学习,对于未来和自身,都是很有益的
并不冲突,而且我想在未来,也会多次遇到类似的情况。
决策模式很简单:
- 要事第一
- 在情况允许的情况下,可以适当娱乐
推进《上瘾式学习》
最近感觉这个有种迟滞的状态,这样并不好,从混乱梳理至清晰,这个过程是有益的
重要的不是时间,而是实际的收获和良好的感觉
悟
记住,我不需要完美的解答,重要的是回答这件事本身!
明日提问
- 抄写
- 标记
- 固定个人风格
- 精细提问和自我解释
- 交叉学习
想做的事
- AI Native Agent