大模型---MemGPT与Letta框架

张开发

• 2026/4/19 0:17:46 • 15 分钟阅读

分享文章

目录一.MemGPT1.MemGPT的定义2.MemGPT3.MemGPT和普通RAG的区别4.MemGPT的缺陷二.Letta1.Letta的定义2.Letta的记忆系统后续深入学习会继续补充：一.MemGPTLetta框架是由MemGPT演化而来，先讲MemGPT，参考论文：MemGPT: Towards LLMs as Operating Systems1.MemGPT的定义MemGPT的核心思想是：让模型自己参与管理记忆，通过函数调用在“主上下文”和“外部上下文”之间移动信息。其针对的问题是：LLM 的上下文窗口有限。即使模型本身很强，只要任务需要长期对话、持续个性化、或者分析远超窗口长度的文档，模型就会出现“记不住”“前文丢失”“后文挤爆上下文”的问题。相比长上下文模型的扩大窗口本身，MemGPT则是在讲如何把窗口当成稀缺资源来调度。论文最重要的概念就是virtual context management。类比传统操作系统：主上下文(main context)类似RAM，容量小但访问快；外部上下文(external context) 类似磁盘，容量大但不能直接全部放进 prompt；系统要决定什么时候把什么信息换入主上下文，什么时候把什么信息写回外部存储。主上下文：这是模型当前真正“看得见”的内容，也就是prompt里的有效工作区。它通常放的是当前任务必须立即用到的信息；与用户持续相关、必须常驻的核心记忆；最近对话和当前推理所需的短期上下文。外部上下文：这是超出当前窗口、但仍可在需要时访问的长期存储。例如，archival memory：长期知识库、附加文档、预加载数据源等等；recall storage/recall memory：历史对话与先前交互的可回忆存储。2.MemGPT如下图所示，首先，LLM 的上下文窗口是有限的，例如8k tokens，也就是说模型当前一次能“看到”的内容是有限的，不可能把所有历史、所有知识都一直放进去。图中Prompt Tokens被分为了三个内容，System Instructions，Working

更多文章

前端开发 2026/4/18 12:46:32

终极指南：LeRobot机器人学习框架高效配置与跨平台部署方案

终极指南：LeRobot机器人学习框架高效配置与跨平台部署方案【免费下载链接】lerobot 🤗 LeRobot: Making AI for Robotics more accessible with end-to-end learning 项目地址: https://gitcode.com/GitHub_Trending/le/lerobot 还在为机器人学习…

张开发

前端开发 2026/4/17 12:56:58

Vue 3项目实战：用gantt-elastic插件从零搭建一个可交互的甘特图（附完整配置代码）

Vue 3项目实战：用gantt-elastic插件从零搭建可交互甘特图在项目管理工具中，甘特图因其直观的时间轴展示方式成为进度管理的标配。但现有解决方案要么功能臃肿，要么定制性不足。gantt-elastic作为轻量级开源库，以其灵活的配置和响…

张开发

前端开发 2026/4/18 19:39:52

CKKS同态加密赋能ResNet20：低内存密态图像分类实战

1. 当图像分类遇上隐私保护：CKKSResNet20的化学反应记得去年帮医疗客户做CT影像分析时，遇到个棘手问题：医院要求原始数据不能离开内网，但我们的模型部署在云端。这种"数据不出域"的需求，正是同态加密技术的…

张开发

前端开发 2026/4/18 19:39:40

SigmaStar SSC335/SSC337 ISP烧录避坑指南：为什么你的FLASH启动不了？

SigmaStar SSC335/SSC337 ISP烧录避坑指南：为什么你的FLASH启动不了？ 当你满怀期待地按下电源键，却发现开发板毫无反应——这种挫败感每个嵌入式开发者都深有体会。SSC335/SSC337作为智能视觉处理领域的明星芯片，其ISP烧录过程看似…

张开发

前端开发 2026/4/18 19:41:19

WaveTools鸣潮工具箱：如何快速解锁帧率与优化画质的完整指南

WaveTools鸣潮工具箱：如何快速解锁帧率与优化画质的完整指南【免费下载链接】WaveTools 🧰鸣潮工具箱项目地址: https://gitcode.com/gh_mirrors/wa/WaveTools 还在为《鸣潮》游戏卡顿而烦恼？想要获得更流畅的游戏体验却不知从何入手…

张开发

前端开发 2026/4/18 19:42:29

Android Raphael实战：精准定位native内存泄漏的两种高效方案

1. 为什么我们需要关注Native内存泄漏？ 在Android开发中，Java层的内存泄漏大家可能已经司空见惯，各种工具和方案也比较成熟。但说到Native层的内存泄漏，很多开发者就开始头疼了。Native内存泄漏往往更加隐蔽，危害也更大…

张开发

前端开发 2026/4/18 19:42:55

3步搞定魔兽争霸III兼容性：WarcraftHelper让你的经典游戏在Windows 11上无缝运行

3步搞定魔兽争霸III兼容性：WarcraftHelper让你的经典游戏在Windows 11上无缝运行【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔…

张开发

前端开发 2026/4/19 3:56:45

Claude code源码安装使用教程

文章目录项目介绍bun安装项目介绍这里采用修复后能本地运行的版本，原始泄露源码无法直接运行。该仓库修复了启动链路中的多个阻塞问题，使完整的 Ink TUI 交互界面可以在本地工作地址：https://github.com/NanmiCoder/cc-haha bun安装 bu…

张开发

前端开发 2026/4/18 19:41:20

Redis 缓存雪崩如何应对

Redis缓存雪崩如何应对：高并发场景下的关键策略在分布式系统中，Redis作为高性能缓存被广泛应用，但缓存雪崩问题可能引发系统瘫痪。当大量缓存数据同时失效或Redis服务宕机，请求直接压垮数据库，导致服务不可用。如何有…

张开发

前端开发 2026/4/18 19:41:41

告别机翻！手把手教你安装dslrBooth.Pro 7.49.3.1专业汉化版，连语音都换成中文了

深度汉化实战：打造专业级中文版dslrBooth.Pro全流程指南每次打开专业摄影软件时，满屏的英文菜单是否让你望而却步？网上那些机翻版本是否让你在关键操作时陷入术语混乱？作为从业十年的商业摄影师，我深知语言障碍对工作…

张开发

前端开发 2026/4/18 19:42:53

如何完整解锁Cursor Pro功能：一键激活与无限使用的终极指南

如何完整解锁Cursor Pro功能：一键激活与无限使用的终极指南【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached you…

张开发

前端开发 2026/4/19 2:39:44

终极游戏插件加载器：5分钟解锁Windows游戏无限可能 [特殊字符]

终极游戏插件加载器：5分钟解锁Windows游戏无限可能 🎮 【免费下载链接】Ultimate-ASI-Loader The Ultimate ASI Loader is a proxy DLL that loads custom .asi libraries into any game process. 项目地址: https://gitcode.com/gh_mirrors/ul/Ultima…

张开发

大模型---MemGPT与Letta框架

最新文章

Legacy iOS Kit终极指南：旧款iOS设备系统降级与性能重塑完整解决方案

彻底摆脱窗口尺寸限制！WindowResizer让你随心所欲调整任何应用程序窗口大小

从嵌入式到FPGA：一个RISC-V爱好者的Verilog入门避坑指南

从x86到Arm64：手把手教你移植游戏渲染代码到高通骁龙8cx平台

数据库怎么选？网络安全工程师带你一次搞懂关系型、NoSQL，以及企业里最常见的几种数据库

uniapp多端适配必备技能：uView列表项自定义样式全攻略（含华为/字节跳动小程序案例）

推荐文章

终极Python m3u8下载器：如何快速解密并批量下载加密视频的完整指南

5分钟搞定抖音素材批量下载：douyin-downloader让你的创作效率翻倍

Python高级应用系列（八）：并发编程——Threading、Multiprocessing与并发模式

CSS如何使用-is伪类缩减重复选择器_通过分组选择器提升代码维护效率

Vue.js监听器watch中deep深度监听与immediate立即执行配置

Redis怎样清理旧的快照文件_配合Shell脚本实现RDB历史备份轮转

相关文章

钢坯火焰清理机设计【开题报告+任务书+毕业论文+CAD图纸+翻译】

15 | Claude Code Hooks 事件驱动自动化：防微杜渐的安全防线

Linux党福利：Debian12下用VSCode+SDCC玩转51单片机（含WSL配置指南）

从微调到精控：可变电阻在音频电路中的深度应用解析

Mahony、互补滤波与卡尔曼：给嵌入式新手的六轴姿态融合算法选型指南

保姆级教程：在WSL2的Ubuntu 22.04上，用CUDA 12.9编译运行llama.cpp（含模型下载避坑指南）

分享文章

更多文章

终极指南：LeRobot机器人学习框架高效配置与跨平台部署方案

Vue 3项目实战：用gantt-elastic插件从零搭建一个可交互的甘特图（附完整配置代码）

CKKS同态加密赋能ResNet20：低内存密态图像分类实战

SigmaStar SSC335/SSC337 ISP烧录避坑指南：为什么你的FLASH启动不了？

WaveTools鸣潮工具箱：如何快速解锁帧率与优化画质的完整指南

Android Raphael实战：精准定位native内存泄漏的两种高效方案

3步搞定魔兽争霸III兼容性：WarcraftHelper让你的经典游戏在Windows 11上无缝运行

Claude code源码安装使用教程

Redis 缓存雪崩如何应对

告别机翻！手把手教你安装dslrBooth.Pro 7.49.3.1专业汉化版，连语音都换成中文了

如何完整解锁Cursor Pro功能：一键激活与无限使用的终极指南

终极游戏插件加载器：5分钟解锁Windows游戏无限可能 [特殊字符]