北京智源人工智能研究院与中国人民大学高瓴人工智能学院联合发布了一款创新的人工智能模型框架——MemoRAG。该框架基于长期记忆,旨在推动检索增强生成(RAG)技术的发展,使其能够处理更复杂的任务,而不仅限于简单的问答。

MemoRAG采用了一种新颖的模式,通过“基于记忆的线索生成——基于线索指引的信息获取——基于检索片段的内容生成”的流程,实现了在复杂场景下精准获取信息的能力。这一技术特别适用于司法、医疗、教育和代码等知识密集型领域的任务,展示了极高的潜力。

MemoRAG的核心优势在于其全局记忆能力,能够处理长达百万词的单上下文数据,这为处理大量数据提供了强有力的支持。此外,MemoRAG还具备高度的可优化性和灵活性,能够快速适应新任务并实现性能的最优化。它还能从全局记忆中生成精确的上下文线索,提高问题解答的准确性,并挖掘数据中的深层次洞见。

为了支持MemoRAG的进一步研究与应用,项目团队已开源了两种记忆模型,并提供了使用指南和实验结果。实验显示,MemoRAG在多个基准测试中的表现均优于基线模型。智源研究院表示,尽管MemoRAG项目仍处于初期阶段,但他们期待社区的反馈,并将持续优化模型的轻量化、记忆机制的多样性以及其在中文语料中的表现。

技术报告:https://arxiv.org/pdf/2409.05591

Repo:https://github.com/qhjqhj00/MemoRAG