AI工具 - 第36页 - 中国AI网

SWE-Kit 构建自定义软件工程AI代理的开源框架

72

SWE-Kit 是Composio 推出的开源框架，简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具，用于构建自定义编码代理，支持与多种代理框架和大型语言模型集成，降低构建复杂 A...

83

MSQA（Multi-modal Situated Question Answering）是大规模多模态情境推理数据集，提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个问答对，覆盖9个问题类别，基于3D场景...

77

Chonkie是轻量级、快速且功能丰富的RAG（Retrieval-Augmented Generation）分块库，为文本处理设计。Chonkie支持基于Token、单词、句子和语义的多种分块方法，易于安装和使用，无冗余，...

82

Kiroku是多智能体系统，辅助用户组织和撰写文档。灵感源自创始人在斯坦福大学攻读博士期间的学术写作经历，Kiroku模拟学生与导师间的互动，帮助用户快速生成段落、优化沟通方式，在迭代评估中提升信息传递效果。...

78

Vision Search Assistant（VSA）是结合视觉语言模型（VLMs）和网络代理的框架，提升模型对未知视觉内容的理解能力。基于互联网检索，使VLMs处理和回答有关未见图像的问题。VSA在开放集和封闭集问答测试...

77

CHANGER是工业级超自然AI换头与色键技术，用在数字内容创作中将演员头部无缝集成到目标身体上，适于视觉特效、数字人类创建和虚拟化身。CHANGER基于色键技术分离背景与前景，用H2增强模拟多样头部形状和发型，及FPAT模...

65

MVDrag3D是创新的3D编辑框架，结合多视图生成和重建先验实现灵活且富有创造性的拖拽编辑。框架用多视图扩散模型作为生成先验，确保在多个渲染视图间进行一致的拖拽编辑，基于重建模型重建编辑对象的3D高斯表示，用视图特定的变形...

73

Vidu 1.5是生数科技推出的AI视频生成平台最新版本，致力于帮助创作者自由表达和高效创作。具备多模态视频大模型，支持参考生视频、图生视频和文生视频，确保角色、物体、场景的一致性。Vidu 1.5能在30秒内生成高清视频，...

85

AgentReview是基于大型语言模型（LLM）的框架，模拟学术同行评审过程。AgentReview基于LLM代理模拟评审者、作者和领域主席的角色，支持研究者在尊重隐私的同时，探索评审偏见、角色和决策机制对评审结果的影响。...

89

文心iRAG是百度在2024年百度世界大会上推出的检索增强的文生图技术（iRAG）技术，结合了百度搜索的亿级图片资源和强大的基础模型能力，解决大模型在文生图方面的幻觉问题，提升AI生成图片的真实性和可靠性。基于iRAG技术，...