Agent K v1.0 是华为诺亚方舟实验室与伦敦大学学院团队联合推出的端到端自主数据科学智能体,能自动化、优化和泛化处理多种数据科学任务。Agent K v1.0基于结构化推理和动态记忆管理,在无需人工微调的情况下,从经...
-
-
Voyage Multimodal-3 是 Voyage AI 推出的先进的多模态嵌入模型,能处理交错的文本和图像,并从 PDF、幻灯片、表格等截图中捕捉关键视觉特征,无需复杂文档解析。Voyage Multimodal-3...
-
Hali是特斯联联合国际轻奢品牌Buttons推出的多模态多智能体协作AI Agent。Hali具备类人思考、长记忆、物理世界感知和多智能体协作四大特点,语义理解准确率超97%,中英文翻译准确率达96%。Hali被设计为用户...
-
DanceFusion是清华大学推出的开源框架,专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时空Transformer-VAE和扩散模型,能处理社交媒体上的不完整和嘈杂骨骼数据,生成与音乐同步的逼真舞蹈...
-
Skywork O1是昆仑万维推出的天工大模型4.0 O1版,是国内首款具备中文逻辑推理能力的o1模型。Skywork O1在模型输出中内生了思考、计划、反思等能力,显著提升推理能力。Skywork O1模型包括基于开源Ll...
-
Symphony Creative Studio是TikTok推出的AI视频创作工具,帮助广告主和内容创作者简化视频制作流程。Symphony Creative Studio集成视频生成、转换和扩展功能,用户输入信息和素材或...
-
LLaMA-Mesh是清华大学和NVIDIA共同推出的项目,基于将3D网格生成与大型语言模型(LLMs)结合,实现用文本提示直接生成3D模型的功能。项目用OBJ文件格式将3D网格的顶点坐标和面定义转换为文本,基于顶点量化技术...
-
iAgents是清华大学推出的多智能体系统,基于为每个用户配备个人AI智能体促进协作和完成日常任务。智能体能理解用户的文件、命令,从协作中学习,实现自动的信息交换和任务解决。iAgents用infoNav推理机制指导智能体在...
-
Audio Decomposition是音频处理技术,基于傅里叶变换和信封匹配将音乐中的各个音符和乐器分离,实现音乐到乐谱的转换。Audio Decomposition开源项目是Matthew Bird推出的,无需外部乐器分...
-
ai-chatbot是Vercel推出的开源项目,基于Next.js框架和Vercel AI SDK构建。ai-chatbot提供一个功能完备、易于定制的AI聊天机器人模板,帮助开发者快速构建高性能和良好用户体验的聊天应用。...