AI工具 - 第17页 - 中国AI网

Genie 2 谷歌DeepMind推出的最新一代基础世界模型

52

Genie 2是DeepMind推出的新一代大规模基础世界模型，能仅凭一张图片生成长达1分钟的可交互3D游戏世界。Genie 2能模拟出物体交互、角色动画、物理效果等复杂动态，支持用键盘和鼠标进行操作。Genie 2具备长时...

72

StableAnimator是复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学共同推出的端到端高质量身份保持视频扩散框架。StableAnimator能根据一张参考图像和一系列姿态，无需任何后处理工具，直接合成高保真度且保...

81

Vanna是开源的Python RAG（Retrieval-Augmented Generation）框架，能帮助用户基于大型语言模型（LLMs）为其数据库生成精确的SQL查询。Vanna用两步简单流程操作：首先在用户数据上...

117

I2V-01-Live是海螺AI推出的图生视频模型，能将静态二维图像转化为动态视频。模型基于深度学习技术，增强动作的流畅度和生动性，让人物或对象的动作更加自然和真实。I2V-01-Live支持广泛的艺术风格，优化稳定性和细腻...

65

PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术，结合扩散模型和3D人类建模，能从单一参考图像生成多个人物的逼真、个性化全身图像。PersonaCraft能有效处理人物间的遮挡问题，支持用户自定义身体形...

66

GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架，能从单张图片中创建出高保真度的3D人体模型。框架不依赖于参数化人体模型，而是用多源高质量人类数据集，包括3D扫描、多视角视频、单...

61

Amazon Nova 是亚马逊云服务（AWS）推出的新一代AI基础模型系列，提供行业领先的性能和成本效益。该系列包括专门处理文本的Amazon Nova Micro、多模态的Amazon Nova Lite 和Amazon...

60

MagicDriveDiT是香港中文大学、香港科技大学、华为云和华为诺亚方舟实验室共同推出基于DiT架构的新型视频生成方法，专为自动驾驶应用设计，实现高分辨率和长视频的生成。基于流匹配增强模型的可扩展性，用渐进式训练策略处理...

63

EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型，能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transformer（ViT）作为图像编码器，并引入高...

72

GPT学术优化（GPT Academic）是功能丰富的开源项目，专为学术研究和写作设计。GPT学术优化集成一键论文翻译、源代码解析、互联网信息获取、Latex文章校对、论文润色和摘要生成等多项实用功能。GPT学术优化采用模块...