AI工具 - 第57页 - 中国AI网

Boow-VTON 阿里推出的AI虚拟试衣技术

380

Boow-VTON是阿里巴巴推出的一种先进的虚拟试衣技术。能在野外场景中实现高质量的虚拟试衣效果，无需依赖精确的遮罩或修复工作。通过有效的数据增强方法，基于大规模未配对的训练数据，显著提高模型的试穿性能。...

377

LiveKit Agents 是一个强大的框架，用于创建能实时通过语音、视频和数据与用户互动的多模态AI代理。框架支持 Python 编程，简化开发过程，支持开发者轻松集成语音识别、语音合成和先进的语言模型。...

265

ScribbleDiff是一种先进的文本到图像生成技术，基于用户简单涂鸦的视觉提示指导图像的生成过程。通过分析涂鸦确保生成的图像中的对象方向与用户涂鸦的方向一致，并将涂鸦扩展生成更完整和细致的图像。...

207

CatVTON是一种先进的虚拟试衣技术，由中山大学和Pixocial联合推出。基于轻量化的架构和高效的训练策略，实现高质量的虚拟试衣效果。CatVTON的特点是只需要极少的可训练参数（约49.57M），能在保持细节一致性的同...

215

VideoLingo 是一款一键全自动视频翻译工具，能将视频进行字幕切割、翻译、对齐和配音，最终生成 Netflix 级别的字幕和配音。VideoLingo 基于自然语言处理（NLP）和大型语言模型（LLM）技术，提供智能术...

500

MMSearch是一个用于评估大型多模态模型（LMMs）作为AI搜索引擎能力的基准测试。包括一个MMSearch-Engine框架和MMSearch测试集，后者包含300个问题，涵盖14个子领域。MMSearch-Engin...

454

ChopperBot是一款智能化的直播视频剪辑和发布机器人，ChopperBot能自动化地管理和分发直播内容。支持多个流行直播平台，如斗鱼、虎牙、B站、抖音和Twitch等，ChopperBot能自动爬取直播视频、智能切片、...

448

HelloBench是一个用于评估大型语言模型（LLMs）长文本生成能力的开源基准测试。HelloBench包含五个基于布鲁姆分类法的子任务：开放式问答、摘要、聊天、文本补全和启发式文本生成。HelloBench用真实场景数...

443

Anime.gf 是一个开源的本地应用程序，支持用户创建和互动自己的虚拟角色。工具提供一个用户友好的界面，用户与各种具有独特个性和语言风格的虚拟角色进行交流。...

430

VirtualWife是一个创新的虚拟数字人项目，专注于开发具有AI的虚拟角色。角色设计用于在B站等直播平台上进行互动，提供娱乐和信息。通过集成先进的AI技术，如自然语言处理和机器学习，VirtualWife的角色能理解和响...