网站首页 > AI工具 第57页
  • Boow-VTON  阿里推出的AI虚拟试衣技术

    Boow-VTON 阿里推出的AI虚拟试衣技术

    380

    Boow-VTON是阿里巴巴推出的一种先进的虚拟试衣技术。能在野外场景中实现高质量的虚拟试衣效果,无需依赖精确的遮罩或修复工作。通过有效的数据增强方法,基于大规模未配对的训练数据,显著提高模型的试穿性能。...

  • LiveKit Agents  创建实时与用户互动的多模态AI代理框架

    LiveKit Agents 创建实时与用户互动的多模态AI代理框架

    377

    LiveKit Agents 是一个强大的框架,用于创建能实时通过语音、视频和数据与用户互动的多模态AI代理。框架支持 Python 编程,简化开发过程,支持开发者轻松集成语音识别、语音合成和先进的语言模型。...

  • ScribbleDiff  开源的涂鸦内容转换成图像的生成技术

    ScribbleDiff 开源的涂鸦内容转换成图像的生成技术

    265

    ScribbleDiff是一种先进的文本到图像生成技术,基于用户简单涂鸦的视觉提示指导图像的生成过程。通过分析涂鸦确保生成的图像中的对象方向与用户涂鸦的方向一致,并将涂鸦扩展生成更完整和细致的图像。...

  • CatVTON  中山大学和Pixocial联合推出的虚拟试衣技术

    CatVTON 中山大学和Pixocial联合推出的虚拟试衣技术

    207

    CatVTON是一种先进的虚拟试衣技术,由中山大学和Pixocial联合推出。基于轻量化的架构和高效的训练策略,实现高质量的虚拟试衣效果。CatVTON的特点是只需要极少的可训练参数(约49.57M),能在保持细节一致性的同...

  • VideoLingo  全自动AI视频翻译工具,一键搞定双语字幕和配音

    VideoLingo 全自动AI视频翻译工具,一键搞定双语字幕和配音

    215

    VideoLingo 是一款一键全自动视频翻译工具,能将视频进行字幕切割、翻译、对齐和配音,最终生成 Netflix 级别的字幕和配音。VideoLingo 基于自然语言处理(NLP)和大型语言模型(LLM)技术,提供智能术...

  • MMSearch  评估大型多模态AI搜索引擎能力的基准测试工具

    MMSearch 评估大型多模态AI搜索引擎能力的基准测试工具

    500

    MMSearch是一个用于评估大型多模态模型(LMMs)作为AI搜索引擎能力的基准测试。包括一个MMSearch-Engine框架和MMSearch测试集,后者包含300个问题,涵盖14个子领域。MMSearch-Engin...

  • ChopperBot  AI直播视频剪辑和发布机器人,自动化管理直播内容

    ChopperBot AI直播视频剪辑和发布机器人,自动化管理直播内容

    454

    ChopperBot是一款智能化的直播视频剪辑和发布机器人,ChopperBot能自动化地管理和分发直播内容。支持多个流行直播平台,如斗鱼、虎牙、B站、抖音和Twitch等,ChopperBot能自动爬取直播视频、智能切片、...

  • HelloBench  评估LLMs长文本生成能力的开源基准测试工具

    HelloBench 评估LLMs长文本生成能力的开源基准测试工具

    448

    HelloBench是一个用于评估大型语言模型(LLMs)长文本生成能力的开源基准测试。HelloBench包含五个基于布鲁姆分类法的子任务:开放式问答、摘要、聊天、文本补全和启发式文本生成。HelloBench用真实场景数...

  • anime.gf  AI虚拟角色创建与互动的开源应用

    anime.gf AI虚拟角色创建与互动的开源应用

    443

    Anime.gf 是一个开源的本地应用程序,支持用户创建和互动自己的虚拟角色。工具提供一个用户友好的界面,用户与各种具有独特个性和语言风格的虚拟角色进行交流。...

  • VirtualWife  AI虚拟数字人项目,可在B站进行直播

    VirtualWife AI虚拟数字人项目,可在B站进行直播

    430

    VirtualWife是一个创新的虚拟数字人项目,专注于开发具有AI的虚拟角色。角色设计用于在B站等直播平台上进行互动,提供娱乐和信息。通过集成先进的AI技术,如自然语言处理和机器学习,VirtualWife的角色能理解和响...

53 54 55 56 57 58 59 60 61 62
返回顶部 暗黑模式