AI工具 - 第62页 - 中国AI网

FLUX-Controlnet-Inpainting 阿里妈妈推出的开源AI图像修复工具

274

FLUX-Controlnet-Inpainting 是阿里妈妈（Alibaba's Alimama）推出的一款图像修复工具，融合 ControlNet 和 FLUX.1-dev 技术。工具根据用户指定的掩码区域进...

406

PearAI 是一个开源的 AI 驱动的代码编辑器，基于 Visual Studio Code (VSCode 开发。PearAI 集成AI技术，减少编程工作量提高开发效率。PearAI 支持开发者直接与代码库对话，提出问...

410

EzAudio是由约翰霍普金斯大学和腾讯AI实验室共同推出的一款文本到音频（Text-to-Audio, T2A）生成模型。基于一种高效的扩散变换器技术，用在从文本提示生成高质量的音频效果。...

149

GraphReasoning是一种基于人工智能技术将大量科学论文转换成知识图谱的方法。通过结构化分析，计算节点度、识别社区及其连通性，评估关键节点的中心性，来揭示知识的架构。方法基于图的属性，如传递性和同构性，来发现跨学科的...

131

Comic Translate 是一个开源的漫画翻译工具，由开发者 ogkalu2 推出。帮助用户自动翻译全球各地的漫画，支持英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语等多种语言。...

156

SafeEar是由浙江大学和清华大学联合开发的AI音频伪造检测框架，保护用户隐私的同时检测音频伪造。采用基于神经音频编解码器的解耦模型，分离语音的声学信息和语义信息，用声学信息进行检测，有效防止隐私泄露。...

111

PDF2Audio 是一个开源工具，能将 PDF 文档转换成音频内容，适合制作播客、讲座或摘要。它基于 OpenAI 的 GPT 模型生成播客脚本，通过文本到语音技术转化为音频。...

304

美图奇想大模型（MiracleVision）是美图公司推出的一款AI视觉大模型，专注于美学创作，包括东方美学、人像和商业设计等。模型完成了视频生成能力的全面升级，能生成1分钟、每秒24帧、1080P分辨率的高质量视频，显著提...

238

豆包AI视频模型是字节跳动推出的两款AI视频生成大模型：PixelDance 和 Seaweed 。PixelDance基于DiT结构，擅长理解复杂指令，生成连贯、多主体交互的视频片段，适合制作故事性强的短片。Seaweed...

212

MIMO是阿里巴巴集团智能计算研究所推出的可控角色视频合成的新型AI框架，基于空间分解建模技术，将2D视频转换为3D空间代码，实现对角色、动作和场景的精确控制。MIMO能处理任意角色的合成，适应新颖的3D动作，并与真实世界场...