Time-MoE是创新的时间序列基础模型,基于混合专家(Mixture of Experts, MoE)架构,将时间序列预训练模型的参数规模扩展至十亿级别。模型用稀疏激活机制,在预测任务中仅激活部分网络节点,有效提升计算效率...
-
-
AutoGLM-Web是模拟用户操作的智能浏览器助手,基于大型语言模型构建,能执行网页访问、信息检索、内容总结等任务。基于简单的文字或语音指令,AutoGLM-Web能在私域网站上完成高级检索、模拟用户浏览网页的过程,快速批...
-
Moonshine是专为资源受限设备优化的语音识别模型,提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景,例如现场转录和语音命令识别。Moonshine基于先进的编码器-解码器架构和旋转位置嵌入技术,提高模型在...
-
SynthID 是 DeepMind 推出的技术工具,基于在 AI 生成的内容中嵌入数字水印帮助识别内容。水印对人类是不可感知的,但能被机器检测到,促进信息的信任度。SynthID 适于文本、音乐、图像和视频等多种内容形式,...
-
Whispo是AI驱动的语音转录工具,支持用户按住Ctrl键录制语音,在释放键时自动将转录的文本插入到正在用的任何支持文本输入的应用程序中。工具的数据处理完全在本地进行,确保数据的安全性和隐私性。...
-
OmniGen是用于统一图像生成的新扩散模型,能在单一框架内处理多种图像生成任务,如文本到图像的生成、图像编辑、主题驱动生成和视觉条件生成等。OmniGen涉及传统计算机视觉任务,将任务转化为图像生成任务增强模型的复杂图像生...
-
sCM是OpenAI推出的连续时间一致性模型,基于扩散模型原理进行改进。sCM简化理论框架和优化采样过程,实现图像生成速度的显著提升。sCM模型仅需两步采样能生成高质量图像,速度比传统扩散模型快50倍。...
-
easegen是一个开源的AI+数字人课程制作项目,集成课程制作、视频管理、智能课件生成到智能出题的全套方案。项目支持PPT课件的批量自动生成、数字人克隆、声音克隆及数字人课程设计和视频渲染等功能。...
-
Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型,保持与前代 Claude 3 Haiku 相近的速度和成本的同时,实现了在各项能力上的提升,在多项基准测试中超越了 Claude 3...
-
Mochi 1是由Genmo公司推出的开源视频生成模型,在动作质量和遵循用户提示方面表现出色。Mochi 1基于Apache 2.0许可证发布,支持个人和商业用途的免费使用。模型目前提供480p的基础版本,计划在年底前推出支...