网站首页 > AI工具 第46页
  • Zamba2-7B  Zyphra推出的小型语言模型

    Zamba2-7B Zyphra推出的小型语言模型

    88

    Zamba2-7B是Zyphra公司推出的小型语言模型,基于创新的架构在保持输出质量的同时实现快速的推理速度和低内存占用。模型在处理图像描述等任务时表现出色,适合在边缘设备和消费级GPU上运行。Zamba2-7B采用Mamb...

  • WonderWorld  斯坦福和MIT联合推出的生成多样化连贯3D场景AI框架

    WonderWorld 斯坦福和MIT联合推出的生成多样化连贯3D场景AI框架

    85

    WonderWorld是斯坦福大学和麻省理工学院共同推出的创新性3D场景生成框架,能从单张图片快速生成多样化且连贯的3D虚拟世界。基于核心的Fast LAyered Gaussian Surfels (FLAGS 表示法和引...

  • Meissonic  阿里联合多所高校推出的文本到图像合成模型

    Meissonic 阿里联合多所高校推出的文本到图像合成模型

    98

    Meissonic是由阿里巴巴集团、Skywork AI等多所大学合作推出的文本到图像合成模型。模型用掩蔽生成变换器(MIM)技术,结合多模态和单模态变换器层、先进的旋转位置编码(RoPE)策略及动态掩蔽率作为采样条件,提升...

  • BlinkShot  开源的实时AI图像生成器,几毫秒内生成高质量图像

    BlinkShot 开源的实时AI图像生成器,几毫秒内生成高质量图像

    109

    BlinkShot是实时AI图像生成器,能迅速生成高质量的图像。用户只需输入提示,BlinkShot能在几毫秒内生成图像。工具基于Together AI的Flux Schnell技术,支持自定义分辨率和生成步骤,非常适合艺术...

  • NotebookLlama  Meta推出的预处理PDF后转播客内容的开源项目

    NotebookLlama Meta推出的预处理PDF后转播客内容的开源项目

    81

    NotebookLlama是Meta推出的开源项目,用LLaMa模型将PDF文件转换成播客内容。项目用一系列核心流程实现,包括预处理PDF清除杂乱字符和编码错误,用Llama-3.1-70B-Instruct模型将文本转换成...

  • TextHarmony  字节联合华东师范推出的多模态生成模型

    TextHarmony 字节联合华东师范推出的多模态生成模型

    79

    TextHarmony是华东师范大学和字节跳动共同推出的多模态生成模型,擅长理解和生成视觉文本。模型基于Slide-LoRA技术,动态聚合特定于模态和模态无关的LoRA专家,部分解耦多模态生成空间,在单一模型实例中协调视觉和...

  • EveryoneNobel  AI图像生成工具,生成个性化诺贝尔奖风格图像

    EveryoneNobel AI图像生成工具,生成个性化诺贝尔奖风格图像

    130

    EveryoneNobel是一个开源AI工具,为每个人生成个性化的诺贝尔奖风格图像。EveryoneNobel基于ComfyUI框架,结合HTML模板和图像生成技术,用户只需上传肖像照片、提供基本信息,如姓名和获奖主题,系统...

  • AutoGLM  智谱AI推出的模拟人类操作手机的AI智能体产品

    AutoGLM 智谱AI推出的模拟人类操作手机的AI智能体产品

    140

    AutoGLM是智谱AI团队推出的智能体产品,基于图形用户界面(GUI)实现自主任务完成。AutoGLM能模拟人类在手机操作,执行如社交媒体互动、在线购物、酒店预订等任务。AutoGLM能接收简单的文字或语音指令,自动完成复...

  • Unbounded  谷歌联合北卡罗来纳推出的交互式生成式无限游戏

    Unbounded 谷歌联合北卡罗来纳推出的交互式生成式无限游戏

    134

    Unbounded是谷歌和北卡罗来纳大学教堂山分校共同推出的无限人生模拟游戏。游戏突破传统视频游戏的局限,用生成模型,如大型语言模型(LLM 和视觉生成模型,创造一个没有固定规则和边界的游戏体验。玩家与自己的虚拟角色互动,用...

  • GLM-4-Voice  智谱AI推出的端到端情感语音模型

    GLM-4-Voice 智谱AI推出的端到端情感语音模型

    126

    GLM-4-Voice是智谱AI推出的端到端情感语音模型,能直接理解和生成中英文语音,支持实时语音对话,能根据用户指令灵活调整语音的情感、语调、语速和方言等特征。模型由三个部分组成:GLM-4-Voice-Tokenizer...

42 43 44 45 46 47 48 49 50 51
返回顶部 暗黑模式