网站首页 > AI工具 第6页
  • ASAL  Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

    ASAL Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

    154

    ASAL(Automated Search for Artificial Life)是用基础模型自动化搜索人工生命(ALife)系统。ASAL是Sakana AI及MIT、OpenAI等机构联合推出的,主要基于三种搜索机制实...

  • Browser Use  AI 浏览器助手,自动执行网页中的交互任务

    Browser Use AI 浏览器助手,自动执行网页中的交互任务

    261

    Browser Use是专门为大语言模型服务的智能浏览器工具,创新的Python工具库,让AI代理能像人类一样自然地浏览和操作网页。Browser Use支持多标签页管理、视觉识别、内容提取,并能记录和重复执行特定动作。...

  • Midscene.js  AI驱动的 UI 自动化测试框架

    Midscene.js AI驱动的 UI 自动化测试框架

    180

    Midscene.js是基于AI技术的自动化SDK,通过用大型语言模型(LLM)简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式,Midscene.js将执行相应的操作。Midscene.js支持执行动作...

  • QVQ  阿里通义开源的视觉推理模型

    QVQ 阿里通义开源的视觉推理模型

    150

    QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型,结合视觉理解和复杂问题解决能力,提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力,尤其在需要复杂分析思维的领域表现出色。QVQ在MMMU评测中取...

  • PC Agent  上海交大联合 GAIR 推出的电脑智能体AI系统

    PC Agent 上海交大联合 GAIR 推出的电脑智能体AI系统

    141

    PC Agent是上海交通大学和Generative AI Research Lab (GAIR 联合推出的先进AI系统。系统基于模拟人类认知过程,执行如组织研究材料、起草报告和创建演示文稿等复杂数字工作。PC Agent集...

  • Open Notebook  开源 AI 笔记工具,自动将多格式笔记转换成博客

    Open Notebook 开源 AI 笔记工具,自动将多格式笔记转换成博客

    146

    Open Notebook是开源、注重隐私的谷歌NotebookLM替代工具,能帮助用户管理研究工作流程,生成AI辅助笔记,并与内容互动。Open Notebook支持多笔记本、多模型,包括Open AI、Anthropic...

  • DreamOmni  港中文、字节等机构共同推出的统一图像生成和编辑模型

    DreamOmni 港中文、字节等机构共同推出的统一图像生成和编辑模型

    178

    DreamOmni 是香港中文大学、字节跳动和香港科技大学共同推出的统一图像生成和编辑模型。模型整合文本到图像(T2I)生成和多种编辑任务,包括指令式编辑、修复、拖拽编辑和参考图像生成。DreamOmni 基于一个高效的合成...

  • Sketch2Sound  Adobe 联合西北大学推出的AI音频生成技术

    Sketch2Sound Adobe 联合西北大学推出的AI音频生成技术

    153

    Sketch2Sound是Adobe 研究院和西北大学推出的AI音频生成技术,能基于声音模仿和文本提示生成高品质音效。Sketch2Sound从声音模仿中提取响度、亮度和音高三个控制信号,将控制信号编码后用于条件文本到声音的...

  • OmniAudio-2.6B  Nexa AI推出的端侧多模态音频语言模型

    OmniAudio-2.6B Nexa AI推出的端侧多模态音频语言模型

    149

    OmniAudio-2.6B是Nexa AI推出的音频语言模型,专为边缘部署设计,能实现快速且高效的音频文本处理。OmniAudio-2.6B是具有2.6亿参数的多模态模型融合Gemma-2-2b、Whisper Turbo...

  • Granite 3.1  IBM 推出的新版语言模型

    Granite 3.1 IBM 推出的新版语言模型

    185

    Granite 3.1是IBM推出的新一代语言模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构:密集模型2B和8B参数模型,总共使用 12 万亿个token进行训练...

2 3 4 5 6 7 8 9 10 11
返回顶部 暗黑模式