Granite 3.1 IBM 推出的新版语言模型

Granite 3.1是什么

Granite 3.1是IBM推出的新一代语言模型，具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构：密集模型2B和8B参数模型，总共使用 12 万亿个token进行训练。专家混合MoE模型：稀疏1B和3B MoE 模型，分别具有 400M 和 800M 激活参数，总共使用 10 万亿个token进行训练。Granite 3.1支持128K令牌的上下文长度，能处理复杂的文本和任务。Granite 3.1引入全新的嵌入模型，覆盖12种语言，增强多语言支持。Granite Guardian 3.1模型具备功能调用幻觉检测能力，提升对工具调用的控制和可观察性。

Granite 3.1的主要功能扩展的上下文窗口：上下文窗口扩展到128K令牌，支持模型处理更大的输入，进行更长的连续交互，并在每个输出中融入更多信息。全新的嵌入模型：推出一系列新的检索优化的Granite Embedding模型，提供从30M到278M参数的不同大小，支持12种不同语言的多语言支持。功能调用幻觉检测： Guardian 3.1 8B和2B模型新增功能调用幻觉检测能力，增强对进行工具调用的代理的控制和可观察性。Granite 3.1的技术原理大型语言模型（LLM）：基于大型语言模型构建，通过深度学习和自然语言处理技术训练，理解和生成自然语言文本。变换器架构（Transformer Architecture）：用变换器架构，捕捉文本中的长距离依赖关系。上下文窗口（Context Window）：扩展上下文窗口至128K令牌，模型能同时考虑更多的信息，处理更长的文本和更复杂的任务。多语言支持（Multilingual Support）：训练模型识别和理解多种语言，支持12种不同语言的文本处理。Granite 3.1的项目地址项目官网：ibm-granite-3-1GitHub仓库：https://github.com/ibm-granite/granite-3.1HuggingFace模型库：https://huggingface.co/collections/ibm-granite/granite-31Granite 3.1的应用场景客户服务自动化：构建聊天机器人和虚拟助手，自动化客户咨询和支持服务，提高响应速度和效率。内容创作与编辑：帮助内容创作者生成、编辑和优化文本内容，包括文章、报告和营销材料。企业搜索和知识管理：基于语义搜索和向量搜索技术，改进企业内部的知识检索系统，帮助员工快速找到所需信息。语言翻译和本地化：翻译服务和跨国公司的本地化项目。风险管理和合规性检查：在金融和法律领域，帮助分析和理解大量文档，确保合规性和风险管理。

Granite 3.1 IBM 推出的新版语言模型

Solana日交易笔数达7280万，创历史新高

OmniAudio-2.6B Nexa AI推出的端侧多模态音频语言模型

Granite 3.1 IBM 推出的新版语言模型

Solana日交易笔数达7280万，创历史新高

OmniAudio-2.6B Nexa AI推出的端侧多模态音频语言模型

相关文章