法国 AI 初创公司 Mistral 近日宣布推出了一系列新的生成式 AI 模型,这些模型专为边缘设备设计,比如笔记本电脑和手机。Mistral 将这系列模型命名为 “Les Ministraux”,旨在满足市场上对本地处理和隐私优先的需求。

新发布的 Les Ministraux 系列包括两个模型:Ministral3B 和 Ministral8B。值得注意的是,这两个模型的上下文窗口达到了128,000个 token,能够处理大约50页书的文本长度。这意味着无论是文本生成、在设备上进行翻译,还是提供离线的智能助手服务,这些模型都能应对自如。

Mistral 在其博客中表示,越来越多的客户和合作伙伴正在寻求能够在本地进行推理的解决方案,这些方案涉及到重要的应用场景,如设备上的翻译、本地分析和自主机器人等。Les Ministraux 正是为了在这些场景中提供计算高效、低延迟的解决方案而开发的。

目前,Ministral8B 已可供下载,但仅限于研究目的。希望获取 Ministral3B 或 Ministral8B 商业使用许可的开发者和公司需要直接联系 Mistral。同时,开发者也可以通过 Mistral 的云平台 La Platforme,以及未来几周内与其合作的其他云服务使用这两个模型。Ministral8B 的收费标准为每百万个输入 / 输出 token10美分,而 Ministral3B 则为4美分。

最近,小型模型的趋势愈演愈烈,因为它们的训练、微调和运行成本更低且速度更快。谷歌在其 Gemma 小型模型系列中持续添加新模型,而微软则推出了 Phi 系列模型。Meta 也在最新的 Llama 系列更新中推出了多个针对边缘硬件优化的小型模型。

Mistral 声称,Ministral3B 和 Ministral8B 在多个旨在评估指令遵循和问题解决能力的 AI 基准测试中,表现超越了同类的 Llama 和 Gemma 模型,以及其自身的 Mistral7B 模型。Mistral 总部位于巴黎,最近成功融资6.4亿美元,正在逐步扩展其 AI 产品组合。过去几个月,该公司推出了一项免费的服务,允许开发者测试其模型,并发布了一个 SDK,以便客户能够微调这些模型。此外,还推出了一个名为 Codestral 的代码生成模型。

Mistral 的共同创始人来自 Meta 和谷歌的 DeepMind,公司的目标是创建能够与 OpenAI 的 GPT-4o 和 Anthropic 的 Claude 等顶尖模型相媲美的旗舰模型,并在此过程中实现盈利。尽管 “盈利” 这一目标对于许多生成式 AI 初创公司来说都颇具挑战性,但 Mistral 据报道已经在今年夏天开始实现收入。

划重点:

1. 🚀 Mistral 推出的 Les Ministraux 系列模型专为边缘设备设计,支持本地隐私处理。

2. 💡 新模型包含 Ministral3B 和 Ministral8B,具备超强的上下文处理能力,适用于多种应用场景。

3. 💰 Mistral 已开始盈利,并不断扩展其 AI 产品组合,致力于与行业顶尖模型竞争。