法国AI初创公司Les Ministraux 推出两款全新轻量级模型Ministral3B和Ministral8B,专为边缘设备设计,参数分别为30亿和80亿。这两款模型在指令跟随基准测试中表现出色,Ministral3B超越了Llama38B和Mistral7B,Ministral8B则在除代码能力外其他方面均优于这两个模型。

测试结果显示,Ministral3B和Ministral8B的性能可媲美Gemma2和Llama3.1等开源模型。 这两款模型都支持高达128k的上下文,并在知识、常识、推理、函数调用和效率方面为低于10B参数的模型树立了新的标杆。 Ministral8B还配备了滑动窗口注意机制,以实现更快、更高效的内存推理。 它们可以被微调到各种用例中,例如管理复杂的AI智能体工作流程或创建专门的任务助手。

研究人员对Les Ministraux模型进行了多项基准测试,涵盖知识与常识、代码、数学和多语言等方面。 在预训练模型阶段,Ministral3B在与Gema22B、Llama3.23B的比较中取得了最佳成绩。 Ministral8B在与Llama3.18B、Mistral7B的比较中,除代码能力外其他方面均表现最佳。 在微调后的指令模型阶段,Ministral3B在不同基准测试中均取得最佳成绩,Ministral8B仅在Wild bench上略逊于Gema29B。

Les Ministraux模型的推出为用户提供了高计算效率、低延迟的解决方案,满足了越来越多用户对关键应用程序本地优先推理的需求。 用户可以将这些模型应用于设备上翻译、无需联网的智能助理以及自动机器人等场景。 Ministral8B的输入输出价格为每百万token0.1美元,Ministral3B则为每百万token0.04美元。

值得注意的是,Mistral 公司此前曾以磁力链接方式开源多款模型,并获得AI社区的认可。 然而,该公司今年陷入争议,因为它不再像以前那样开放。 有消息称微软将收购Mistral的部分股份并对其进行投资,这意味着Mistral的模型将在Azure AI上托管。 Reddit网友发现Mistral已从官网上删除了关于开源的承诺。 该公司的一些模型也开始收费,包括此次发布的Ministral3B和Ministral8B。

详情:https://mistral.ai/news/ministraux/