近日,由全球千万用户盲测投票产生的 AI 模型排行榜公布,国产 AI 模型“Yi-Lightning”一举夺魁,超越了此前长期占据榜首的 GPT-4。
“Yi-Lightning”模型由国内知名 AI 公司零一万物研发,在多个分榜中均名列前茅,其中数学分榜更是与国际巨头并列第三。
值得关注的是,“Yi-Lightning”的评分几乎与马斯克最新推出的 xAI 模型 Grok-2-08-13持平,并大幅领先于 GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18以及 Claude3.5Sonnet 等其他竞争对手。
此次排行榜的评选规则进行了重大调整,更加注重 AI 模型解决实际问题的能力,而非仅仅关注回答的长度和风格。
在新的规则下,“Yi-Lightning”仍然能够与 GPT-4和 Grok-2处于同一梯队,展现了其强大的实力。
翻译是人工智能模型应用的重要领域之一,它全面检验了模型在语言理解、生成、跨语言交流和上下文把握等方面的能力。通过与Qwen2.5-72b-Instruct、DeepSeek-V2.5和Doubao-pro等模型的对比,Yi-Lightning在翻译任务中展现出了卓越的性能:它不仅处理速度更快,而且翻译结果更具文学韵味,更加符合中文表达习惯。
比如,我随机摘取了一段巴黎圣母院的英文原文,Yi-Lightning不仅翻译速度更快,而且翻译结果也更贴合中文语境:
Yi-Lightning模型背后的技术创新也令人惊叹。它采用混合专家模型架构,优化了混合注意力机制,在处理长序列数据时大幅降低了推理成本。此外,闪电还引入了跨层注意力机制,让不同层次间的信息共享更加高效。
更有趣的是,Yi-Lightning可以根据任务难度动态选择最合适的专家网络组合。在训练阶段,所有专家网络都被激活,但在推理阶段,闪电会根据具体任务选择性激活相关专家,确保在面对各种挑战时都能游刃有余。
“Yi-Lightning”模型采用了混合专家模型架构和优化的混合注意力机制,能够高效处理长序列数据,并通过跨层注意力机制实现不同层次信息的高效共享。
更令人惊叹的是,“Yi-Lightning”可以根据任务难度动态选择最合适的专家网络组合,确保在面对各种挑战时都能应对自如。
零一万物创始人兼 CEO 李开复博士表示,“Yi-Lightning”模型在预训练阶段应用了多种策略,确保模型不仅速度快,还能学习到更丰富的知识。
同时,“Yi-Lightning”的定价策略也极具竞争力,每百万个 token 仅需0.99元,性价比极高。 李开复博士还指出,“闪电”的出色表现将国产 AI 与国际顶尖大模型的差距缩短至五个月,这不仅是技术的进步,更是对国内 AI 行业信心的体现。
参考:https://x.com/lmarena_ai/status/1846245604890116457