首页news 正文
目录

开源版 OpenAI 再出神作:小模型吊打 Meta Llama 3,Ministral 系列开启边缘 AI 革命

news2024-10-24 02:34297570
Mistral 7B 一周年庆,法国 AI 初创公司 Mistral 推出两款轻量级模型:Ministral 3B 和 Ministral 8B,性能超越 Llama 3 8B。Mistral 7B 一周年纪念,法国 AI 初创公司推出小型模型「les Ministraux」,被誉为全球一流的边缘模型。Ministral 3B 和 Ministral 8B是...

Mistral 7B 一周年庆,法国 AI 初创公司 Mistral 推出两款轻量级模型:Ministral 3B 和 Ministral 8B,性能超越 Llama 3 8B。


Mistral 7B 一周年纪念,法国 AI 初创公司推出小型模型「les Ministraux」,被誉为全球一流的边缘模型。

Ministral 3B 和 Ministral 8B是专为边缘设备设计的轻量级模型,现已成为 Mistral 大家族中的一员,与 Mixtral、Pixtral、Codestral 和 Mathstral 齐名。

这两款模型虽然只有30亿参数,但在指令跟随基准上已经超越了 Llama 3 8B 和先前的 Mistral 7B。而且,Ministral 3B 和 Ministral 8B 在大模型测试中,表现出色,与 Gemma 2 和 Llama 3.1 开源模型不相上下。

领先的边缘模型

Ministral 3B 和 Ministral 8B 支持高达128k的上下文(目前在 vLLM 上为32k)。

在知识、常识、推理、函数调用、效率等方面,它们为低于10B参数的模型设立了新的标准。

此外,Ministral 8B 还引入了滑动窗口注意机制,以实现更快速和内存高效的推理。

无论是管理复杂的 AI 智能工作流,还是构建定制任务助手,它们都可经微调应用于各种用例。

超越开源模型,击败 Mistral 7B

研究人员对 Les Minimrau 的性能进行了多项基准测试。

涵盖知识、代码、数学、多语言等方面。

预训练模型

在视觉上可见,与 Gema 2 2B、Llama 3.2 3B 相比,Minstral 3B在以上基准上表现最佳。

在与 Llama 3.1 8B、Mistral 7B比较时,Minstral 8B在代码方面略逊一筹,但在其他方面依然是性能最佳的模型。

以下是更加直观的柱状图,展示Minstral 8B在各项测试中的领先地位。

指令模型

进一步分析微调后的指令模型性能。

在大型模型测试中,Minstral 3B在不同基准上表现出色。Minstral 8B在Wild Bench上仅略逊于Gema 2 9B。

此外,在代码、数学、函数调用等方面,这两款新模型的性能大幅超越其他模型。

以下图能够直观展示Minstral 3B与更大的Mistral 7B在指令微调后的改进。

Minstral 8B的指令微调后模型与其他模型的性能对比图如下。

支持边缘计算,每百万 token 仅需0.1美元

现今,小型模型在实际应用中更胜一筹于大型模型。越来越多的用户希望优先在本地进行推理,例如设备端翻译、智能助手等。

正如官方所言,Les Minimraux 提供高效计算、低延迟的解决方案,适用于这些场景。

与 Mistral Large 等大模型结合使用时,les Ministraux可作为多步智能工作流中调用函数的高效中介。

通过微调,它们可在用户意图下实现跨多个上下文的输入解析、任务路由和API调用,实现低延迟和成本。

价格

据官方报价,Minstral 8B的百万token输入输出价格为0.1美元。Minstral 3B为百万token0.04美元。

开源版 OpenAI,摆脱 "开源" 标签

自创立以来,Mistral以开源方式发布多款与OpenAI媲美的模型,受到AI社区的青睐。

位于巴黎的Mistral由Meta和谷歌DeepMind前员工创立。

几个月前,Mistral以60亿美元估值完成了6.4亿美元的新一轮融资,并推出了GPT-4级的模型——Mistral Large 2。

今年,他们还推出了专家混合模型Mixtral 8x22B,其中包括Codestral编码模型以及数学推理和科学发现模型。

然而,今年,这家备受瞩目的公司陷入了争议,因为其开源态度有所改变。

不久前有消息称,微软将收购Mistral的部分股份,并进行投资,意味着其模型将被托管到Azure AI中。

甚至有Reddit用户发现,Mistral已从官网中删除了致力于开源的承诺。

Mistral在一些模型的调用中开始收费,与之前可能不同。

有网友抱怨说,这已不再是真正的开源。

对初创公司来说,坚持开源代码一直是一个挑战。正如Stability AI所示,它放弃了开源商业模式,转向了收费策略。

Mistral亦面临相同困境,若要持续打造优秀模型,或许只能做出这一选择。

参考资料:

  • https://x.com/dchaplot/status/1846575384718172448

  • https://x.com/GuillaumeLample/status/1846566817650679966

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

扫描二维码推送至手机访问。

本文转载自互联网,如有侵权,联系删除。

本文链接:https://xiezilouchuzuwang.cn/news/3347.html

您暂未设置收款码

请在主题配置——文章设置里上传

扫描二维码手机访问

文章目录