用 1/8 资本并排 Claude 3.7,刚刚云开体育,"欧洲 OpenAI " Mistral AI 发布多模态新模子。
Mistral Medium 3,主打编程和多模态相识,且在性能和资本间进行了均衡。
官方称,在千般基准测试中,Mistral Medium 3 性能达到或卓著 Claude Sonnet 3.7 的 90%,且资本大大镌汰。
Claude 3.7 Sonnet 的价钱为每百万输入 token 3 好意思元,每百万输出 token 15 好意思元,而 Mistral Medium 3:
每百万输入 token 仅 0.4 好意思元,每百万输出 token 2 好意思元。
举座性能,非论是和越过开源模子 Llama 4 Maverick 还是和企业级模子 Cohere Command A 比较,Mistral Medium 3 皆能打得有来有回。
现在,Mistral Medium 3 API 已在 Mistral La Plateforme 和 Amazon Sagemaker 上线,不久后还将在 IBM WatsonX、NVIDIA NIM、Azure AI Foundry 和 Google Cloud Vertex 上推出。
具备一系列企业级才调
底下具体来望望基准测试。
Mistral Medium 3 在编程和 STEM 任务中尤为杰出。
官方原话是"其性能以致接近绝顶大且运转速率慢得多的竞争敌手"。
不外呢,既不怒放模子权重,也莫得涌现模子大小……
另外,Mistral AI 还发布了第三方东说念主类评估。
东说念主类评估中,Mistral Medium 3 依旧是在编程方面占优势。
在多模态和其他东说念主谈话任务中,比较 Llama 4 Maverick,Mistral Medium 3 的弘扬也占优势。
除了测试数据以外,官方还寥落强调了其顺应企业环境的才调,包括:
羼杂部署或腹地 / 虚构特有云(VPC)里面署
定制化后期教师
与企业用具和系统集成
企业不错爽气将智能全面集成到系统中,借助 Mistral 的诳骗 AI 处置决策,该模子不错抓续进行预教师、全面微调,并融入企业学问库,使其成为针对特定畛域教师、抓续学习和自顺应责任进程的高保真处置决策。
官方称,金融办事、动力和医疗保健畛域的客户正在使用该模子测试,通过深切的配景信息来丰富客户办事、达成业务进程的个性化,并对复杂的数据集进行分析。
另外,他们还推出了 Le Chat Enterprise,这是一项面向企业的聊天机器东说念主办事,提供了 AI Agent 设立器之类的用具,并将 Mistral 的模子与 Gmail、Google Drive、SharePoint 品级三方办事集成。
据了解,Le Chat Enterprise 将很快辅助 MCP。
Mistral Medium 3 发布后激发大皆网友缓和,有网友为其"高性价比"点赞。
不外也有不少网友吐槽模子没说开源遵循又高调地和开源模子比较,有点奇怪。
还有活动派网友,思看什么我方比较。
StabilityAI 独创东说念主翻出了 Gemini 2.5 Flash 的基准测试遵循:
看后暗示:
与 Gemini 2.5 Flash 竞争是何等穷困,Gemini 2.5 Flash 资本比 Mistral Medium 3 低 70%。
期待开源模子的发布,这是 Mistral 的关节优势。
One More Thing
继三月份推出 Mistral Small、当天推出 Mistral Medium 后,Mistral AI 涌现接下来几周正入辖下手开荒"大型"技俩。
参考邻接:
[ 1 ] https://mistral.ai/news/mistral-medium-3
[ 2 ] https://x.com/MistralAI/status/1920119463430500541
[ 3 ] https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/
— 完 —
� � 量子位 AI 主题筹谋正在征靠拢!接待参与专题365 行 AI 落地决策,一千零一个 AI 诳骗,或与咱们共享你在寻找的 AI 居品,或发现的AI 新动向。
� � 也接待你加入量子位逐日 AI 调换群,沿路来畅聊 AI 吧~
一键缓和 � � 点亮星标
科技前沿进展逐日见
一键三连「点赞」「转发」「防卫心」
接待在批驳区留住你的思法!云开体育