Mistral Small 3.1 震撼发布——AI行业的小钢炮 - 你，mdjsjd生活 - 分享免费实用软件、有趣网站、各种黑科技！

法国 AI 新贵 Mistral AI 再次投下重磅炸弹，正式发布了其最新力作——Mistral Small 3.1！这款被誉为“AI界小钢炮”的模型，凭借其惊人的性能和速度，一经发布便引发了广泛关注，直接叫板Google Gemma 3、OpenAI GPT-4o Mini以及Anthropic Claude 3.5 Haiku等同量级对手。

核心亮点：性能、速度与理解力的全面升级

性能彪悍，碾压同级：根据官方发布的基准测试图表（Performance / GPQA-Diamond），Mistral Small 3.1在性能得分上（纵轴，越高越好）显著领先于Gemma 3-it (27B)、GPT-4o Mini和Claude-3.5 Haiku，同时保持着极低的延迟（横轴，越低越好）。这意味着它不仅“跑得快”，而且“能力强”。

perf-gpqa-diamond-mistral

推理神速，响应敏捷：Mistral Small 3.1的推理速度高达每秒150个token，这在实际应用中意味着更快的响应速度和更流畅的交互体验。
超长上下文，理解更深：支持高达128k的超长上下文理解能力，让它在处理长文档、进行多轮复杂对话时依然能够保持连贯和准确。
中文能力“非常强悍”：视频评测中特别强调，经过测试，Mistral Small 3.1的中文理解能力“非常强悍”。在多语言基准测试的“东亚”语言部分（包含中文），其表现同样领先。
多模态理解再进化：不仅限于文本，Mistral Small 3.1在多模态理解方面也进行了全面升级。无论是文本生成、代码编写，还是图像理解、图表分析，它都能轻松应对。视频中展示了它分析数学题图片、识别判断图片人物异同、解读复杂几何图形等能力。

基准测试：用数据说话

文本指导基准：在SimpleQA、GPQA Main、GPQA Diamond等测试中，Mistral Small 3.1（橙色柱状）普遍得分最高。
MMLU & HumanEval：在大规模多任务语言理解（MMLU）和人类偏好评估（HumanEval）等测试中，它也展现出领先优势。
数学能力 (MATH)：虽然在纯数学题解答上略低于Gemma 3，但仍表现不俗。
多模态基准：在MMMU-Pro、MathVista、MMMU、MM-MT-Bench以及ChartQA、DocVQA、AI2D等多个跨领域、数学、图文综合理解测试中，Mistral Small 3.1几乎全面领先。
长上下文 (RULER)：在处理长文本任务上，尤其在32k长度下表现突出，128k长度下也极具竞争力。

本地部署：触手可及的强大AI

更令人兴奋的是，Mistral Small 3.1是完全开源的（根据Apache 2.0许可发布）！这意味着：

硬件门槛降低：官方称模型可以在单个RTX 4090显卡或拥有32GB RAM的Mac上运行。
量化版本丰富：对于显存有限的用户，开源社区（如Hugging Face上的MHketbi/Mistral-Small3.1-24B-Instruct-2503）已提供多种量化版本（GGUF格式），从9.5GB到25GB不等，适配不同配置。
轻松部署：通过Ollama等工具，可以非常方便地在本地一键部署和运行Mistral Small 3.1。
WebUI交互：还可以配合如Page Assist这样的浏览器插件，在浏览器中直接调用本地运行的Mistral模型。

应用场景：从个人助手到企业定制

Mistral Small 3.1凭借其高效、轻量、低延迟、强能力的特点，应用场景极为广泛：