DeepSeek突发新模型!媲美Gemini3 Pro,为智能体而生

ChatGPT发布三周年之际,DeepSeek搞了个突然袭击。刚刚发布了「DeepSeek-V3.2」和「DeepSeek-V3.2-Speciale」两款模型。

模型有多强呢?一句话你就懂了:超越GPT-5,与Gemini3 Pro不相上下。

分别介绍一下。

DeepSeek-V3.2,适合日常场景,平衡了推理能力与输出长度。在推理测试中,比Gemini3 Pro稍差一点,但能和GPT-5打个平手。

DeepSeek-V3.2-Speciale,不装了,达到开源模型的最强推理能力。在各大测试中的表现,媲美最强模型Gemini3 Pro。图片

IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)、IOI 2025(国际信息学奥林匹克)这些顶级竞赛的金牌随便拿!

这次的新模型有什么不同呢?

DeepSeek-V3.2将思考融入了工具使用。思考和非思考模式下,都能实现工具调用。这简直就是为智能体而生的呀!DeepSeek团队还提出了一种大规模Agent训练数据合成方法。他们用大量的难以解答,但容易验证的任务,进行强化学习训练。这样可以大幅提高模型的泛化能力。下面是DeepSeek-V3.2在智能体工具调用方面评测的表现。图片

开源模型中的top one。

官方给出一个示例:

深度思考加上工具调用,回答效果大大提升。此外,DeepSeek-V3.2引入的DSA机制(DeepSeek Sparse Attention)也有不小功劳想要了解DSA的小伙伴,可以看之前写的这篇:DeepSeek突发新模型!创新注意力机制,API价格大跳水

或者直接看DeepSeek的新模型技术报告:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf

总的来说,DSA大幅提高了模型在长文本上的表现,并且几乎不降低输出质量。 

最后,附上两个版本的开源地址:

DeepSeek-V3.2

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2

ModelScope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

DeepSeek-V3.2-Speciale

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

ModelScope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

同时期待DeepSeek早日发布R2模型!

声明:本文为维科号作者发布,不代表维科号立场。如有侵权或其他问题,请及时联系我们举报。