你的位置:全球信誉最好的网投平台是哪个 > 新闻动态 >
发布日期:2025-04-12 00:27 点击次数:147

出品 | 搜狐科技
作者 | 梁昌均
编辑 | 杨锦
“好得可怕。”这是开发者在实测DeepSeek最新模型后作出的评价。
3月24日晚间,DeepSeek悄悄上线最新更新后的模型DeepSeek-V3-0324,参数为6850亿,较去年12月发布的DeepSeek-V3的6710亿参数有所增长。
根据公开信息,DeepSeek-V3-0324延续了V3的核心架构,即基于混合专家(MoE)模型设计,模型参数包括6710亿的主模型和140亿参数的MTP(多Token预测)模块。
这款模型在开源社区Hugging Face亮相,但DeepSeek并未披露模型具体信息。DeepSeek官方也仅在用户交流群进行了同步,官方渠道(公众号、X平台)等均未发布有关推文。
虽然DeepSeek保持低调,且将此次定位为小型升级,但依然在开发者社群引发不少关注。
根据多位测试者反馈来看,DeepSeek-V3-0324在编程能力、数学推理、创造性任务等方面性能有明显提升,甚至优于Claude 3. 7系列,有评价认为其是“最强非推理模型”。
代码能力进一步优化,超过Claude-3.7-Sonnet
“DeepSeek-V3-0324是最好的非推理代码模型。”有开发者实测反馈称,其编码能力已接近国际顶尖闭源模型Claude 3.7 Sonnet,尤其是在前端代码生成和复杂逻辑处理中,表现出更高的准确性与流畅性。有用户评测称,其开发网站写了800多行代码且没有出现任何错误。
在多个编程评测基准上,DeepSeek-V3-0324取得了不俗的成绩。在开源社区的KCores大模型竞技场评测中,DeepSeek-V3-0324的编码能力位居第三,仅次于Claude-3.7-Sonnet-Thinking和Claude-3.5-Sonnet,超过了Claude-3.7-Sonnet、DeepSeek-R1、OpenAI-o1。此前,Claude-3.7-Sonnet被视为代码能力最好用的模型。

在涵盖C++、Java、Python等六种流行编程语言的测试Aider polyglot中,这款模型得分接近R1、Claude 3.7,超过o3-mini的水平。

同时,DeepSeek-V3-0324的成本也远远低于这些模型,预估仅有R1的五分之一。可以说,DeepSeek在优化性能的同时,依然在成本层面下足了功夫, 这可能与其模型架构的进一步优化调整有关。
Powered by 全球信誉最好的网投平台是哪个 @2013-2022 RSS地图 HTML地图
Copyright Powered by365建站 © 2013-2024