908阅读
2回复

[数码讨论]DeepSeek昨夜上新！新旧版V3对比实测，代码能力飙升，震惊海外用户[11P] [复制链接]

上一主题下一主题查看指定楼层

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 222046

金币: 694909

道行: 2006

原创: 2450

奖券: 3340

斑龄: 42

道券: 1233

获奖: 0

座驾

设备

摄影级

在线时间: 48135(小时)
注册时间: 2008-10-01
最后登录: 2026-01-27

只看楼主倒序阅读使用道具楼主发表于: 2025-03-25

— 本帖被兵马大元帅执行加亮操作(2025-03-26) —

智东西

作者 | 陈骏达

编辑 | 漠影

智东西3月25日报道，昨日晚间，DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324，模型参数为6850亿，较早期版本的6710亿有小幅增长。不过，DeepSeek尚未放出新版模型的系统卡，我们暂时无法获取关于这款模型的更多信息。

开源地址：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

同时，DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议，这一协议更为宽松，允许模型蒸馏、商用等行为，给了开发者更多的自主权。

新版DeepSeek-V3上线后，智东西第一时间进行了代码、数学和通用能力等多方面的测试，并关注到广大网友的测试结果。据众多已经体验上这款模型的网友分享，升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。

一位海外AI博主称，DeepSeek终于能在代码领域和Anthropic的Claude Sonnet 3.5一决高下了。而之前，Claude Sonnet 3.5在程序员圈内拥有极高的声誉，无论诸多模型在代码上的成绩如何变化，程序员依旧更青睐使用Claude系列模型。

在智东西的测试中，新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大的进步，在输入“设计一个美观的个人博客网站，带有科技感，直接开发成可用网页”的提示词之后，直接获得了如下的网页效果。

新版DeepSeek-V3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站，据其介绍，网站采用了粒子背景动画、赛博朋克UI（霓虹光效、悬浮动画和科技感配色）等设计元素，标题使用打字机动画，按钮具备光波扩散效果。

这一网站还使用了响应式设计，能自动适配手机和桌面设备。

而当旧版DeepSeek-V3获得相同的指令时，其解决方案仅有100多行代码，输出的结果在审美上也不如新版的DeepSeek-V3。

有网友称，这次的“小更新”比预期中的更大，改进显著，尤其是在数学方面。

智东西将之前实测中，曾难倒旧版DeepSeek-V3和DeepSeek-R1的一道数学题交给新版DeepSeek-V3。这次，DeepSeek-V3输出的token与原版DeepSeek-V3总量明显更长，单次输出达到了输出上限，点击继续生成后，DeepSeek-V3继续思考，但这次的答案依旧是错误的。

不过，从错误的答案中，我们也能观察到一些新的变化，如今的DeepSeek-V3在给出最终答案后，会进行一定程度的反思，并修改自己的解题过程。

而在智东西先前测试的文科类问题上，新版DeepSeek-V3的答案变得更为全面。智东西的测试问题为：“布须曼人喝不喝牛奶？”旧版DeepSeek-V3对这一问题的回答仅有三小段话，信息量不多。

新版DeepSeek-V3采用了更为结构化的回答模式，分析的内容更为全面，补充了更多的背景信息，同时生成的速度依旧比较理想。

这也印证了部分网友总结出来的特点：新版DeepSeek-V3像是V3与R1的结合体，更倾向用长输出解决问题。

新版DeepSeek-V3的发布，也让诸多网友不禁遐想：新版V3都来了，R2和V4还会远吗？

山庄提示：道行不够，道券不够？---☆点此充值☆

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 222046

金币: 694909

道行: 2006

原创: 2450

奖券: 3340

斑龄: 42

道券: 1233

获奖: 0

座驾

设备

摄影级

在线时间: 48135(小时)
注册时间: 2008-10-01
最后登录: 2026-01-27

只看该作者沙发发表于: 2025-03-25

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

　　根据智东西的报道，DeepSeek最近在开源平台上发布了升级后的DeepSeek-V3模型，版本号为DeepSeek-V3-0324，模型参数增至6850亿，相较于早期版本的6710亿有所增加。以下是关于新模型的一些关键信息：

　　1. 开源地址：新模型已在Hugging Face平台开源，地址为：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324。

　　2. 开源协议更新：DeepSeek将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议，这一协议更为宽松，允许模型蒸馏、商用等行为，给开发者更多自主权。

　　3. 性能提升：升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。海外AI博主认为DeepSeek现在能在代码领域与Anthropic的Claude Sonnet 3.5竞争。

　　4. 网站开发能力：新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大进步。在设计个人博客网站的测试中，新版DeepSeek-V3在2分钟内交付了一个400多行代码、设计精良的网站，采用粒子背景动画、赛博朋克UI等设计元素。

　　5. 响应式设计：该网站还使用了响应式设计，能自动适配手机和桌面设备。

　　6. 数学问题解决：新版DeepSeek-V3在解决数学问题时，输出的token量明显更长，虽然答案依旧错误，但会进行一定程度的反思，并修改解题过程。

　　7. 文科类问题回答：新版DeepSeek-V3在回答文科类问题时变得更全面，补充了更多背景信息，同时生成速度依旧理想。

　　8. 网友评价：新版DeepSeek-V3像是V3与R1的结合体，更倾向用长输出解决问题。

　　综上所述，新版DeepSeek-V3的发布带来了显著的性能提升和新功能，在代码、数学、UI设计等方面都有明显进步。同时，开源协议的更新也为开发者提供了更多灵活性。新版V3的发布也让人期待未来的R2和V4版本。

如何不发帖就快速得到金币和道行

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 169328

金币: 509018

道行: 20030

原创: 768

奖券: 359

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 20930(小时)
注册时间: 2012-06-21
最后登录: 2026-01-27

只看该作者板凳发表于: 2025-03-25

关于DeepSeek-V3的最新升级，综合多平台实测信息，核心进展与用户反馈如下：

一、模型升级概况
参数与版本
新版模型为DeepSeek-V3-0324，参数量从6710亿增至6850亿（+140亿）13，采用MoE架构，推测为未来DeepSeek-R2的基础模型。
发布风格
延续DeepSeek低调务实的风格，无预热宣传，直接上线开源模型权重与MIT协议许可。
二、代码能力显著提升
工程化代码生成
生成代码更符合工程规范，例如多线程异步任务处理、动态网页交互设计时主动提示性能优化点。
在天气动画卡片生成测试中，新版代码逻辑与Claude3.7接近，老版则存在明显差距。
基准测试表现
在KCORES大模型竞技场中，以328.3分位列第三，超越DeepSeek-R1和Claude3.7非推理版本。
Aider多语言测试成绩达55%，仅次于Claude3.7，接近专业推理模型水平。
三、数学与推理突破
复杂问题解决
新增解决推理类问题的能力，如4升水壶问题（传统需专用推理模型）。
物理模拟改进
20小球碰撞测试：物理运动模拟更真实，老版结果曾出现“挤成一团”问题。
火星任务与行星模拟：渲染精度提升，成为唯一画出土星环的模型。
四、开源与商业化
协议变更：从自定义许可证升级为MIT协议，支持自由修改、分发及商业化应用。
运行优化：通过4-bit量化可在**M3 Ultra（512GB）**实现20+ token/s推理速度，消费级设备友好。
五、用户评价与行业影响
海外开发者称其“强的过分了”，代码生成效果“眼前一亮”。
对比Claude3.7等闭源模型，被视为开源领域新标杆，用户对DeepSeek-R2的期待远超GPT-。
六、未来展望
按DeepSeek迭代节奏，**DeepSeek-R2（推理增强版）**或于几周内发布，性能有望进一步突破。

如需体验，可通过官方平台或下载量化版本地部署

如何不发帖就快速得到金币和道行

我有我可以

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[数码讨论]DeepSeek昨夜上新！新旧版V3对比实测，代码能力飙升，震惊海外用户[11P] [复制链接]