切换到宽版
  • 72阅读
  • 2回复

[数码讨论]DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户[11P] [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
138494
金币
42717
道行
1971
原创
2350
奖券
2508
斑龄
32
道券
903
获奖
0
座驾
设备
摄影级
在线时间: 32626(小时)
注册时间: 2008-10-01
最后登录: 2025-03-28
— 本帖被 兵马大元帅 执行加亮操作(2025-03-26) —

智东西

作者 | 陈骏达

编辑 | 漠影

智东西3月25日报道,昨日晚间,DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850亿,较早期版本的6710亿有小幅增长。不过,DeepSeek尚未放出新版模型的系统卡,我们暂时无法获取关于这款模型的更多信息。

开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

同时,DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权。

新版DeepSeek-V3上线后,智东西第一时间进行了代码、数学和通用能力等多方面的测试,并关注到广大网友的测试结果。据众多已经体验上这款模型的网友分享,升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。

一位海外AI博主称,DeepSeek终于能在代码领域和Anthropic的Claude Sonnet 3.5一决高下了。而之前,Claude Sonnet 3.5在程序员圈内拥有极高的声誉,无论诸多模型在代码上的成绩如何变化,程序员依旧更青睐使用Claude系列模型。

在智东西的测试中,新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大的进步,在输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”的提示词之后,直接获得了如下的网页效果。

新版DeepSeek-V3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站,据其介绍,网站采用了粒子背景动画、赛博朋克UI(霓虹光效、悬浮动画和科技感配色)等设计元素,标题使用打字机动画,按钮具备光波扩散效果。

这一网站还使用了响应式设计,能自动适配手机和桌面设备。

而当旧版DeepSeek-V3获得相同的指令时,其解决方案仅有100多行代码,输出的结果在审美上也不如新版的DeepSeek-V3。

有网友称,这次的“小更新”比预期中的更大,改进显著,尤其是在数学方面。

智东西将之前实测中,曾难倒旧版DeepSeek-V3和DeepSeek-R1的一道数学题交给新版DeepSeek-V3。这次,DeepSeek-V3输出的token与原版DeepSeek-V3总量明显更长,单次输出达到了输出上限,点击继续生成后,DeepSeek-V3继续思考,但这次的答案依旧是错误的。

不过,从错误的答案中,我们也能观察到一些新的变化,如今的DeepSeek-V3在给出最终答案后,会进行一定程度的反思,并修改自己的解题过程。

而在智东西先前测试的文科类问题上,新版DeepSeek-V3的答案变得更为全面。智东西的测试问题为:“布须曼人喝不喝牛奶?”旧版DeepSeek-V3对这一问题的回答仅有三小段话,信息量不多。

新版DeepSeek-V3采用了更为结构化的回答模式,分析的内容更为全面,补充了更多的背景信息,同时生成的速度依旧比较理想。

这也印证了部分网友总结出来的特点:新版DeepSeek-V3像是V3与R1的结合体,更倾向用长输出解决问题。

新版DeepSeek-V3的发布,也让诸多网友不禁遐想:新版V3都来了,R2和V4还会远吗?


山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
138494
金币
42717
道行
1971
原创
2350
奖券
2508
斑龄
32
道券
903
获奖
0
座驾
设备
摄影级
在线时间: 32626(小时)
注册时间: 2008-10-01
最后登录: 2025-03-28
只看该作者 沙发  发表于: 03-25
  根据智东西的报道,DeepSeek最近在开源平台上发布了升级后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324,模型参数增至6850亿,相较于早期版本的6710亿有所增加。以下是关于新模型的一些关键信息:

  1. 开源地址:新模型已在Hugging Face平台开源,地址为:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

  2. 开源协议更新:DeepSeek将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给开发者更多自主权。

  3. 性能提升:升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。海外AI博主认为DeepSeek现在能在代码领域与Anthropic的Claude Sonnet 3.5竞争。

  4. 网站开发能力:新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大进步。在设计个人博客网站的测试中,新版DeepSeek-V3在2分钟内交付了一个400多行代码、设计精良的网站,采用粒子背景动画、赛博朋克UI等设计元素。

  5. 响应式设计:该网站还使用了响应式设计,能自动适配手机和桌面设备。

  6. 数学问题解决:新版DeepSeek-V3在解决数学问题时,输出的token量明显更长,虽然答案依旧错误,但会进行一定程度的反思,并修改解题过程。

  7. 文科类问题回答:新版DeepSeek-V3在回答文科类问题时变得更全面,补充了更多背景信息,同时生成速度依旧理想。

  8. 网友评价:新版DeepSeek-V3像是V3与R1的结合体,更倾向用长输出解决问题。

  综上所述,新版DeepSeek-V3的发布带来了显著的性能提升和新功能,在代码、数学、UI设计等方面都有明显进步。同时,开源协议的更新也为开发者提供了更多灵活性。新版V3的发布也让人期待未来的R2和V4版本。

如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
124445
金币
83690
道行
20019
原创
752
奖券
34
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 13061(小时)
注册时间: 2012-06-21
最后登录: 2025-03-28
只看该作者 板凳  发表于: 03-25
关于DeepSeek-V3的最新升级,综合多平台实测信息,核心进展与用户反馈如下:

一、模型升级概况
参数与版本
新版模型为DeepSeek-V3-0324,参数量从6710亿增至6850亿(+140亿)13,采用MoE架构,推测为未来DeepSeek-R2的基础模型。
发布风格
延续DeepSeek低调务实的风格,无预热宣传,直接上线开源模型权重与MIT协议许可。
二、代码能力显著提升
工程化代码生成
生成代码更符合工程规范,例如多线程异步任务处理、动态网页交互设计时主动提示性能优化点。
在天气动画卡片生成测试中,新版代码逻辑与Claude3.7接近,老版则存在明显差距。
基准测试表现
在KCORES大模型竞技场中,以328.3分位列第三,超越DeepSeek-R1和Claude3.7非推理版本。
Aider多语言测试成绩达55%,仅次于Claude3.7,接近专业推理模型水平。
三、数学与推理突破
复杂问题解决
新增解决推理类问题的能力,如4升水壶问题(传统需专用推理模型)。
物理模拟改进
20小球碰撞测试:物理运动模拟更真实,老版结果曾出现“挤成一团”问题。
火星任务与行星模拟:渲染精度提升,成为唯一画出土星环的模型。
四、开源与商业化
协议变更:从自定义许可证升级为MIT协议,支持自由修改、分发及商业化应用。
运行优化:通过4-bit量化可在**M3 Ultra(512GB)**实现20+ token/s推理速度,消费级设备友好。
五、用户评价与行业影响
海外开发者称其“强的过分了”,代码生成效果“眼前一亮”。
对比Claude3.7等闭源模型,被视为开源领域新标杆,用户对DeepSeek-R2的期待远超GPT-。
六、未来展望
按DeepSeek迭代节奏,**DeepSeek-R2(推理增强版)**或于几周内发布,性能有望进一步突破。

如需体验,可通过官方平台 或下载量化版本地部署
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个