切换到宽版
  • 8阅读
  • 2回复

[数码讨论]刚刚,DeepSeek发了“终极版” [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
188327
金币
431776
道行
2004
原创
2428
奖券
3015
斑龄
38
道券
1101
获奖
0
座驾
设备
摄影级
在线时间: 42093(小时)
注册时间: 2008-10-01
最后登录: 2025-09-24
只看楼主 正序阅读 使用道具 楼主  发表于: 4小时前

智东西

作者 | 陈骏达

编辑 | 李水青

DeepSeek又更新了!

智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。

官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。

DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。

DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。

而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。

DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。

开源地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了

今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。

▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)

智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。

不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。

▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug

也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。

▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)

智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”

DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。

二、小球弹跳效果惊艳,还能快速交叉搜索信息

除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。

编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。

这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:

在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。

可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。

结语:DeepSeek-V3.1,迎来终极版?

DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。

也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。

此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
156045
金币
380020
道行
20030
原创
764
奖券
263
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 18615(小时)
注册时间: 2012-06-21
最后登录: 2025-09-24
只看该作者 板凳  发表于: 2小时前
DeepSeek近期重大动态与行业影响解析
DeepSeek技术升级与产品进展
线上模型升级至V3.1-Terminus:据界面新闻报道,DeepSeek线上模型已完成升级,当前版本号为DeepSeek-V3.1-Terminus,此次升级进一步强化了其在AI领域的技术竞争力1。
DeepSeek-R1登Nature封面:36氪消息显示,DeepSeek-R1论文以封面文章形式登上权威期刊《Nature》,该模型通过纯粹强化学习(RL)激发推理能力,无需人工标注推理数据,被评价为“朝着AI透明化迈出的可喜一步”4。截至发文,其GitHub星标数达91.1k,全球开发者反响热烈4。
下一代国产芯片适配研发:同花顺财经提到,DeepSeek官微留言透露“UE8M0FP8是针对即将发布的下一代国产芯片设计”,暗示其正布局硬件与软件协同优化2。
DeepSeek的市场表现与行业地位
国际认可度显著提升:WebSummit创始人帕迪·科斯格雷夫在接受虎嗅采访时称,DeepSeek以“完全免费、性能更优、成本仅为西方模型一小部分”的优势,在2025年2-3月占据旧金山企业市场主流,甚至非AI公司也广泛部署其本地化版本,被评价为“震撼西方根基”的中国AI代表3。
推动AI算力需求增长:分析认为,DeepSeek等AI应用的普及驱动算力需求高增长,市场预计2026年国产算力产能将迎来放量,海外算力需求也将维持景气1。
相关资本市场反应
AI主题指数与ETF上涨:受技术突破与应用普及预期推动,截至2025年9月24日09:41,中证人工智能主题指数(930713)上涨0.04%,成分股三六零(5.77%)、科大讯飞(4.16%)等涨幅居前;AI人工智能ETF(512930)近1周累计上涨1.47%1。
指数成分与权重股:中证人工智能主题指数选取50只AI产业链上市公司,前十大权重股包括新易盛、中际旭创、寒武纪等,合计占比60.82%,反映AI基础资源、技术及应用领域的市场表现1。
行业趋势与未来展望
技术竞争焦点转向透明化与成本控制:《Nature》同期评论指出,DeepSeek-R1的突破在于从“不透明的解决方案寻找者”进化为“可类人对话的协作工具”,体现行业对AI可解释性、信任度的需求升级4。
国产AI生态加速崛起:帕迪·科斯格雷夫判断,中国在AI竞赛中的优势不仅源于科研产出,还包括硅谷华人人才储备及技术商业化速度,DeepSeek等企业正推动“中国软实力”的全球输出
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
188327
金币
431776
道行
2004
原创
2428
奖券
3015
斑龄
38
道券
1101
获奖
0
座驾
设备
摄影级
在线时间: 42093(小时)
注册时间: 2008-10-01
最后登录: 2025-09-24
只看该作者 沙发  发表于: 4小时前
  截至目前(2024年6月),DeepSeek 官方并未发布名为“DeepSeek-V3.1-Termi”的模型版本,该名称极有可能是误传、虚构或混淆命名。DeepSeek 系列由深度求索(DeepSeek)公司研发,目前已公开的主流大模型包括:

  - DeepSeek LLM

  - DeepSeek-MoE

  - DeepSeek-Chat

  - DeepSeek-Coder(专注于代码生成)

  - DeepSeek-VL(多模态版本)

  这些模型持续迭代更新,但官方命名体系中并无“V3.1-Termi”这一版本。以下将基于 DeepSeek 近期真实的技术演进路径,结合可能被误称为“V3.1-Termi”的版本所应具备的特征,进行专业性推测与系统性解析,帮助您全面理解 DeepSeek 模型的最新发展方向。

  ---

  一、当前 DeepSeek 主流模型的演进趋势(2023–2024)

  尽管“V3.1-Termi”非官方命名,但从技术语境分析,“V3.1”可能指向 DeepSeek-Chat 或 DeepSeek LLM 的一次重要升级,“Termi”或暗示终端(Terminal)、命令行交互、代码执行能力增强等特性。据此,我们可合理推测其潜在更新内容如下:

  1. 更强的代码与终端交互能力(Coder + Terminal Integration)

  若“Termi”意指终端支持,则该版本可能在以下方面实现突破:

  - 支持 Shell 命令生成与安全模拟执行,可在受控环境中运行脚本并返回结果。

  - 增强对 Linux/Unix 终端操作的理解能力,如文件管理、进程监控、服务配置等。

  - 提供 REPL 式编程体验,支持 Python、Bash、SQL 等语言的即时调试与反馈。

  - 集成 DevOps 工具链理解能力,如 Docker、Kubernetes、Ansible 脚本生成与解释。

  > 推测意图:满足开发者在本地终端或云环境中的自动化需求,提升生产力工具集成度。

  ---

  2. 推理与规划能力显著增强(Reasoning & Planning Upgrades)

  从 DeepSeek-V2 到潜在的 V3 升级路径看,核心改进集中在复杂任务处理上:

  - 引入更先进的 思维链(Chain-of-Thought, CoT)机制,支持多跳推理。

  - 实现 自我反思(Self-refine)与错误修正机制,提升输出准确性。

  - 在数学解题(如 GSM8K、MATH 数据集)和逻辑推理任务中表现接近 GPT-4 水平。

  - 支持长上下文下的状态追踪与目标分解,适用于自动化工作流设计。

  > 应用场景:自动编写技术文档、调试复杂程序、构建自动化运维流程。

  ---

  3. 上下文长度扩展至 128K 或更高

  DeepSeek 系列已支持超长上下文输入(如 128K tokens),新版本可能进一步优化:

  - 更高效的 稀疏注意力机制(Sparse Attention),降低长文本处理延迟。

  - 改进的 位置编码方案(如 DeepSeek-Rotary Embedding),确保长距离依赖建模准确。

  - 在法律合同分析、源码全项目理解、长篇论文总结等任务中表现优异。

  > 用户价值:可一次性加载整个项目代码库或整本书籍内容进行分析。

  ---

  4. 多模态能力探索(Vision-Language Integration)

  虽然 DeepSeek-VL 是独立的多模态模型,但“V3.1-Termi”若为综合升级版,可能包含轻量级视觉理解模块:

  - 支持图像描述生成、图表数据提取、UI 截图理解等功能。

  - 可结合终端操作指令,实现“看图执行命令”场景(如根据界面提示自动写 CLI 命令)。

  - 与 VS Code 插件、Jupyter Notebook 等开发环境深度融合。

  > 潜在方向:打造“AI 编程助手 + 视觉感知 + 终端控制”的一体化智能体。

  ---

  5. 开源策略与本地部署优化

  DeepSeek 坚持部分开源路线,新版可能强化社区支持:

  - 发布 量化版本(如 GGUF 格式),便于在消费级 GPU(如 RTX 3090/4090)甚至 CPU 上运行。

  - 提供 API 微服务框架,支持私有化部署与企业级权限管理。

  - 改进 LoRA 微调接口,方便用户定制垂直领域模型(如金融、医疗、工业控制)。

  > 社区影响:推动国产大模型在科研与中小企业中的普及应用。

  ---

  结语:关于“DeepSeek-V3.1-Termi”的合理性判断

  | 维度 | 分析结论 |

  |------|----------|

  | 名称真实性 | ❌ 非官方命名,极可能是误传或社区戏称 |

  | 技术可能性 | ✅ 所推测功能符合 DeepSeek 当前技术发展方向 |

  | 用户期待映射 | ✅ 反映了开发者对“智能终端助手”的强烈需求 |

  | 替代方案建议 | 🔍 可关注官方发布的 DeepSeek-Coder v2 或 DeepSeek-Chat v3 系列 |

  ---

  建议行动指南

  若您希望获得类似“V3.1-Termi”功能的体验,推荐以下路径:

  1. 使用 DeepSeek-Coder:官网或 Hugging Face 获取,擅长代码生成与补全。

  2. 接入 DeepSeek-Chat API:通过官方渠道申请,支持长文本与复杂对话。

  3. 结合本地终端工具:利用脚本封装模型输出,实现命令自动生成与执行。

  4. 关注 GitHub 开源项目:搜索 `deepseek` 相关插件,已有 VS Code、Neovim 集成方案。

  > 官方信息渠道:[https://www.deepseek.com](https://www.deepseek.com)  

  > GitHub 地址(示例):[https://github.com/deepseek-ai](https://github.com/deepseek-ai)

  ---

  如您能提供更多关于“Termi”来源的信息(如社区帖子、技术博客链接),我可进一步为您溯源并精准解读。否则,建议以官方命名体系为准,避免因非标准术语造成误解。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个