每日人工智能资讯|DeepSeek-V4预览版正式发布:1M 超长上下文进入全员普惠时代-数智化转型网szhzxw.cn

深度求索（DeepSeek）今日宣布其全新系列模型DeepSeek-V4预览版本正式上线并同步开源。该系列模型通过结构创新，实现了1M（一百万字）超长上下文能力的标准化，在 Agent 协作、世界知识及逻辑推理性能上均达到国内及开源领域的领先水平。数智化转型网www.szhzxw.cn

一、双版本布局：Pro 追求极致，Flash 兼顾效率

DeepSeek-V4根据应用需求分为两个规格:

DeepSeek-V4-Pro（1.6T参数，激活49B）: 性能直击顶级闭源模型。在 Agentic Coding 评测中达到开源最佳水平，交付质量接近 Opus4.6;在数学、STEM 及竞赛代码测评中，超越所有公开评测的开源模型，展现出世界顶级的推理性能。
DeepSeek-V4-Flash（284B参数，激活13B）: 主打极致性价比。虽然世界知识储备略逊于 Pro 版，但在简单任务的推理能力和 Agent 表现上与 Pro 版旗鼓相当，能提供更快捷、经济的 API 服务。数智化转型网www.szhzxw.cn

二、结构创新：DSA 机制实现长上下文普惠

DeepSeek-V4开创性地采用了 DSA 稀疏注意力机制。通过在 Token 维度进行压缩，模型大幅降低了超长上下文对计算量和显存的需求。这意味着1M 上下文将成为 DeepSeek 所有官方服务的标配，解决了长文本处理高昂成本的行业痛点。数智化转型网www.szhzxw.cn

1、深度适配 Agent 生态

针对当前主流的 Agent 产品（如 Claude Code、CodeBuddy 等），DeepSeek-V4进行了专项优化。模型支持非思考模式与思考模式，并在 API 中开放了 reasoning_effort 参数，允许用户根据任务复杂度调节思考强度（high/max），显著提升了在代码生成和文档处理等复杂场景下的表现。数智化转型网www.szhzxw.cn

2、访问与开源计划

目前，用户可通过官网或官方 App 体验最新模型，API 亦已同步更新。值得注意的是，旧有的 deepseek-chat 与 deepseek-reasoner 模型名将于三个月后（2026年7月24日）停用。数智化转型网www.szhzxw.cn

开源链接: 已在Hugging Face与魔搭社区上线。数智化转型网www.szhzxw.cn
技术报告: 同步披露于Hugging Face仓库中。数智化转型网www.szhzxw.cn

此次DeepSeek-V4的发布，不仅验证了开源模型在长上下文与 Agent 能力上追赶顶级闭源模型的可行性，更通过技术架构的突破，为 AGI 的普惠化进程提供了坚实的底座支持。数智化转型网www.szhzxw.cn

若您对人工智能感兴趣，可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商，可联系数智化转型网小助手思思（17757154048，微信同号）

若您为人工智能服务商，可添加数智化转型网小助手Nora，加入人工智能行业交流群。

若您为人工智能创业者，可添加数智化转型网社群主理人Carina，加入人工智能创业交流群。

声明：本文来自数智化转型网，版权归作者所有。文章内容仅代表作者独立观点，不代表数智化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。

本文由数智化转型网（www.szhzxw.cn）转载，编辑/翻译：数智化转型网（Professionalism Achieves Leadership 专业造就领导者）白龙

每日人工智能资讯|DeepSeek-V4预览版正式发布:1M 超长上下文进入全员普惠时代

一、双版本布局：Pro 追求极致，Flash 兼顾效率

二、结构创新：DSA 机制实现长上下文普惠

1、深度适配 Agent 生态

2、访问与开源计划

2025年中国人工智能企业500强（201-300）

广东省拍卖行业“十二五”发展规划——“十一五”时期广东省拍卖行业发展现状

流程与架构专题|华为以业务为核心的三大流程是什么？

数仓蓝图：如何优雅地规划数仓体系

大语言模型的技术架构包含哪些内容？

联系我们

微信扫一扫关注我们

一、双版本布局：Pro 追求极致，Flash 兼顾效率

二、结构创新：DSA 机制实现长上下文普惠

1、深度适配 Agent 生态

2、访问与开源计划

服务商资讯|破解山区医疗痛点，崇阳县依托青云云易捷推动智慧医疗

服务商资讯|青云科技与海南中学共建生涯体验教育基地

相关推荐

联系我们

微信扫一扫关注我们