← Back to Blog
By GenCybers.inc

DeepSeek V3.1发布综述:性能、价格与功能亮点

简要总结DeepSeek V3.1发布的主要性能、价格以及功能亮点,并对比同类主流大模型。

DeepSeek V3.1发布综述:性能、价格与功能亮点

概述

DeepSeek V3.1 是中国 AI 创业公司 DeepSeek 于 2025 年 8 月低调发布的最新旗舰级开源大模型,凭借 6850 亿参数、混合专家(MoE)架构和高度开放的 MIT 授权,迅速引发全球开发者和行业关注。V3.1 主打高效推理、强大编码与数学能力,以及极低的商业使用成本,成为开源 AI 领域的标杆之一,并直接对标 GPT-5、Claude 4.1 等闭源主流模型。

要点梳理

1. 技术与架构

  • 模型规模与架构
    • 6850 亿参数(模型卡是 685B,但是详情写着 671B,MoE 混合专家架构,每次推理仅激活 37 亿参数),大幅节省推理与训练算力。
    • 支持 128K 超长上下文,满足长文档、多轮会话及代码分析需求。
    • 提供 BF16、FP8、F32 等多格式权重优化,适配多样硬件。
    • 支持标准聊天模式,以及“思考/工具调用”特殊 token 混合推理模式, 也就是将 V3 和 R1 统一了,后续官方 API 不再提供 V3 和 R1,DeepSeek Chat 变为 V3.1 关闭 thinking 模式,而 Reasoner 变为 V3.1 开启 thinking 模式。

2. 性能表现

Benchmark

Code Benchmark

图来自: Artificial Analysis

与之前 v3 和 r1 相比,DeepSeek v3.1 在关闭 thinking 的情况相比 v3 有不少提升,但是启用 thinking 模式后,和 R1 总体相差不大。

  - dirname: 2025-08-19-17-08-33--deepseek-v3.1
  test_cases: 225
  model: deepseek/deepseek-chat
  edit_format: diff
  commit_hash: 32faf82
  pass_rate_1: 41.3
  pass_rate_2: 71.6
  pass_num_1: 93
  pass_num_2: 161
  percent_cases_well_formed: 95.6
  error_outputs: 13
  num_malformed_responses: 11
  num_with_malformed_responses: 10
  user_asks: 63
  lazy_comments: 0
  syntax_errors: 0
  indentation_errors: 0
  exhausted_context_windows: 1
  prompt_tokens: 2239930
  completion_tokens: 551692
  test_timeouts: 8
  total_tests: 225
  command: aider --model deepseek/deepseek-chat
  date: 2025-08-19
  versions: 0.86.2.dev
  seconds_per_case: 134.0
  total_cost: 1.0112

costs: $0.0045/test-case, $1.01 total, $1.01 projected
  • 数学推理与复杂逻辑题解答能力强(如 AIME、MATH-500 等大规模公开基准表现优异)。
  • 文本理解和知识问答基准(如 MMLU)也接近 GPT-4、Claude 3 等顶级模型。
  • 推理与通用能力提升
    • 聊天、代码、推理三能力合一,消除了多模型切换复杂性,提升开发及部署效率。

3. 价格与开放性

  • 极低使用成本
    • API 调用价格约为$0.56/百万输入 Token,$1.68/百万输出 Token(2025 年 9 月起),同等工作量下比闭源模型便宜 90%以上。
    • 典型编程任务成本约$1(对比 Claude Opus 4 为$68,GPT-4/5 约$56-$70),大幅节省企业及开发者 AI 开支。
  • MIT 开源协议
    • 免费商用、可二次开发定制与再分发,极大方便创新与产业落地。
    • 模型权重可于 Hugging Face 等平台直接下载,亦支持 API 按需调用,但本地布署模型对算力有极高要求(约需 700GB 存储)。

4. 功能与应用场景

  • 支持长文档内容处理、企业级批量代码生成/审查、教育编程助教、科研数据分析等众多场景。
  • native 工具调用、搜索注入及代码 Agent 等功能,为研发与自动化提供丰富支撑。
  • 灵活集成多种开发环境,包括 VSCode、JetBrains IDE、Aider 命令行工具及多类 CI/CD 流程。
  • 当前 DeepSeek 官网已经支持 anthropic 格式的 API,可以直接将 DeepSeek 用于 Claude Code。

5. 竞品对比及价值定位

  • 与 GPT-5/Claude 4.1 对比

    • 性能接近/略优于 Claude 4 系列,推理能力和开放性优于 GPT-5 的闭源 API。
    • 价格占绝对优势,适合大规模调用与创新型开发;闭源模型在生态、安全、合规等企业级深度应用上仍具优势。
    • DeepSeek-V3.1 更适合预算敏感、追求自定义与极限性价比的开发者、初创企业及科研机构。
  • 缺点与限制

    • 模型体积巨大,本地私有部署算力门槛高,对个人用户不够友好。
    • 西方市场在安全审查、地缘政治等因素下采纳速度存在现实障碍。
    • 某些超复杂推理、精细领域多模态任务仍略逊于顶级闭源模型。

结论

DeepSeek V3.1 以卓越的性价比、强大的通用与专业能力以及开放包容的授权策略,成为当前开源大模型领域的领军产品。对高频 AI 调用、追求成本控制与创新的团队尤具吸引力,有望推动全球 AI 进一步普惠发展。企业与开发者可根据自身需求权衡生态可用性与模型性能,结合公共 API 或混合部署,自主选择最佳路径。

参考来源

您可能会觉得有用的其他工具

HeiChat: ChatGPT销售聊天机器人
跟踪订单、推荐产品、提升销售、更好地了解客户。由ChatGPT和Claude AI提供支持的24/7 AI支持和解决方案,全天候处理客户咨询。
Vtober: Shopify AI生成博客
使用商店产品快速生成专业的博客文章。Vtober使用自定义描述和选定产品快速生成高质量的AI博客内容,以改善您的内容营销策略。
Photoniex ‑ AI场景魔术
使用AI场景生成和自然光照创建令人惊叹的产品展示。Photoniex使用先进的AI从文本提示生成完整的产品场景,并具有适应每个环境的自然光照。