找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 43|回复: 1

[【其它】] DeepSeekV4发布,运行华为昇腾950PR芯片!

[复制链接]
发表于 5 天前 来自手机 | 显示全部楼层 |阅读模式
期待已久的DeepSeek V4今天发布了,全栈运行华为昇腾950PR芯片,抛弃英伟达 CUDA ,全面迁移至华为 CANN 框架,推动国产算力规模化落地,打破国外技术垄断,让我们的算力变得自主可控!

据悉,更换成华为CANN框架后,其推理速度提升 35 倍,部署成本仅为英伟达方案的 1/3,达到了速度快,成本低,自主可控的效果。这哈Deep Seek V4有以下几大亮点:

①百万级上下文(1M tokens):
一次性可以处理约150万汉字,也就是拥有好几部长篇小说,或者繁琐代码的处理能力,且这个1M Token超长上下文还是全系标配,这处理能力是牛,厉害!这拿来搞编程效率不知道翻多少倍。
DSA稀疏注意力架构,算力、显存消耗大幅降低。

②性能:他拥有Agent能力、世界知识、逻辑推理/代码能力达开源顶尖,对标顶级闭源模型。其中V4-Pro 的推理能力已经追平顶级闭源模型,世界知识仅次于 Gemini-Pro-3.1。

③底层架构革新:mHC、Engram记忆模块等技术突破,支撑万亿级参数高效稳定运行。
采用 MoE 671B 架构,总参数高达1.6万亿,单次推理仅激活百亿参数,速度是之前V3的35倍,费用却只有GTP-4的1/70。它可以实现“按需调用专家”,大幅降低计算开销和推理成本。

④双版本:有V4和V4Pro两个版本,Pro版旗舰性能,Flash版高效低成本,API/官网同步上线。
一个主打轻量级应用,一个主打复杂任务处理!

⑤ 同步开源:它完全开源并支持多接口兼容,模型权重已同步开源,支持本地部署;API 兼容 OpenAI 和 Anthropic 双格式,切换仅需修改 model 参数,极大降低迁移门槛。采用国产芯片,华为昇腾950PR,自主可控。
这就是今天发布的DeepSeek V4,它的主要优点就是成本降低,性能翻倍,拥有处理长文的能力,这百万字的超长处理能力!
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
让子弹再飞一会,具体还得看后续。
不是唱哀,是不了解。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2026-4-29 09:38 , Processed in 0.110576 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表