39投资指南
股票 高端制造主题指数本周拉升,关切高端制造ETF(562910)、机器东谈主1... 食品科技 湖北加速发展氢能产业 鼓励氢能规模企业上市... 分析 安孚科技: 安孚科技对于召开2024年第四次临时激动大会的见告本体摘要... 分析 首家!“科八条”发布5个多月,亏欠企业闯关IPO获新进展... 投资机会与挑战 固态电板爆发!电板ETF(561910)午后扩大升势涨超4%,导...
市场动态>>你的位置:39投资指南 > 市场动态 > 投资机会与挑战 华泰证券:DeepEP开源有望开释推理需求 热心欺诈与算力

投资机会与挑战 华泰证券:DeepEP开源有望开释推理需求 热心欺诈与算力

发布日期:2025-03-03 11:15    点击次数:141

投资机会与挑战 华泰证券:DeepEP开源有望开释推理需求 热心欺诈与算力

  华泰证券以为,DeepSeek通过优化推理资本,有望鼓动LLM买卖化欺诈加快。基于此,看好推理需求开释带动IaaS管事商稼动率晋升,云厂商有望受益。其次,商量到R1带来模子才略晋升的同期又可末端低资本部署,有望带动AI欺诈加快渗入。临了,尽管现在DeepEP仍需要在Hopper+CUDA+NVLink的框架下末端,但中遥远来看,跟着国产卡的适配跟进,技能有望向更多国产生态迁徙,国产AI算力板块有望迎来成长机遇。

  全文如下

  华泰 | 计较机:DeepSeek - EP降本,热心欺诈与算力

  2025年3月1日,DeepSeek发布《One More Thing, DeepSeek-V3/R1 Inference System Overview》,其中提到通过大模子跨节点内行并行,DeepSeek末端了$87,072/天的低资本推理,有用算力获取显贵晋升。咱们以为,跟着国产算力硬件安宁适配DeepEP体系,DeepSeek模子或通过性价比上风带动推理需求开释,国产算力有望加快成长。

  中枢不雅点

  中枢亮点:推理资本大幅缩短,理思现象下15%付费率即可盈亏平衡

  据DeepSeek,V3和R1推理管事占用节点总数,峰值占用为278个节点,平均占用226.75个节点,DeepSeek假设GPU租出资本为2好意思金/小时,总资本为$87,072/天。此外,在2025/02/27 12:00 PM至2025/02/28 12:00 PM,V3和R1模子推理破钞Token 776B(输入608B+输出168B),平均每百万Token处分资本为0.11好意思元。DeepSeek假设如若悉数Tokens一齐按照DeepSeekR1的订价计较,表面上一天的总收入为$562,027,资本利润率545%。但商量到现在DeepSeek仅通过API收费,故地们测算若按照R1收费订价,付费Token占总Token的15%即可末端推理历程的盈亏平衡。

  中枢技能:通过EP末端更高的蒙眬量和更低的蔓延

  DeepSeek-V3 / R1 推理系统的优化缱绻是:更大的蒙眬,更低的蔓延。为了末端这两个缱绻,DeepSeek的决策是使用大边界跨节点内行并行(Expert Parallelism/EP),并开源了DeepEP代码。具体来看,中枢才略包括:1)大边界跨节点内行并行:经受了预填充-解码剖释架构,不同阶段同期进行多个内行并行计较;2)计较/通讯重迭:将GPU中的SM(流多处分器)差别为计较、通讯两部分,各自同期实施相应责任负载,减少蔓延恭候时间;3)负载平衡:通过预填充负载平衡、解码负载平衡、内行并行负载平衡,尽可能地为每个 GPU 分派平衡的计较负载、通讯负载。

  中枢原因:推理订价/资本的互异或为外部算力供应受限的放置

  对比来看,国外模子如OpenAI o3-mini在推理订价方面较DeepSeek更贵,如每百万Token输入的价钱为$0.55(缓存掷中),而R1为$0.14。咱们以为,API订价的互异或有极度一部分来自于推理资本的互异,DeepSeek或凭借EP等更极致的软硬件优化,末端推理资本的爽快。咱们以为,这一甘心的背后,反馈的是国表里算力供应以及产业场所的互异。国内大模子厂商在算力供给受限的布景下,通过技能优化的样式束缚压榨硬件性能,在有限的算力下末端最优的模子恶果。基于此,咱们以为,国内模子有望凭借性价比上风,带动下流买卖化欺诈,末端人人商场的份额晋升。

  中枢受益:DeepEP开源有望开释推理需求,热心欺诈与算力

  咱们以为,DeepSeek通过优化推理资本,有望鼓动LLM买卖化欺诈加快。基于此,咱们看好推理需求开释带动IaaS管事商稼动率晋升,云厂商有望受益。其次,商量到R1带来模子才略晋升的同期又可末端低资本部署,有望带动AI欺诈加快渗入。临了,尽管现在DeepEP仍需要在Hopper+CUDA+NVLink的框架下末端,但中遥远来看,跟着国产卡的适配跟进,技能有望向更多国产生态迁徙,国产AI算力板块有望迎来成长机遇。

  风险请示:AI技能迭代不足预期;AI买卖化不足预期;本论说基于客不雅信息整理,不组成投资提议。



首页 股票分析 市场动态 投资策略

Powered by 39投资指南 @2013-2022 RSS地图 HTML地图