华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。这项成果或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。 消息面上,华为在AI推理技术上的探索早已有之。今年3月,北京大学携手华为推出了DeepSeek全栈开源推理方案。该方案融合了北京大学自研的SCoW算力平台系统与鹤思调度系统,并整合了DeepSeek、 openEuler、MindSpore及vLLM/RAY等开源组件,实现了在华为昇腾平台上的高效推理。这一合作成果不仅展示了华为在AI推理领域的深厚积累,也标志着国产算力在AI应用上的重要突破。 长城证券表示,从国内大模型的进展来看,一方面,伴随国内外大模型的持续升级,AI推理能力要求更高,对算力的需求也在持续增加;另一方面,芯片的性能不断提升也同时促进大模型等在AI产业持续取得突破。同时,随着AI模型仿真活人的能力持续提升,助力更多 Al+应用商业场景落地,基于AI的数字互动有望成为下一个互联网和游戏产业的热门赛道,算力各环节有望进一步发展。 相关研究机构表示,AI大模型训练对内存带宽需求呈指数级增长,传统DDR内存已无法满足需求。 HBM(高带宽内存)通过3D堆叠技术将DRAM芯片垂直堆叠,最新的HBM3E可实现高达819GB/s的带宽,较DDR5提升5倍以上。在AI服务器中,HBM的成本占比约为20%至30%,仅次于用于计算的AI芯片。 华为将发布AI推理突破性成果(受益概念股)如下: 1、铭普光磁(002902) 据2025年4月21日互动易,公司聚焦AI算力基础设施核心部件,重点布局高速光模块产品,适配数据中心短距离高速传输需求,满足未来超大规模AI算力对高带宽的需求。 据2025年4月21日互动,公司自主研发的一体成型电感凭借低电阻、高磁导率、强抗干扰等特性,可满足CPU/GPU等大功率芯片的供电需求。 |