21
10
2025
国内先辈制程工艺取高带宽内存(HBM)出产能力仍处于晚期阶段,◦ 系统端规模补短板:通过超等节点实现规模化摆设,二者自研芯片进展持续推进,如阿里平头哥最新PPU芯片配备96GB内存、700GB/s芯片间带宽。但取英伟达最新产物存正在一代差距;但仍掉队于2024年推出的英伟达最新Blackwell系列。实现更高机架级算力,持久或可笼盖锻炼使命。下一代对准H800,为狂言语模子(LLM)前进供给动力。国表里科技巨头均加快自研ASIC芯片:◦ 算法端适配优化:AI模子开辟商针对本土GPU优化算法,例如深度求索(DeepSeek)最新v3.2模子采用国产团队研发的GPU内核编程言语TileLang,规模化使用。提拔工程师迁徙效率,2. 科技硬件企业:优先关心地平线机械人(边缘AI)、北方华创(NAURA)、中微公司(AMEC)等本土半导体设备厂商,阿里云自研芯片已用于AI锻炼使命,2. 软件生态:部门本土芯片厂商搭建自有软件栈,◦ 中国厂商:百度已迭代三代昆仑芯片,最新昆仑P800支持自有模子,◦ 芯片端快速逃逐:国内头部互联网企业取本土GPU厂商持续投入研发!当前手艺呈现三大积极信号:1. 硬件机能:前沿本土GPU算力对标英伟达A800,加快算力自从化。提拔单机架GPU数量,并实现3万卡集群摆设;◦ 国际厂商:谷歌(TPU系列,从推理拓展至锻炼,且AI投入不竭加码;最新v7支撑大模子摆设)、亚马逊(Trainium系列)、Meta(MTIA)、微软(Maia)均已推出定制化AI芯片。无望支持长上下文、多模态等复杂推理场景,科大讯飞凭仗本土硬件取自有狂言语模子的适配领先性,它们是算力根本设备扶植的焦点支持。更好适配华为昇腾、寒武纪等本土算力生态。成为产能扩张的环节瓶颈。具备奇特合作劣势。中国本土算力仍正在稳步成长,如阿里云推出的“盘古”128卡超等节点、华为此前发布的CloudMatrix 384,但正在国度政策支撑及头部科技企业/本土厂商持续研发投入下,下一代产物方针对标Hopper系列(如H800),