
台积电
总结前置:内容精炼表达观察图片猜参数根据镁光提供的HBM3e尺寸数据进行估算,单die的面积约为800mm?,而通过两颗die拼接组成一片,总面积大约为1600mm?。单die尺寸与上一代相差无几(800-814mm),仍未实现尺寸上的显著突破。双die封装成一颗芯片,硅中介层尺寸超过2000mm,或是目前已知最大的CoWoS封装。首发版本应配备24GB颗粒。单片MCM显存应有192GB和288GB两种规格。A、B区域不对称,3die与4die配置不会出现。H100的晶体管数量为800亿,而B100达到2080亿(单die 1040亿)。在相同800平方毫米面积下,晶体管数从800亿增至1040亿,密度提升约30%。两者均采用
台积电4N工艺,但在制程或设计上有所优化改进。从首张图的dieshot可见,tpc数量从72增加到80,预计单die拥有160个SM,总计320个SM。若以H100的FP32为参考,按1:1比例计算,采用双die MCM设计时,将具备40960个CUDA Core。在FP8精度下,该算力单芯片为H100的2.5倍,单die则约为H100的125%,接近晶体管数量的增长比例,即达到2500TFLOPS FP8算力。据此可推测,其GPU运行频率与H100系列相近,结合TPC单元数量的增加,频率最多提升10%,预计不会超过1850MHz。2die封装后,可组成5p fp8算力(非稀疏),亦或10p fp4算力。DGX形态的8GPU B200首发配备1440GB显存,后期最高可扩展至2304GB。单节点能够支持超1000亿参数的fp16模型推理,单卡即可完成130亿参数fp16模型的推理任务。