您好,欢迎进入菲魅通信

登录 / 注册

首页>行业资源库

Y10T96 谷歌:基于OCS的AI场景对光连接的要求

更新时间:2024-04-05 09:04:28 阅读量:864

《2023合集下》Google的Gemini的TPU光交换技术

Y10T17 谷歌TPU用到的DSOI结构MEMS

Y10T32 OCS光交换的光纤阵列控制
Y10T30 OCS光交换机的光路控制

Y10T33 光交换机的透镜阵列

Y10T89 NVIDIA采用OCS光交换实验

2024OFC,谷歌做了基于OCS光交换系统对于光连接的需求,和之前写过的相比,多了对时延等数据。补充一下

AI需要很多参量,进行大量计算。集成电路的发展可以增加计算量,40%年增长速度是摩尔定律这些年的规律。

但是AI对于计算的需求,不是40%的年增速,而是近乎1000%的年增速,一年10倍速。

那更多的计算就需要多个计算单元以及多个存储单元形成矩阵式互联,也就是谷歌提到的立方体结构。


1.jpg


采用OCS光交换,具备了灵活性和可扩展性,可以快速灵活的把多代不同的系统组合在一起。光交换是速率无关的交换,而电交换是速率相关的交换,细节参考2023合集下即可。


2.jpg


这就是TPUv4提到的立方矩阵式结构,每个机架64个TPU,64个机架采用48个OCS交换机实现分布式互联。谷歌用视频演示了一下50亿参量56天计算完成一组PaLM训练。这种训练需要光模块具有高可靠性,低时延和大带宽的特点。光模块降低功耗降低内部工作温度也是提高可靠性的一个途径。


3.jpg


分布式计算,物理传输距离~50m,光信号在光纤传输的延时是可以计算的。光的真空速度~30万公里/秒,光在玻璃光纤的传输速度~20万公里/秒,50米光纤,信号往返50米(100米),所需的时间是~500纳秒。

这是线路的延时,虽然空芯光纤可以降低这个时延,但空芯光纤的技术还不成熟,所以基于实芯光纤导致的这个时延是客观存在的。《2023合集下》空芯光纤与实芯光纤的优缺点(上)/(下)


4.jpg


另外一个时延是DSP的处理。

这有个矛盾,DSP采用很好的FEC处理方式的话,可以优化灵敏度,也就是提高链路功率预算,但是DSP的信号需要时间来处理,产生一部分时延。

谷歌的处理模式是将DSP厂家纳入技术环节,在性能和延时之间进行一个有效权衡。


5.jpg


再一个就是降低OCS的交换矩阵的数量,Y10T72 谷歌用于AI的800G bidi环形器(里边有光模块的图)

谷歌通过CWDM4 BiDi,20nm波长间隔的设计,延伸到未来的CWDM8的10nm间隔8波长复用的BiDi,降低OCS数量,提高可用性。


6.jpg


7.jpg





8.jpg

联系我们

  • 电话:181-4051-7646
  • QQ:769432720
  • 邮箱:flexfan@whopfm.com
  • 地址:武汉市东湖高新区光谷科技港5-603
2019 All Rights Reserved 版权所有·菲魅(武汉)通信技术有限公司 鄂ICP备17023904号-1 鄂ICP备17023904号-2 鄂ICP备17023904号-3