Y10T138 海思:AI场景下的光模块技术

更新时间:2024-05-17 11:05:46 阅读量:988

前天,海思有两个报告,在不同角度分析了现在AI大模型下的光模块技术的机遇和挑战。

大约理一理他家论述的重点

AI场景,生成式人工智能比决策式需要更多的计算量。模型越来越大,参量越来越多。


1.jpg


以Nvidia为主的算力芯片是核心,技术迭代的速度越来越快,当然即使算力芯片迭代的速度已经很快了,依然满足不了现如今的算力需求。通过组网的方式进行算力集群。


2.jpg


组网,以传输带宽和距离来划分是电缆连接还是光连接


3.jpg


在算力集群需要配套的组网系统,组网中涉及到光学传输情况下,光模块这个配件开始随着AI产业的发展而快速增长


4.jpg


在增长过程中,对于大容量高带宽的模块需求,也是水涨船高

5.jpg


6.jpg


那么,海思的观点,除了大多数厂家谈到的大带宽、低时延、低功耗和高可靠外,还提到了智能化。这个智能化在更低故障率,更高可靠性的阶段,发挥挺大作用。

昨天写科大讯飞,通过光模块智能化分析,可以预先判断模块工作状态,降低70%由模块引起故障率。

Y9T137 科大讯飞&华为:AI场景智能光模块与LPO光模块


7.jpg


接着就是这五点,第一点是提高光器件带宽,满足AI网络带宽的提升需求。


8.jpg


对于硅光而言,考虑射频电极带宽,掺杂浓度的设计,RC常数的优化,射频损耗的规避...来提高调制器带宽。接收端需要考虑带宽以及偏振分集的优化设计。


9.jpg


TFLN薄膜铌酸锂,主要是工艺开发,电路优化,技术成熟度的推进


10.jpg


VCSEL,就是氧化孔的各种纠结、矛盾。模式的控制。耦合腔的辅助带宽设计。


11.jpg


EML,控制波导的光学限制,吸收效率,电学的RC常数控制,寄生电容优化....,包括封装工艺的更新。


12.jpg


时延这个事情呢,主要在于网络的规划问题,比如用光交换来替代电交叉,可以降低时延....., 模块本身是物理层,引起的时延是比较小的,当然去掉DSP后能节约一些也是贡献。


13.jpg


PO有两个作用,一个是低时延,第二个也是最重要的一个,其实是低功耗。LPO目前的性能和互操作方面,还需要产业继续研究。


14.jpg


功耗,现在的优先级很高,系统功耗挺大,大热炉,降功耗成了绕不过去的坎儿。是生死攸关的一个环节,模块在大功耗加热下,性能劣化寿命缩短故障率提高....


15.jpg


低功耗,一个是LPO去掉DSP。

另外其实是保留DSP,还能节约一部分功耗的话,这是最好的,毕竟DSP对模块的性能有太大帮助了。

Y9T365 《2023合集下》 Marvell低功耗DSP设计

写过华为、Marvell等厂的DSP低功耗设计。

其次是采用DSP直驱,降低电压,EML的电压、薄膜铌酸锂电压,硅光调制器的电压...可以节约一个DRV芯片的功耗,也可以贡献由于低压产生的功耗降低。

去掉TEC,可降低功耗,压力就是激光器温度升高,性能劣化,失效概率增加。

激光器优化PCE电光效率,这是个好途径。


16.jpg


可靠性这个事儿,昨天写了,今天不赘述。


17.jpg


海思的思路,是传统提升路线中,加入了低功耗的设计,比如他家EML就一直按着DSP直驱来做的,加入了智能化设计,多了判断光模块故障的更多参数的提取和分析。


18.jpg



2024-5-18 匡国华 《AI等市场驱动下的光模块发展趋势》

明天吧,我把行业里的一些厂家的观点、趋势以及核心技术做个汇总和解读。


19.jpg