GPU는 CPU에 비해 병렬 연산에 특화되어있다고 하죠. 그런데 그러한 GPU 수만개가 병렬로 되어있는데 ChatGPT 같은 LLM을 돌리기 위해선 GPU 끼리의 통신 속도도 충분해야 병목이 되지 않고 빠르게 돌릴 수 있습니다. 기존 PCI Express (PCIe) Gen5 보다도 7배나 높은 900GB/s의 속도를 보여주는, NVIDIA의 자체 칩 간 통신 규격 NVLINK에는 일반적으로 사용되는 NRZ와 같은 방식을 쓰지 않고 PAM4라는 기술로 초당 보낼 수 있는 정보를 대폭 늘리고, 고속도로 차선 수를 늘린 것처럼 링크 수도 확대했는데요. AI 시대 NVIDIA가 얼마나 부지런히 준비했는지를 보여주는 대목입니다.
Written by Error
Edited by 이진이
unrealtech2021@gmail.com
16 фев 2024