AI 대규모 모델 학습, 고성능 컴퓨팅 및 클라우드 컴퓨팅의 급속한 발전으로 서버 GPU 컴퓨팅 성능과 스토리지 성능에 대한 기업의 수요는 폭발적인 성장세를 보이고 있습니다. 그러나 기존 서버 아키텍처는 제한된 PCIe 슬롯, GPU와 SSD 배치의 균형 잡기 어려움, 확장 솔루션의 유연성 부족 등 확장 기능에 많은 병목 현상이 있습니다. 이러한 문제들은 비즈니스 혁신을 심각하게 제한해 왔습니다. 이 백서에서는 이러한 업계의 문제점을 심층적으로 분석하고 LR-LINK가 어떻게 이러한 문제를 해결할 수 있는지 보여줍니다. LRSV9500-4I 는 유연한 X4/X8/X16 분기 모드를 통해 기업에게 원스톱 확장 솔루션을 제공합니다.
비교 차원 | 기존 솔루션 | |
확장 기능 | 슬롯 1개 = 장치 1개 | 슬롯 1개 = SSD 8개 또는 GPU 2개 |
구성 유연성 | 고정 기능 | 전환 가능한 X4/X8/X16 모드 |
GPU + SSD 밸런싱 | 동시에 만나기 어려움 | X8 모드에서 완벽하게 지원 |
PCIe 5.0 지원 | 부분 지원 | 전체 32GT/s 지원 |
멀티 GPU 상호 연결 | CPU 포워딩에 의존 | P2P 커뮤니케이션 |
II.T산업별 적용 사례
한 AI 기업이 LRSV9500-4I의 X16 모드를 사용하여 GPU를 확장하는 고급 대형 모델 트레이닝 플랫폼을 구축했습니다. 8개의 GPU가 4개의 LRSV9500-4I 카드. 이 구성은 GPU 활용도와 훈련 효율을 크게 향상시킵니다.
분산 스토리지 클러스터는 LRSV9500-4I의 X4 모드로 구축되어 단일 서버가 총 128TB의 용량과 50GB/s 이상의 총 대역폭을 갖춘 8개의 U.2 NVMe SSD를 지원하도록 구현했습니다. 이 기술을 적용함으로써 데이터베이스 쿼리 성능이 10배 향상되는 등 시스템의 확장성과 성능이 크게 개선되었습니다.
영화 및 TV 프로덕션은 실시간 렌더링 테스트에서 탁월한 성능을 발휘하고 렌더링 및 내보내기 효율성을 크게 향상시킬 수 있는 2개의 그래픽 카드를 장착한 X8 모드로 워크스테이션을 구성합니다. 또한 2개의 NVMe SSD를 구성하여 자료 저장소의 고속 읽기 및 쓰기를 보장합니다. 전문가 성능 테스트 결과 4K 영상 자료의 렌더링 속도가 기존 구성에 비해 80% 이상 빨라지고 고화질 영상 내보내기 시간이 60% 단축되는 것으로 나타났습니다.
슈퍼컴퓨팅 센터는 LRSV9500-4I 이기종 컴퓨팅 노드를 사용하여 X16 모드에서 GPU의 병렬 컴퓨팅을 실현하고 X8 모드에서 FPGA 가속 카드와 NVMe 스토리지의 효율적인 연결을 실현합니다. 이 유연한 컴퓨팅, 네트워크, 스토리지 구성 방식은 리소스 활용도를 40%까지 크게 향상시켰습니다.
III.LRSV9500-4I 선택 및 구성 제안
· 순수 AI 훈련 시나리오에서는 단일 GPU 대역폭을 최대화하여 하이엔드 그래픽 카드를 지원하는 X16 모드를 선택하는 것이 좋습니다.
· 순수 스토리지 시나리오에서는 X4 모드를 선택하여 SSD 수를 최대화하고 고밀도 올플래시 어레이를 추가로 구축할 수 있습니다.
· 혼합 부하 시나리오의 경우, 최적의 리소스 할당을 달성하기 위해 X8 모드를 선택하여 GPU 및 SSD 구성의 균형을 맞출 수 있습니다.
· 마더보드 호환성: 마더보드가 PCIe 5.0을 지원하는지 확인합니다.
· 섀시 공간: LRSV9500-4I는 절반 높이 디자인으로 2U 이상 서버와 호환됩니다.
· 열 방출 조건: 서버의 공기 덕트가 막히지 않아야 하며, 필요한 경우 추가적인 보조 방열 조치를 추가할 수 있습니다.
· 케이블 품질: 인증된 고속 MCIO 케이블을 사용하여 PCIe 5.0 신호의 무결성을 보장합니다.
PCIe 6.0 사양이 출시되면서 전송 속도가 채널당 64GT/s에 도달했습니다. 이 기술의 성숙과 CXL 기술의 발전은 PCIe 스위치 확장 카드에 새로운 개발 기회를 가져올 것입니다. CXL 기술의 발전, 특히 메모리 풀링 및 스위치 아키텍처에 대한 CXL 2.0의 지원은 더 이상 GPU 및 스토리지 확장에 국한되지 않고 메모리 확장에 중요한 역할을하는 PCIe 스위치의 역할을 확장 할 것입니다.
동시에 AI 대형 모델의 파라미터 규모가 지속적으로 성장함에 따라 GPU 상호 연결 대역폭에 대한 수요가 더욱 시급해질 것이며, 이는 AI 대형 모델 산업의 시장 규모가 크게 성장하고 기술이 획기적으로 발전한 것에서 알 수 있습니다. NTB 기능을 통해 실현된 PCIe 스위치의 다중 머신 상호 연결 기능은 대규모 AI 학습 클러스터 구축의 핵심 기술이 될 것입니다. LR-LINK는 고객에게 더욱 발전된 확장 솔루션을 제공하기 위해 지속적으로 R&D에 투자할 것입니다.
서버 GPU 및 스토리지 확장의 고충은 본질적으로 제한된 리소스와 무한한 수요 사이의 모순입니다. LRSV9500-4I는 PCIe 스위치 기술과 유연한 X4/X8/X16 분기 모드를 통해 기업에게 효율적인 솔루션 경로를 제공합니다. AI 트레이닝, 고성능 컴퓨팅, 빅데이터 분석, 비디오 제작 등 어떤 분야에서든 LRSV9500-4I는 뛰어난 확장 기능과 투자 보호 기능을 제공합니다.
PCIe 5.0 분야의 LR-LINK의 주력 제품인 LRSV9500-4I는 브로드컴 PEX89048 칩의 선도적인 성능과 완벽한 에코시스템 지원을 바탕으로 AI 서버 및 데이터 센터 구축에 선호되는 확장 솔루션이 되고 있습니다. LRSV9500-4I를 선택한다는 것은 유연하고 효율적이며 미래 지향적인 확장 아키텍처를 선택한다는 것을 의미합니다.