В связи с быстрым развитием обучения больших моделей ИИ, высокопроизводительных вычислений и облачных вычислений спрос предприятий на вычислительную мощность GPU серверов и производительность систем хранения данных демонстрирует взрывную тенденцию роста. Однако традиционные серверные архитектуры имеют множество узких мест в возможностях расширения, таких как ограниченное количество слотов PCIe, сложности с балансировкой развертывания GPU и SSD, а также недостаточная гибкость решений по расширению. Эти проблемы серьезно ограничивают инновации в бизнесе. В данной статье будет проведен глубокий анализ этих болевых точек отрасли и показано, как LR-LINK LRSV9500-4I предоставляет предприятиям универсальное решение для расширения благодаря гибким режимам бифуркации X4/X8/X16.
Сравнительное измерение | Традиционное решение | |
Возможность расширения | 1 слот = 1 устройство | 1 слот = 8 SSD или 2 GPU |
Гибкость конфигурации | Фиксированная функция | Переключаемые режимы X4/X8/X16 |
Балансировка GPU + SSD | Сложно встретиться в одно и то же время | Прекрасная поддержка в режиме X8 |
Поддержка PCIe 5.0 | Частичная поддержка | Полная поддержка 32 Гбит/с |
Взаимосвязь нескольких графических процессоров | Положитесь на переадресацию процессора | P2P-коммуникация |
II.Tипичные примеры применения в промышленности
Компания, занимающаяся разработкой искусственного интеллекта, построила передовую платформу для обучения больших моделей, используя режим X16 в LRSV9500-4I для расширения графических процессоров. 8 графических процессоров подключены через 4 LRSV9500-4I карты. Такая конфигурация значительно повышает эффективность использования GPU и эффективность обучения.
Распределенный кластер хранения данных построен на базе LRSV9500-4I в режиме X4, благодаря чему один сервер поддерживает 8 твердотельных накопителей U.2 NVMe общей емкостью 128 ТБ и суммарной пропускной способностью более 50 ГБ/с. Применение этой технологии позволило значительно повысить масштабируемость и производительность системы, а производительность запросов к базам данных увеличилась в 10 раз.
Производство кино и телевидения настраивает рабочие станции в режиме X8, оснащенные 2 видеокартами, которые отлично показывают себя в тестах рендеринга в реальном времени и позволяют значительно повысить эффективность рендеринга и экспорта. Кроме того, конфигурация из 2 твердотельных накопителей NVMe обеспечивает высокую скорость чтения и записи материалов. Профессиональные тесты производительности показывают, что скорость рендеринга видеоматериалов 4K увеличивается более чем на 80 % по сравнению с традиционными конфигурациями, а время экспорта видео высокой четкости сокращается на 60 %.
В суперкомпьютерном центре используются гетерогенные вычислительные узлы LRSV9500-4I для реализации параллельных вычислений графических процессоров в режиме X16 и эффективного подключения плат ускорения FPGA и NVMe-хранилищ в режиме X8. Такой гибкий способ конфигурирования вычислительных систем, сети и хранилища позволил значительно повысить эффективность использования ресурсов на 40 %.
III.LRSV9500-4I Предложения по выбору и конфигурации
· В сценариях обучения чистому ИИ рекомендуется выбирать режим X16, чтобы максимально увеличить пропускную способность одного GPU и тем самым обеспечить поддержку видеокарт высокого класса.
· В сценариях чистого хранения данных можно выбрать режим X4, чтобы увеличить количество твердотельных накопителей и создать массив all-flash высокой плотности.
· Для сценариев со смешанной нагрузкой можно выбрать режим X8, чтобы сбалансировать конфигурацию GPU и SSD и добиться оптимального распределения ресурсов.
· Совместимость с материнской платой: Убедитесь, что материнская плата поддерживает PCIe 5.0
· Пространство шасси: LRSV9500-4I имеет половинную высоту, совместим с серверами высотой 2U и выше
· Условия теплоотвода: Обеспечьте беспрепятственный доступ воздуха к серверу, при необходимости можно добавить дополнительные меры по рассеиванию тепла
· Качество кабеля: Используйте сертифицированные высокоскоростные кабели MCIO для обеспечения целостности сигналов PCIe 5.0
С выходом спецификации PCIe 6.0 скорость передачи данных достигла 64 Гбит/с на канал. Зрелость этой технологии в сочетании с развитием технологии CXL открывает новые возможности для развития карт расширения PCIe Switch. Развитие технологии CXL, особенно поддержка CXL 2.0 для объединения памяти и архитектуры коммутатора, расширит роль PCIe Switch, которая больше не будет ограничиваться расширением GPU и систем хранения данных, а займет важное место в расширении памяти.
В то же время, с постоянным ростом масштаба параметров больших моделей ИИ, спрос на пропускную способность межмашинного соединения GPU будет становиться все более актуальным, что видно из значительного роста масштаба рынка индустрии больших моделей ИИ и технологических прорывов. Возможность многомашинного соединения PCIe Switch, реализованная с помощью функции NTB, станет ключевой технологией для создания крупномасштабных обучающих кластеров ИИ. LR-LINK продолжит инвестировать в исследования и разработки, чтобы предоставить клиентам более совершенные решения для расширения.
Болевые точки серверных GPU и расширения систем хранения данных - это, по сути, противоречие между ограниченными ресурсами и неограниченным спросом. Благодаря технологии PCIe Switch и гибким режимам бифуркации X4/X8/X16, LRSV9500-4I предоставляет предприятиям эффективный путь решения. Будь то обучение искусственному интеллекту, высокопроизводительные вычисления, анализ больших данных или производство видео, LRSV9500-4I обеспечит отличные возможности расширения и защиту инвестиций.
Являясь флагманским продуктом LR-LINK в области PCIe 5.0, LRSV9500-4I, опираясь на ведущую производительность чипа Broadcom PEX89048 и идеальную поддержку экосистемы, становится предпочтительным решением расширения для создания серверов искусственного интеллекта и центров обработки данных. Выбор LRSV9500-4I означает выбор гибкой, эффективной и ориентированной на будущее архитектуры расширения.