مع التطور السريع لتدريب النماذج الكبيرة للذكاء الاصطناعي والحوسبة عالية الأداء والحوسبة السحابية، أظهر طلب الشركات على قوة حوسبة وحدة معالجة الرسومات للخوادم وأداء التخزين اتجاهاً هائلاً للنمو. ومع ذلك، تعاني بنيات الخوادم التقليدية من العديد من العوائق في قدرات التوسع، مثل محدودية فتحات PCIe، وصعوبة الموازنة بين نشر وحدة معالجة الرسومات ووحدة تخزين أقراص الحالة الصلبة (SSD)، ونقص المرونة في حلول التوسعة. وقد أدت هذه المشاكل إلى تقييد الابتكار في مجال الأعمال بشدة. ستحلل هذه الورقة البحثية بعمق هذه المشاكل في هذا المجال وتوضح كيف أن LR-LINK LRSV9500-4I يوفر للمؤسسات حلاً شاملاً للتوسعة من خلال أوضاع التشعب X4/X8/X16 المرنة.
بُعد المقارنة | الحل التقليدي | |
القدرة على التوسع | 1 فتحة واحدة = 1 جهاز | 1 فتحة واحدة = 8 أقراص SSD أو 2 وحدة معالجة رسومات (GPU) |
مرونة التهيئة | الوظيفة الثابتة | أوضاع X4/X8/X16 قابلة للتبديل |
موازنة GPU + SSD | صعوبة الالتقاء في نفس الوقت | مدعوم بشكل مثالي في وضع X8 |
دعم PCIe 5.0 PCIe 5.0 | الدعم الجزئي | دعم 32GT/ثانية كامل |
الربط البيني متعدد وحدات معالجة الرسومات البينية | الاعتماد على إعادة توجيه وحدة المعالجة المركزية | اتصال P2P إلى P2P |
II.Tحالات تطبيق الصناعة النموذجية
قامت إحدى شركات الذكاء الاصطناعي ببناء منصة متقدمة لتدريب النماذج الكبيرة، باستخدام الوضع X16 من LRSV9500-4I لتوسيع وحدات معالجة الرسومات. يتم توصيل 8 وحدات معالجة رسومات من خلال 4 LRSV9500-4I البطاقات. يعمل هذا التكوين على تحسين استخدام وحدة معالجة الرسومات وكفاءة التدريب بشكل كبير.
تم إنشاء مجموعة تخزين موزعة باستخدام الوضع X4 من LRSV9500-4I، مما يحقق أن خادمًا واحدًا يدعم 8 محركات أقراص U.2 NVMe SSD بسعة إجمالية تبلغ 128 تيرابايت وعرض نطاق ترددي إجمالي يزيد عن 50 جيجابايت/ثانية. وقد أدى تطبيق هذه التقنية إلى تحسين قابلية توسع النظام وأدائه بشكل كبير، مع زيادة أداء الاستعلام عن قاعدة البيانات بمقدار 10 أضعاف.
يهيئ الإنتاج السينمائي والتلفزيوني محطات العمل في وضع X8، وهي مزودة ببطاقتي رسومات تقدمان أداءً ممتازاً في اختبارات العرض في الوقت الحقيقي ويمكنها تحسين كفاءة العرض والتصدير بشكل كبير. بالإضافة إلى ذلك، يضمن تكوين 2 من محركات أقراص الحالة الصلبة NVMe SSD قراءة وكتابة عالية السرعة لتخزين المواد. تُظهر اختبارات الأداء الاحترافية زيادة سرعة عرض مواد الفيديو بدقة 4K بأكثر من 80% مقارنةً بالتكوينات التقليدية، وتقليل وقت تصدير الفيديو عالي الوضوح بنسبة 60%.
يستخدم مركز الحوسبة الفائقة عقد الحوسبة غير المتجانسة LRSV9500-4I لتحقيق الحوسبة المتوازية لوحدات معالجة الرسومات في وضع X16 والتوصيل الفعال لبطاقات تسريع FPGA والتخزين NVMe في وضع X8. وقد أدت طريقة التكوين المرنة هذه للحوسبة والشبكة والتخزين إلى تحسين استخدام الموارد بنسبة 40%.
III.LRSV9500-4I اقتراحات الاختيار والتكوين
· في سيناريوهات تدريب الذكاء الاصطناعي الخالصة، يوصى بتحديد وضع X16 لزيادة عرض النطاق الترددي لوحدة معالجة الرسومات الفردية وبالتالي دعم بطاقات الرسومات المتطورة
· في سيناريوهات التخزين الخالصة، يمكن اختيار وضع X4 لزيادة عدد محركات أقراص الحالة الصلبة إلى أقصى حد وزيادة بناء مصفوفة فلاش عالية الكثافة
· بالنسبة لسيناريوهات التحميل المختلط، يمكن تحديد وضع X8 لموازنة تكوين وحدة معالجة الرسومات ومحرك أقراص الحالة الصلبة لتحقيق التخصيص الأمثل للموارد
· توافق اللوحة الأم: تأكد من أن اللوحة الأم تدعم PCIe 5.0
· مساحة الهيكل: LRSV9500-4I ذو تصميم بنصف الارتفاع، متوافق مع خوادم 2U وما فوقها
· شروط تبديد الحرارة: تأكد من عدم وجود مجرى هواء للخادم دون عائق، ويمكن إضافة تدابير إضافية لتبديد الحرارة الإضافية إذا لزم الأمر
· جودة الكابل: استخدم كبلات MCIO عالية السرعة المعتمدة لضمان سلامة إشارات PCIe 5.0 عالية السرعة
مع إصدار مواصفات PCIe 6.0، وصل معدل الإرسال إلى 64GT/s لكل قناة. سيؤدي نضج هذه التقنية، إلى جانب تطوير تقنية CXL، إلى توفير فرص تطوير جديدة لبطاقات توسيع محول PCIe Switch. سيؤدي تطوير تقنية CXL، وخاصةً دعم CXL 2.0 لتجميع الذاكرة وبنية التبديل، إلى توسيع دور محول PCIe Switch، الذي لن يقتصر بعد الآن على توسيع وحدة معالجة الرسومات والتخزين، بل سيأخذ دورًا مهمًا في توسيع الذاكرة.
في الوقت نفسه، مع النمو المستمر لمقياس معلمات النماذج الكبيرة للذكاء الاصطناعي مع النمو المستمر لمقياس معلمات النماذج الكبيرة للذكاء الاصطناعي، سيصبح الطلب على عرض النطاق الترددي للربط البيني لوحدة معالجة الرسومات أكثر إلحاحاً، وهو ما يمكن رؤيته من النمو الكبير في حجم السوق لصناعة النماذج الكبيرة للذكاء الاصطناعي والاختراقات التكنولوجية. ستصبح القدرة على الربط البيني متعدد الآلات لمفتاح PCIe الذي تم تحقيقه من خلال وظيفة NTB تقنية رئيسية لبناء مجموعات تدريب الذكاء الاصطناعي الكبيرة. ستستمر LR-LINK في الاستثمار في البحث والتطوير لتزويد العملاء بحلول توسع أكثر تقدماً.
تتمثل نقاط الألم في وحدة معالجة الرسومات للخادم وتوسيع التخزين بشكل أساسي في التناقض بين الموارد المحدودة والطلب غير المحدود. من خلال تقنية PCIe Switch وأوضاع التشعب المرنة X4/X8/X16، توفر LRSV9500-4I للمؤسسات مسار حل فعال. سواءً للتدريب على الذكاء الاصطناعي أو الحوسبة عالية الأداء أو تحليل البيانات الضخمة أو إنتاج الفيديو، يمكن أن يوفر LRSV9500-4I قدرات توسع ممتازة وحماية ممتازة للاستثمار.
وباعتباره المنتج الرئيسي لشركة LR-LINK في مجال PCIe 5.0، أصبح LRSV9500-4I، الذي يعتمد على الأداء الرائد لشريحة Broadcom PEX89048 والدعم المثالي للنظام البيئي، حل التوسعة المفضل لخادم الذكاء الاصطناعي وبناء مركز البيانات. إن اختيار LRSV9500-4I يعني اختيار بنية توسعة مرنة وفعالة وموجهة نحو المستقبل.