مع التطور السريع للنماذج اللغوية الكبيرة وتقنيات الذكاء الاصطناعي التوليدي، أصبحت خدمات الاستدلال بالذكاء الاصطناعي من الأعمال الأساسية للحوسبة السحابية ومراكز البيانات. تأخذ هذه المقالة مشروع ترقية منصة استدلالية للذكاء الاصطناعي لمؤسسة إنترنت كمثال لتوضيح التطبيق العملي لبطاقة توسيع بطاقة توسيع PCIe 5.0 Retimer 5.0 LRSV9501-2E في سيناريوهات توسيع تخزين خادم الذكاء الاصطناعي، مما يوفر مرجعًا للمؤسسات التي تواجه تحديات البنية التحتية المماثلة.
تقوم إحدى شركات الإنترنت بتشغيل مساعد ذكاء اصطناعي ومنصات خدمة عملاء ذكية للمستخدمين النهائيين. مع النمو السريع للمستخدمين، تزايدت طلبات الاستدلال بالذكاء الاصطناعي للمنصة، مما زاد من الطلب على أداء البنية التحتية الأساسية وقابليتها للتوسع.
1. اختناق أداء التخزين
تتطلب خدمات الاستدلال بالذكاء الاصطناعي تحميلًا سريعًا لملفات النماذج الكبيرة (يمكن أن يصل حجم النموذج الواحد إلى عشرات الجيجابايت) ووصولاً فعالاً إلى قواعد البيانات المتجهة أثناء الاستدلال. استخدمت الخوادم الأصلية محركات أقراص PCIe 4.0 NVMe SSD. على الرغم من أن الأداء كان ممتازًا بالفعل، إلا أنه في ظل سيناريوهات التكرار العالي، أصبح زمن الوصول إلى التخزين عنق زجاجة النظام، مما أثر على سرعة الاستجابة للاستدلال.
2. سعة تخزين غير كافية
تحتاج المنصة إلى نشر إصدارات متعددة ومختلفة من نماذج الذكاء الاصطناعي لدعم اختبار A/B والإصدارات الرمادية. وبالإضافة إلى قواعد البيانات المتجهة وبيانات السجلات، تتجاوز متطلبات سعة التخزين لجهاز واحد 10 تيرابايت. تتميز الخوادم القياسية 2U بخلجان محركات أقراص محدودة ولا يمكنها تلبية احتياجات توسيع السعة.
3. قيود مساحة الهيكل
تستخدم المؤسسة خوادم قياسية مثبتة على حامل 2U كعقد استدلالية للذكاء الاصطناعي، كل منها مزود بـ 4 وحدات معالجة رسومات. مساحة الهيكل الداخلي مشغولة بالفعل بوحدات معالجة الرسومات وإمدادات الطاقة، مما يترك فتحة توسعة PCIe واحدة فقط. حلول توسعة التخزين التقليدية غير قابلة للتطبيق.
4. مشكلات تكامل الإشارة
تخطط المؤسسة لوضع بعض أجهزة التخزين خارجياً وتوصيلها عبر الكابلات لاختراق قيود مساحة الهيكل. ومع ذلك، فإن إشارات PCIe 5.0 تضعف بشدة أثناء الإرسال عالي السرعة، مما يتطلب حلولاً لتحسين الإشارة لضمان استقرار الاتصال.
تصميم الحلول
اختار التقييم الفني الطراز LRSV9501-9501-2E(انقر للشراء) بطاقة توسعة PCIe 5.0 x16 ثنائية المنفذ MCIO Retimer ذات المنفذ المزدوج كحل لتوسيع التخزين. تم إنشاء بنية تخزين عالية الأداء وذات سعة تخزينية عالية الأداء مع لوحات خلفية خارجية لتوسيع NVMe SSD ومحركات أقراص الحالة الصلبة PCIe 5.0 NVMe SSD.
أبرز مميزات بنية النظام:
LRSV9501-2E مثبت في فتحة PCIe 5.0 x16 للخادم، مهيأ في وضع التشعب 4 × 4 حارات
متصل باللوحة الخلفية الخارجية لتوسعة NVMe SSD عبر كبلين MCIO 8i
لوحة معززة موسعة مثبت عليها 8 محركات أقراص PCIe 5.0 NVMe SSD (4 محركات أقراص SSD لكل كابل MCIO)
تضمن شريحة ريتيمر سلامة إشارة PCIe 5.0 أثناء الإرسال لمسافات طويلة
باستخدام وضع التشعب 4 × 4 حارات، يتم تقسيم 16 حارة PCIe 5.0 إلى أربعة روابط x4. يتصل كل رابط x4 باثنين من محركات أقراص NVMe SSD (عبر تبديل اللوحة الخلفية)، مع الاستفادة الكاملة من عرض النطاق الترددي PCIe. مزايا هذا التكوين هي:
كثافة عالية للأجهزة: تدعم بطاقة توسعة واحدة توصيل 8 محركات أقراص NVMe SSD، مما يحسن كثافة التخزين بشكل كبير
أداء متوازن: يتلقى كل قرص SSD عرض نطاق ترددي x4 PCIe 5.0 x4 (16 جيجابايت/ثانية تقريبًا)، مما يلبي متطلبات الأداء العالي
توسعة مرنة: يمكن تعديل عدد الأجهزة المتصلة وفقًا للطلب دون الحاجة إلى استبدال الأجهزة
أكمل نشر الأجهزة وفقاً للخطوات التالية:
الخطوة 1: أوقف تشغيل الخادم وافصل كابلات الطاقة واتخذ الاحتياطات المضادة للكهرباء الساكنة
الخطوة 2: افتح الهيكل وحدد موقع فتحة التوسعة PCIe 5.0 x16 المتاحة
الخطوة 3: قم بتثبيت بطاقة التوسعة LRSV9501-2E، مع اختيار أقواس 2U أو 3U بناءً على ارتفاع الهيكل
الخطوة 4: قم بتثبيت اللوحة الخلفية الخارجية لتوسعة NVMe SSD في الحامل
الخطوة 5: قم بتوصيل بطاقة التوسعة باللوحة الخلفية الخارجية باستخدام كابلات MCIO 8i
الخطوة 6: قم بتثبيت 8 محركات أقراص PCIe 5.0 NVMe SSD في اللوحة الخلفية
الخطوة 7: إغلاق الهيكل، وتوصيل الطاقة، وتشغيل الطاقة للاختبار الذاتي
ادخل إلى واجهة إعداد BIOS للخادم وقم بتكوين وضع تشعب ممر فتحة PCIe إلى 4x4. بعد حفظ التكوين وإعادة التشغيل، يتعرف النظام على 8 محركات أقراص NVMe SSD مستقلة.
استخدم أداة fio لاختبار التخزين | أداء النظام | النتائج على النحو التالي |
قراءة متسلسلة أحادية المحرك | 12.8 جيجابايت/ثانية | تحسن بمقدار 2 ضعف تقريبًا |
الكتابة المتسلسلة أحادية المحرك | 10.2 جيجابايت/ثانية | تحسن بمقدار 2 ضعف تقريبًا |
الكتابة المتسلسلة أحادية المحرك | 48 جيجابايت/ثانية | تحسن بمقدار 4 أضعاف تقريبًا |
4K قراءة عشوائية 4K IOPS | 2,400K | تحسن بمقدار 3 أضعاف تقريبًا |
آثار التطبيق وفوائده
بعد ترقية التخزين، تحسنت سرعات تحميل ملفات نماذج الذكاء الاصطناعي الكبيرة بشكل ملحوظ. إذا أخذنا نموذج لغة كبير يحتوي على 70 مليار معلمة كمثال، فقد تحسن وقت التحميل بشكل كبير. أدى ذلك إلى تقصير أوقات تبديل النماذج وإعادة تشغيل الخدمة بشكل كبير، مما أدى إلى تحسين الكفاءة التشغيلية للمنصة.
تؤثر سرعة الاستعلام في قاعدة بيانات المتجهات بشكل مباشر على وقت استجابة الذكاء الاصطناعي للاستدلال. قلل نظام التخزين الذي تمت ترقيته من زمن الاستجابة لاسترجاع المتجهات من متوسط 15 مللي ثانية إلى 5 مللي ثانية، مما قلل من زمن الاستجابة للاستدلال من طرف إلى طرف بنسبة 30% تقريبًا، مما أدى إلى تحسين تجربة المستخدم بشكل كبير.
زادت سعة تخزين الخادم الواحد بشكل كبير، مما يلبي نشر نموذج متعدد الإصدارات واحتياجات تخزين البيانات الضخمة. كما يسمح تصميم اللوحة الخلفية للتوسعة الخارجية بمزيد من التوسع في المستقبل.
تضمن وظيفة ريتيمر LRSV9501-2E في جهاز LRSV9501-2E سلامة إشارة PCIe 5.0 عند إرسالها عبر كابلات MCIO. أظهرت مراقبة جودة الإشارة بعد التنفيذ انخفاض معدلات أخطاء البت، مما يلبي معايير الموثوقية على مستوى المؤسسات.
الملخص ومشاركة الخبرات
لقد تم التحقق بنجاح من القيمة العملية لـ LRSV9501-2E في سيناريوهات توسيع تخزين خادم الذكاء الاصطناعي. وفيما يلي ملخصات التجارب الرئيسية:
1. الاستفادة الكاملة من عرض النطاق الترددي PCIe 5.0 بالكامل
يوفر تحسين عرض النطاق الترددي لبطاقة PCIe 5.0 إمكانيات جديدة لتوسيع التخزين. من خلال تكوين تشعب الحارة المعقول، يمكن لبطاقة توسعة واحدة توصيل العديد من محركات أقراص الحالة الصلبة عالية الأداء، مما يحقق توسيع نطاق أداء التخزين الخطي.
2. ريتيمر يحل مشاكل تكامل الإشارة
التحدي الأكبر لتوسيع التخزين الخارجي هو سلامة الإشارة. تعمل رقاقة Broadcom BCM8565657 Retimer المدمجة في LRSV9501-2E على حل مشكلات توهين إشارة PCIe 5.0 بشكل فعال، مما يجعل التوصيلات الخارجية ممكنة.
3. ملاءمة واجهة MCIO
يكسر حل توصيل كابل MCIO قيود مساحة الهيكل، مما يجعل توسيع التخزين غير مقيد بمساحة الخادم الداخلية.
4. تجربة النشر بالتوصيل والتشغيل
كجهاز شفاف البروتوكول، لا يتطلب LRSV9501-2E أي برامج تشغيل مخصصة ويحقق التوصيل والتشغيل على كل من أنظمة CentOS وUbuntu، مما يقلل بشكل كبير من دورات النشر.
استنادًا إلى تجربة تنفيذ هذا المشروع، فإن LRSV9501-2E يمكن تطبيقها أيضًا على السيناريوهات المماثلة التالية:
منصات تدريب النماذج الكبيرة: توفير قدرات تحميل بيانات عالية السرعة لعقد تدريب GPU، مما يقلل من وقت المعالجة المسبقة للبيانات
أنظمة التوصية في الوقت الحقيقي: دعم استرجاع ناقلات الميزات عالية التكرار، وتحسين سرعة استجابة خدمة التوصيات
خدمات معالجة الفيديو: توفير إمكانات وصول عالية الإنتاجية للتخزين لتحويل ترميز الفيديو وتحليله
مجموعات الحوسبة العلمية: دعم القراءة/الكتابة عالية السرعة لمجموعات البيانات واسعة النطاق، وتسريع مهام المحاكاة والنمذجة
توسيع ذاكرة CXL: قم بتوصيل وحدات توسيع الذاكرة CXL لتوفير مجموعات ذاكرة ذات سعة كبيرة للتطبيقات كثيفة الذاكرة
توفر بطاقة التوسعة LRSV9501-2E PCIe 5.0 Retimer ذات تقنية PCIe 5.0 حلاً عالي الأداء وموثوقاً للغاية لتوسيع التخزين لمنصة الاستدلال بالذكاء الاصطناعي لمؤسسة الإنترنت. من خلال عرض النطاق الترددي عالي السرعة لبطاقة PCIe 5.0 وإمكانيات تحسين الإشارة الخاصة بـ Retimer، حققت المؤسسة تحسينات في أداء التخزين بعدة أضعاف مع اختراق قيود مساحة الهيكل. بالنسبة للمؤسسات التي تقوم ببناء أو ترقية البنية التحتية للذكاء الاصطناعي، يوفر LRSV9501-2E حلاً لتوسيع الإشارة عالي السرعة يوازن بين الأداء وقابلية التوسع والموثوقية. في تقنيات PCIe 5.0 وCXL سريعة التطور اليوم، سيؤدي اختيار حل التوسعة مع إمكانات تجديد الإشارة إلى حجز مساحة واسعة لترقيات التكنولوجيا المستقبلية.