Review

دليل RTX 5090 Cutlass لعمليات GEMM المخصصة

  • Updated December 15, 2025
  • Ada Anderson
  • 13 comments

كما أنني مبتدئ في البرمجة باستخدام CUDA، كنت أستكشف استخدام وحدات التنسور على RTX 5090، وأقارن أداءها مع وحدات CUDA التقليدية. خلال هذه العملية، واجهت تحديًا مع مكتبة Cutlass. نقطة الارتباك الرئيسية هي تحديد القدرة الحسابية الصحيحة التي يجب تحديدها أثناء التجميع والبرمجة؛ بمعنى آخر، ما إذا كنت يجب أن أستهدف SM_100 أو SM_120 لهذا الجهاز.

هدفّي الرئيسي هو تهيئة عملية GEMM مخصصة باستخدام Cutlass لحالة اختبار بسيطة حيث تكون قيم M و N و K جميعها مساوية لـ 4096. على الرغم من محاولاتي، لم أتمكن من تشغيل برنامج أساسي. هل هناك أمثلة واضحة وعملية متاحة توضح كيفية بناء كود Cutlass ومعالجة عملية التجميع؟ لقد حاولت استخدام Gemini للمساعدة، لكنه حتى الآن فشل في تجميع الكود المقدّم.

Choose a language:

13 Comments

  1. أواجه نفس التحدي مع مكتبة كتلاس على بطاقة RTX 4070، خاصة في تحديد الإصدار المناسب لإمكانيات الحساب مثل SM_100 الذي ذكرته. من تجربتي، غالباً ما تكون المشكلة في إعدادات الترجمة واختيار المعمارية الصحيحة للبوستات. هل جربت استخدام أمثلة المشاريع الجاهزة في مستودع كتلاس الرسمي؟ لأنها ساعدتني في بداية مشروعي.

اترك تعليقًا