Improve Cutile Kernel Perf
TileGym
NVIDIA
تحسين أداء نوى cuTile بشكل متكرر من خلال التحليل المنهجي للأداء وتحديد الاختناقات ومقارنة التمثيل الوسيط والضبط الموجه.
Iteratively optimize cuTile kernel performance through systematic profiling, bottleneck analysis, IR comparison, and targeted tuning.
كيفية الحصول على المهارة
مهارة وكيل (Agent Skill) من NVIDIA. حمّلها أو استنسخها ثم ثبّتها لدى وكيلك.
الإعداد والتثبيت (Setup & Installation)
- استنسخ المستودع:
git clone https://github.com/NVIDIA/skills.git - انسخ مجلد المهارة (الذي يحتوي على
SKILL.md) إلى مجلد مهارات وكيلك، مثل.claude/skills/. - أعد تشغيل/تحميل الوكيل ليكتشف المهارة تلقائياً.
- راجع
SKILL.mdللاطّلاع على أي تعليمات أو متطلّبات خاصة.
مهارات ذات صلة
TileGym
Adding Cutile Kernel
إضافة مشغل نواة GPU جديد من cuTile إلى TileGym.
NVIDIA
التفاصيل ←
TileGym
Converting Cutile To Julia
تحويل نوى GPU بلغة Python من cuTile (@ct.kernel) إلى ما يعادلها بلغة Julia (cuTile.jl).
NVIDIA
التفاصيل ←
TileGym
Converting Cutile To Triton
تحويل نوى GPU من cuTile (@ct.kernel) إلى ما يعادلها بـ Triton (@triton.jit).
NVIDIA
التفاصيل ←
TileGym
Cutile Autotuning
يُستخدم عند إضافة أو تعديل أو تحسين أو تصحيح كود ضبط cuTile التلقائي.
NVIDIA
التفاصيل ←