Perf Torch Cuda Graphs
تطبيق CUDA Graphs على أحمال عمل PyTorch — اختيار الواجهة البرمجية (torch.compile، PyTorch make_graphed_callables، TE make_graphed_callables، MCore CudaGraphManager، FullCudaGraphWrapper).
>- Apply CUDA Graphs to PyTorch workloads — API selection (torch.compile, PyTorch make_graphed_callables, TE make_graphed_callables, MCore CudaGraphManager, FullCudaGraphWrapper, m...
كيفية الحصول على المهارة
مهارة وكيل (Agent Skill) من NVIDIA. حمّلها أو استنسخها ثم ثبّتها لدى وكيلك.
الإعداد والتثبيت (Setup & Installation)
- استنسخ المستودع:
git clone https://github.com/NVIDIA/skills.git - انسخ مجلد المهارة (الذي يحتوي على
SKILL.md) إلى مجلد مهارات وكيلك، مثل.claude/skills/. - أعد تشغيل/تحميل الوكيل ليكتشف المهارة تلقائياً.
- راجع
SKILL.mdللاطّلاع على أي تعليمات أو متطلّبات خاصة.
مهارات ذات صلة
Ad Accuracy Debug
تصحيح تراجعات دقة AutoDeploy مقابل درجة مرجعية (خادم PyTorch أو خط أساسي منشور).
Ad Add Fusion Transformation
مهارة Claude Code (trtllm-agent-toolkit): تنفيذ أو توسيع تحويلات دمج TensorRT-LLM AutoDeploy تحت مجلد transform/library/ في نسخة TensorRT-LLM.
Ad Conf Check
التحقق من تطبيق ملفات AutoDeploy YAML بالفعل من خلال تحليل سجلات الخادم ورمية الرسم البياني الاختيارية (AD_DUMP_GRAPHS_DIR).
Ad Graph Dump
تفعيل وتفسير رمية نصوص رسم البياني FX الخاصة بـ TensorRT-LLM AutoDeploy عبر AD_DUMP_GRAPHS_DIR.