Perf Host Optimization
تحليل ملف تعريف وتحسين كفاءة المضيف والمعالج في TensorRT-LLM باستخدام line_profiler (مع دعم nsys مخطط له).
Profiles and optimizes TensorRT-LLM host/CPU overhead using line_profiler (with nsys support planned).
كيفية الحصول على المهارة
مهارة وكيل (Agent Skill) من NVIDIA. حمّلها أو استنسخها ثم ثبّتها لدى وكيلك.
الإعداد والتثبيت (Setup & Installation)
- استنسخ المستودع:
git clone https://github.com/NVIDIA/skills.git - انسخ مجلد المهارة (الذي يحتوي على
SKILL.md) إلى مجلد مهارات وكيلك، مثل.claude/skills/. - أعد تشغيل/تحميل الوكيل ليكتشف المهارة تلقائياً.
- راجع
SKILL.mdللاطّلاع على أي تعليمات أو متطلّبات خاصة.
مهارات ذات صلة
Ad Accuracy Debug
تصحيح تراجعات دقة AutoDeploy مقابل درجة مرجعية (خادم PyTorch أو خط أساسي منشور).
Ad Add Fusion Transformation
مهارة Claude Code (trtllm-agent-toolkit): تنفيذ أو توسيع تحويلات دمج TensorRT-LLM AutoDeploy تحت مجلد transform/library/ في نسخة TensorRT-LLM.
Ad Conf Check
التحقق من تطبيق ملفات AutoDeploy YAML بالفعل من خلال تحليل سجلات الخادم ورمية الرسم البياني الاختيارية (AD_DUMP_GRAPHS_DIR).
Ad Graph Dump
تفعيل وتفسير رمية نصوص رسم البياني FX الخاصة بـ TensorRT-LLM AutoDeploy عبر AD_DUMP_GRAPHS_DIR.