Ptq
مهارة تُستخدم عند طلب المستخدم لـ "ضغط نموذج" أو "تنفيذ PTQ" أو "كميات بعد التدريب" أو "ضغط NVFP4" أو "ضغط FP8" أو "ضغط INT8" أو "ضغط INT4".
This skill should be used when the user asks to "quantize a model", "run PTQ", "post-training quantization", "NVFP4 quantization", "FP8 quantization", "INT8 quantization", "INT4 AW...
كيفية الحصول على المهارة
مهارة وكيل (Agent Skill) من NVIDIA. حمّلها أو استنسخها ثم ثبّتها لدى وكيلك.
الإعداد والتثبيت (Setup & Installation)
- استنسخ المستودع:
git clone https://github.com/NVIDIA/skills.git - انسخ مجلد المهارة (الذي يحتوي على
SKILL.md) إلى مجلد مهارات وكيلك، مثل.claude/skills/. - أعد تشغيل/تحميل الوكيل ليكتشف المهارة تلقائياً.
- راجع
SKILL.mdللاطّلاع على أي تعليمات أو متطلّبات خاصة.
مهارات ذات صلة
Accessing Mlflow
البحث والاستعلام عن نتائج التقييم المخزنة في MLflow.
Debug
تنفيذ أوامر داخل حاوية Docker بعيدة عبر نظام نقل الأوامر القائم على الملفات (tools/debugger).
Deployment
نشر نموذج لغة كبير مُضغوط أو غير مضغوط كنقطة نهاية متوافقة مع OpenAI باستخدام vLLM أو SGLang أو TRT-LLM.
Evaluation
تقييم دقة نماذج اللغات الكبيرة المضغوطة أو غير المضغوطة باستخدام NeMo Evaluator Launcher.