Resiliency
ميزات المرونة في Megatron Bridge تشمل تحمل الأعطال وكشف البطء والإعادة في العملية والمقاطعة وآلية إعادة التشغيل.
Resiliency features in Megatron Bridge including fault tolerance, straggler detection, in-process restart, preemption, and re-run state machine.
كيفية الحصول على المهارة
مهارة وكيل (Agent Skill) من NVIDIA. حمّلها أو استنسخها ثم ثبّتها لدى وكيلك.
الإعداد والتثبيت (Setup & Installation)
- استنسخ المستودع:
git clone https://github.com/NVIDIA/skills.git - انسخ مجلد المهارة (الذي يحتوي على
SKILL.md) إلى مجلد مهارات وكيلك، مثل.claude/skills/. - أعد تشغيل/تحميل الوكيل ليكتشف المهارة تلقائياً.
- راجع
SKILL.mdللاطّلاع على أي تعليمات أو متطلّبات خاصة.
مهارات ذات صلة
Adding Model Support
دليل إضافة دعم نماذج LLM و VLM جديدة في Megatron-Bridge
Build And Dependency
إعداد بيئة التطوير لـ Megatron Bridge — التطوير المستند إلى الحاويات وإدارة حزم uv وإعادة توليد ملف الأقفال وإضافة المتطلبات و Slurm
Bump Dependency
تحديث المتطلبات المثبتة مثل TransformerEngine و Megatron-LM و NRX وإعادة توليد ملف الأقفال وفتح طلب دمج ومتابعة العملية
Cicd
مرجع CI/CD لـ Megatron Bridge — هيكل خط الأنابيب وسير عمل الالتزام والطلبات وتحقيق الأخطاء والأنماط الشائعة