H100 PCIe: المواصفات والاختبارات
خلاصة
بدأت في بيع H100 PCIe 22 مارس 2022. هذه Hopper بطاقة سطح المكتب المعمارية على أساس 4 nm عملية التصنيع وتستهدف في المقام الأول المصممين. 80 غيغابايت من HBM2e ذاكرة مسجلة في 1 GHz يتم توفيرها ، ومع 5120 Bit واجهة الذاكرة ، يُنشئ عرض نطاق ترددي 1,280 غيغابايت/s.
من حيث التوافق ، هذه بطاقة dual-slot متصلة عبر واجهة PCIe 5.0 x16. يبلغ طول الإصدار الافتراضي للشركة المصنعة 267 mm. 8-pin EPS يتطلب موصل طاقة ، واستهلاك الطاقة عند 350 Watt.
التفاصيل الأساسية
بعض الحقائق الأساسية حول H100 PCIe: الهندسة المعمارية وقطاع السوق وتاريخ الإصدار وما إلى ذلك.
المركز في تصنيف الأداء | غير مصنف | |
الترتيب حسب الشعبية | ليس في أعلى 100 | |
البنيان | Hopper (2022−2023) | |
اسم رمز GPU | GH100 | |
شريحة من السوق | محطة العمل | |
تاريخ الافراج عنه | 22 مارس 2022 ( منذ2 سنوات) |
المواصفات التفصيلية
H100 PCIe معلمات الأداء العامة مثل عدد التظليل وساعة GPU الأساسية وعملية التصنيع والتركيب وسرعة الحساب. تتحدث هذه المعلمات بشكل غير مباشر عن أداء H100 PCIe ، ولكن من أجل التقييم الدقيق ، يجب أن تأخذ في الاعتبار نتائج اختبار الأداء والألعاب.
خطوط الأنابيب / النوى CUDA | 7296 | من 21760 (GeForce RTX 5090) |
سرعة الساعة الأساسية | 1065 MHz | من 2670 MHz (Arc B580) |
زيادة سرعة الساعة | 1650 MHz | من 3599 MHz (Radeon RX 7990 XTX) |
عدد الترانزستورات | 80,000 million | من 208,000 million (B200 SXM 192 GB) |
تكنولوجيا عمليات التصنيع | 4 nm | من 3 nm (Arc Graphics 140V) |
قوة التصميم الحراري (TDP) | 350 Watt | من 2400 Watt (Data Center GPU Max Subsystem) |
معدل تعبئة النسيج | 752.4 | من 2,554 (Radeon Instinct MI300X) |
أداء النقطة العائمة | 24.08 TFLOPS | من 109.7 (GeForce RTX 5090) |
ROPs | 24 | من 192 (Radeon RX 7900 XTX) |
TMUs | 456 | من 1280 (Data Center GPU Max NEXT) |
Tensor Cores | 456 | من 1216 (Radeon Instinct MI300X) |
عامل الشكل والتوافق
معلومات عن توافق H100 PCIe مع مكونات الكمبيوتر الأخرى. مفيد عند اختيار تكوين كمبيوتر مستقبلي أو ترقية تكوين موجود. بالنسبة لبطاقات رسومات سطح المكتب ، فهي واجهة وحافلة (توافق اللوحة الأم) ، وموصلات طاقة إضافية (توافق مزود الطاقة).
واجهه المستخدم | PCIe 5.0 x16 | |
طول | 267 mm | |
عرض | 2-slot | |
موصلات الطاقة التكميلية | 8-pin EPS |
سعة ذاكرة VRAM ونوعها
معلمات الذاكرة المثبتة على H100 PCIe: نوعها وحجمها وناقلها وساعتها وعرض النطاق الترددي الناتج. لاحظ أن وحدات معالجة الرسومات المدمجة في المعالجات ليس لها ذاكرة مخصصة وتستخدم جزءًا مشتركًا من ذاكرة الوصول العشوائي للنظام بدلاً من ذلك.
نوع الذاكرة | HBM2e | |
الذاكرة القصوى | 80 غيغابايت | من 294912 (Radeon Instinct MI325X) |
عرض ناقل الذاكرة | 5120 Bit | من 8192 Bit (Radeon Instinct MI250X) |
سرعة ساعة الذاكرة | 1000 MHz | من 20000 (RTX 5000 Ada Generation Mobile) |
عرض النطاق الترددي للذاكرة | 1,280 غيغابايت/s | من 5,171 GB/s (Radeon Instinct MI300X) |
التوصيل والمخرجات
أنواع موصلات الفيديو وعددها الموجودة في H100 PCIe. كقاعدة عامة ، هذا القسم مناسب فقط لبطاقات الرسومات المرجعية لسطح المكتب ، نظرًا لأن توفر مخرجات فيديو معينة في أجهزة الكمبيوتر المحمول يعتمد على طراز الكمبيوتر المحمول ، في حين أن نماذج سطح المكتب غير المرجعية يمكن (على الرغم من أنها لن تكون بالضرورة) تحمل مجموعة مختلفة من الفيديو الموانئ.
موصلات العرض | No outputs |
توافق واجهة برمجة التطبيقات (API)
تم إدراج H100 PCIe APIs المدعومة ، بما في ذلك إصداراتها.
DirectX | N/A | |
نموذج تظليل | N/A | |
OpenGL | N/A | من 4.6 (GeForce RTX 4090) |
OpenCL | 3.0 | |
Vulkan | N/A | |
CUDA | 9.0 |
أداء معياري
الأداء المعياري لغير الألعاب لـ H100 PCIe. لاحظ أنه يتم قياس الأداء المعياري العام بالنقاط في نطاق 0-100.
GeekBench 5 OpenCL
Geekbench 5 هو معيار مستخدم على نطاق واسع لبطاقات الفيديو يجمع بين 11 سيناريو اختبار مختلفًا. تعتمد كل هذه السيناريوهات على الاستخدام المباشر لقوة معالجة وحدة معالجة الرسومات ، دون استخدام العرض ثلاثي الأبعاد. يستخدم هذا الخيار واجهة برمجة تطبيقات OpenCL الخاصة بمجموعة Khronos Group.
أرسل نتائج الاختبار إلى H100 PCIe.
وحدات معالجة الرسومات المماثلة
فيما يلي توصيتنا الخاصة بالعديد من بطاقات الرسومات التي تكون قريبة إلى حد ما في الأداء من تلك التي تمت مراجعتها.
المعالجات الموصى بها
يتم استخدام هذه المعالجات بشكل شائع مع H100 PCIe وفقًا لإحصائياتنا.