چندی پیش، کمپانی «اینتل» خبر از ساخت بزرگ‌ترین GPU جهان داده بود. اینک NVIDIA پرده از غول گرافیکی خود موسوم به DGX A100 برداشت. قدرتمندترین اکوسیستم پردازش‌های گرافیکی جهان در لیتوگرافی 7 نانومتری و قدرت خیره کننده که توانایی انویدیا را در ساخت معماری‌های گرافیکی قدرتمند به رخ می‌کشد. این شما و این هم غول گرافیکی DGX A100.

سیستم DGX A100 از 8 شتاب دهنده گرافیکی Tesla A100 بهره می‌برد. قدرت این غول گرافیکی به 5 پتلافلاپ در ثانیه می‌رسد! جالب است بدانید که DGX جدید می‌تواند تا 20 برابر سریع‌تر از DGX ساخته شده در معماری Volta باشد. اما دلیل این ارتقاء چشمگیر قدرت چیست؟ انویدیا لیتوگرافی معماری گرافیکی آمپر را به 7 نانومتر کاهش داده و در نتیجه تعداد ترانزیستورهای آن را به شکل قابل توجهی افزایش داده است. تراشه غول پیکر اینتل دارای 35 میلیارد ترانزیستور بود؛ این در حالی است که سیلیکون A100 به تنهایی دارای 54 میلیارد ترانزیستور فعال است.

به گفته انویدیا، تراشه گرافیکی A100 در بخش پردازش‌های هوش مصنوعی و بر پایه پردازش‌های 32 بیتی (FP32) تا 20 برابر سریعتر از V100 ظاهر می‌شود. همچنین بد نیست بدانید که انویدیا یک الگوی پردازشی جدید را ابداع کرده است. در این الگو، پردازش‌ها به صورت TF32 یا Tensor Float 32 انجام می‌شوند. TF32 با استفاده از مانیستای 10 بیتی و توان 8 بیتی FP32 استفاده می‌کند. به گفته انویدیا، بخش بزرگی از افزایش قدرت گرافیکی این معماری در A100، استفاده از این حالت پردازشی جدید است.

در کنار این موارد، شاهد استفاده از نسل سوم هسته‌های Tensor در معماری Ampere هستیم. به گفته انویدیا، هسته‌های تنسور به صورت بومی از پردازش‌های FP64 پشتیبانی می‌کنند. یکی از ویژگی‌های مهم و تازه وارد در سیستم پردازشی DGX A100، امکان تعریف حالت و نوع استفاده از GPU، برای هر سیستم و کاربرد است. این ویژگی که برای استفاده در HPC و سرورها مناسب است، به کاربران این امکان را می‌دهد که A100 را به حداکثر 7 کارت گرافیک مجازی تقسیم کند. همچنین پردازش‌ها را بدون آسیب و تغییر به سیستم‌های دیگر انجام دهد. در نهایت بد نیست بدانید که کاربران می‌توانند قدرت و مؤلفه های سخت افزاری کارت گرافیک مجازی خود را بنا به نوع استفاده، تنظیم کنند.

سیستم DGX-A100 یک غول گرافیکی به تمام معنی است که تنها در هر GPU آن، شاهد استفاده از 54 میلیارد ترانزیستور هستیم. در این سیستم از حافظه‌های گرافیکی HBM2 استفاده شده. این سیستم برای کاربردهای هوش مصنوعی، یادگیری عمیق، پردازش‌های گرافیکی محور سنگین، پزشکی، مکاشفات، شیمی، نجوم و … کاربرد دارد.