أعلنت Nvidia عن الجيل التالى من معمارية البطاقات الرسومية الجديدة التى سميت على أسم Ada Lovelace و هى ادا كينج البريطانية و هى شخصية مثيرة فى برمجة الكمبيوتر و كانت عالمة رياضيات وكاتبة إنجليزية اشتهرت بشكل رئيسي بعملها على الكمبيوتر الميكانيكي و تحتوى أحدث رقاقات Ada Lovelace من Nvidia على ما يصل إلى 18432 نواة CUDA وما يصل إلى 76 مليار ترانزستور بأحجام 4 نانومتر مما يؤدى الى زيادة أداء المعالجات الرسومية بتكلفة أقل و استخدام طاقة أقل لكن ما نراه فى البطاقات الرسومية الجديدة لا يعكس عمل المعمارية الجديدة فى استهلاك الطاقة
تشمل التغييرات الجديدة في SDK ومستوى العرض DLSS 3.0 لأخذ العينات الفائقة RTX Remix لإضافة ميزات عرض جديدة إلى التعديلات على الألعاب القديمة و إعادة ترتيب تنفيذ التظليل لتحسين الأداء و تم إزاحة الشبكات الدقيقة للحصول على تفاصيل ظلال أدق micromaps عتامة لتنظيف raytracing و Nvidia Reflex لتنسيق وحدة المعالجة المركزية مع وحدة معالجة الرسومات و أكبر وظيفة عرض فريدة للجيل الجديد هي تسريع التدفق البصري والذي يتكون من إطارات تم إنشاؤها بواسطة AI للحصول على معدلات إطارات أعلى.
تحتوى شرائح Ada Lovelace على مسرعات تدفق ضوئى و أصبح تتبع الأشعة Raytracing الآن أكثر كفاءة مع نوى RT من الجيل الأحدث و تبشر المعمارية الجديدة بزيادة واقعية مرئيات اللعبة من خلال الاستفادة من تتبع الاشعة فى الوقت الفعلى دون المقدار الهائل من قوة الحوسبة المطلوبة لرسم رسومات ثلاثية الأبعاد و يتم ذلك عن طريق مزج الرسومات النقطية التقليدية مع عناصر تتبع الأشعة مثل الانعكاسات و الاضاءة و على سبيل المثال يقدم الجيل الثالث من بطاقات RTX أنوية IPC “Ada” CUDA الجديدة الأعلى ونواة RT من الجيل الثالث ونواة Tensor من الجيل الرابع ومعالج التدفق البصري الجديد وهو مكون يلعب دورًا رئيسيًا في إنشاء إطارات جديدة
الأجيال الجديدة من المعالجات الرسومية تتشابه بشكل كبير مع الأجيال السابقة و يتميز المعالج الرسومى AD103 بـ 5 مجموعات معالجة رسومات (GPCs) كل منها يحتوى على جميع SIMD و مكونات عرض الرسومات و هى وحدة معالجة رسومات صغيرة فى حد ذاتها تشترك كل وحدة GPC فى محرك نقطى و أثنين من أقسام ROP و يحتوى GPC الخاص بـ AD103 على ستة مجموعات معالجة القوام (TPCs) كل منها لديها اثنان من المعالجات المتدفقة (SM) و وحدة متععدة الاشكال و يحتوى كل SM على 128 نواة CUDA عبر أربعة أقسام. نصف نوى CUDA هذه نقية- FP32 بينما النصف الأخر قادر على FP32 أو INT32 و يحتفظ SM بقدرة المعالجة الرياضية المتزامنة لـ FP32 + INT32 و يحتوي SM أيضًا على نواة RT من الجيل الثالث وأربعة أنوية Tensor من الجيل الرابع وبعض ذاكرة التخزين المؤقت وأربع وحدات TMU و يوجد 12 SM لكل GPC لذلك هناك 10240 نواة CUDA و 48 نواة Tensor و 80 نواة RT و بواسطة GPC و هناك خمسة GPCs من هذا القبيل و التى تضيف ما يصل الى 8488 نواة CUDA و 320 وحدة TMU و 264 نواة Tensor و 66 نواة RT تساهم كل GPC ب 96 ROPs لذلك هناك 80 ROP على الشريحة و 48 ميجابايت من التخزين المؤقت L2 و قامت Nvidia أيضا بتعطيل عدد قليل من وحدات NVDEC مما يمنحها نفس تكوين تسريع الفيديو الدقيق مع وحدتي NVENC وواحدة NVDEC. تعمل واجهة الذاكرة 256 بت على تشغيل 16 جيجا بايت من الذاكرة، ومع ذلك تعمل الذاكرة بسرعة 21 جيجابت في الثانية و يبلغ النطاق الترددي للذاكرة المتاحة 672 جيجابت في الثانية
يعمل الجيل الثالث من أنوية تتبع الأشعة RT على تسريع الجوانب الأكثر كثافة لتتبع الأشعة فى الوقت الفعلى بما فى ذلك أجتياز BVH و يعد محرك الشبكة الصغيرة ميزة ثورية تم تقديمها مع أنوية RT الجديدة من الجيل الثالث تماما كما كان للظليل الشبكى و التغطية تأثير عميق على تحسين الأداء بأستخدام الهندسة النقطية المعقدة مما يسمح لمطورى الألعاب بزيادة التعقيد الهندسى بشكل كبير و تعتبر DMMs هى طريقة لتقليل تعقيد بنية البيانات الهرمية لحجم محيط BVH و التى تستخدم لتحديد مكان وصول الشعاع الى الهندسة و فى السابق كان على BVH التقاط حتى أصغر التفاصيل لتحديد نقطة التقاطع بشكل صحيح و تتلقى بنية تتبع الشعاع في Ada أيضًا ارتفاعًا كبيرًا في الأداء من Shader Execution Reordering (SER) و هى ميزة محددة بالبرمجيات تتطلب وعيا من محركات الألعاب لمساعدة المعالج الرسومى على أعادة تنظيم و تحسين سلاسل العاملين المرتبطة بتتبع الأشعة
تقول Nvidia ان DLSS 3 هو ثورة فى العرض الرسومى و يزيد بشكل كبير من معدل الأطارات باستخدام مسرع التدفق البصرى و من ناحية أخرى يسمح RTX Remix للمطورين بإنشاء تعديلات مذهلة باستخدام تتبع الأشعة و DLSS للألعاب الكلاسيكية و فى معمارية Lovelace حسنت Nvidia أيضا عددا من الميزات الحالية وفقا للفريق الأخضر لتجعل Nvidia Reflex ألعاب الفيديو أكثر استجابة من ذي قبل مما يقلل من تأخر النظام الى 10 مللى ثانية فى ألعاب eSports الشائعة بالاضافة الى ذلك يمكن ل GeForce Experience الآن تسجيل اللعب في وضع HDR بدقة 8K و 60 إطارًا في الثانية و يزيل من Nvidia Broadcast ضجيج الخلفية مرتين بالاضافة الى الإصدار السابق ويحسن الكاميرا لمكالمات الفيديو والبث المباشر
كل اطار بديل مع DLSS 3 يتم إنشاؤه من قبل AI دون ان يكون نسخة طبق الاصل من الاطار الذى تم تقديمه سابقا هذا ممكن فقط فى بنية رسومات ADA بسبب مكون جهاز يسمى التدفق البصرى (OFA) و الذى يساعد فى التنبوء بالشكل الذى يمكن أن يبدو عليه الأطار التالى من خلال أنشاء ما تسميه NVIDIA مجال التدفق البصري يضمن OFA عدم الخلط بين خوارزمية DLSS 3 بواسطة الكائنات الثابتة في مشهد ثلاثي الأبعاد سريع التغير (مثل شريحة السباق) تعتمد العملية بشكل كبير على رفع الأداء الذى قدمه تنسيق الرياضيات FP8 للجيل الرابع من Tensor core المكون الرئيسى الثالث ل DLSS 3 هو Reflex من خلال تقليل قائمة أنتظار العرض الى الصفر و يلعب Reflex دورًا حيويًا في ضمان أن أوقات الإطارات مع DLSS 3 في مستوى مقبول و أن قائمة أنتظار العرض لا تخلط بين المرقى أى مزيج بين OFA ونواة Tensor من الجيل الرابع و هو السبب فى أن معمارية ADA مطلوبة لأستخدام DLSS 3 و لا تعمل على المعمارية القديمة






