أعلنت Nvidia عن الجيل التالى من معمارية البطاقات الرسومية الجديدة التى سميت على أسم Ada Lovelace و هى ادا كينج البريطانية و هى شخصية مثيرة فى برمجة الكمبيوتر و كانت عالمة رياضيات وكاتبة إنجليزية اشتهرت بشكل رئيسي بعملها على الكمبيوتر الميكانيكي و تحتوى أحدث رقاقات Ada Lovelace من Nvidia على ما يصل إلى 18432 نواة CUDA وما يصل إلى 76 مليار ترانزستور بأحجام 4 نانومتر مما يؤدى الى زيادة أداء المعالجات الرسومية بتكلفة أقل و استخدام طاقة أقل لكن ما نراه فى البطاقات الرسومية الجديدة لا يعكس عمل المعمارية الجديدة فى استهلاك الطاقة
تشمل التغييرات الجديدة في SDK ومستوى العرض DLSS 3.0 لأخذ العينات الفائقة RTX Remix لإضافة ميزات عرض جديدة إلى التعديلات على الألعاب القديمة و إعادة ترتيب تنفيذ التظليل لتحسين الأداء و تم إزاحة الشبكات الدقيقة للحصول على تفاصيل ظلال أدق micromaps عتامة لتنظيف raytracing و Nvidia Reflex لتنسيق وحدة المعالجة المركزية مع وحدة معالجة الرسومات و أكبر وظيفة عرض فريدة للجيل الجديد هي تسريع التدفق البصري والذي يتكون من إطارات تم إنشاؤها بواسطة AI للحصول على معدلات إطارات أعلى.
تحتوى شرائح Ada Lovelace على مسرعات تدفق ضوئى و أصبح تتبع الأشعة Raytracing الآن أكثر كفاءة مع نوى RT من الجيل الأحدث و تبشر المعمارية الجديدة بزيادة واقعية مرئيات اللعبة من خلال الاستفادة من تتبع الاشعة فى الوقت الفعلى دون المقدار الهائل من قوة الحوسبة المطلوبة لرسم رسومات ثلاثية الأبعاد و يتم ذلك عن طريق مزج الرسومات النقطية التقليدية مع عناصر تتبع الأشعة مثل الانعكاسات و الاضاءة و على سبيل المثال يقدم الجيل الثالث من بطاقات RTX أنوية IPC “Ada” CUDA الجديدة الأعلى ونواة RT من الجيل الثالث ونواة Tensor من الجيل الرابع ومعالج التدفق البصري الجديد وهو مكون يلعب دورًا رئيسيًا في إنشاء إطارات جديدة
تقدم معمارية GeForce Ada المستند اليها بطاقة RTX 4070 TI دقة تصنيع TSMC 4 نانومتر لزيادة عدد الترانزيستور فى نواة المعالج الرسومى AD104 الذى يحتوى على 35.8 مليار ترانزستور و هو أكثر من ضعف مثله فى الجيل السابق GA104 و يتميز المعالج الرسومى الجديد بواجهة مضيف PCI-Express 4.0 x16 و ناقل ذاكرة GDDR6X مع نطاق عرض 192 بت و الذى تم اضافته الى RTX 4070 Ti بسعة 12 جيجابايت من الذاكرة بالاضافة الى وجود مسرع التدفق البصري (OFA) هو مكون مستقل عالي المستوى و تتميز الشريحة بوحدتي NVENC وواحدة من NVDEC في سلسلة GeForce RTX 40 مما يتيح تشغيل دفقين مستقلين لتشفير الفيديو
الأجيال الجديدة من المعالجات الرسومية تتشابه بشكل كبير مع الأجيال السابقة و يتميز المعالج الرسومى AD104 بـ 5 مجموعات معالجة رسومات (GPCs) كل منها يحتوى على جميع SIMD و مكونات عرض الرسومات و هى وحدة معالجة رسومات صغيرة فى حد ذاتها تشترك كل وحدة GPC فى محرك نقطى و أثنين من أقسام ROP و يحتوى GPC الخاص بـ AD104 على ستة مجموعات معالجة القوام (TPCs) كل منها لديها اثنان من المعالجات المتدفقة (SM) و وحدة متععدة الاشكال و يحتوى كل SM على 128 نواة CUDA عبر أربعة أقسام. نصف نوى CUDA هذه نقية- FP32 بينما النصف الأخر قادر على FP32 أو INT32 و يحتفظ SM بقدرة المعالجة الرياضية المتزامنة لـ FP32 + INT32 و يحتوي SM أيضًا على نواة RT من الجيل الثالث وأربعة أنوية Tensor من الجيل الرابع وبعض ذاكرة التخزين المؤقت وأربع وحدات TMU و يوجد 12 SM لكل GPC لذلك هناك 1536 نواة CUDA و 48 نواة Tensor و 12 RT نواة و بواسطة GPC و هناك خمسة GPCs من هذا القبيل والتي تضيف ما يصل إلى 7680 نواة CUDA و 48 نواة Tensor و 12 نواة تتبع الأشعة RT و بواسطة GPC هناك خمسة GPCs من هذا القبيل و التى تضيف ما يصل الى 7680 نواة CUDA و 240 وحدة TMU و 240 نواة Tensor و 60 نواة RT تساهم كل GPC ب16 ROPs لذلك هناك 80 ROP على الشريحة
يعمل الجيل الثالث من أنوية تتبع الأشعة RT على تسريع الجوانب الأكثر كثافة لتتبع الأشعة فى الوقت الفعلى بما فى ذلك أجتياز BVH و يعد محرك الشبكة الصغيرة ميزة ثورية تم تقديمها مع أنوية RT الجديدة من الجيل الثالث تماما كما كان للظليل الشبكى و التغطية تأثير عميق على تحسين الأداء بأستخدام الهندسة النقطية المعقدة مما يسمح لمطورى الألعاب بزيادة التعقيد الهندسى بشكل كبير و تعتبر DMMs هى طريقة لتقليل تعقيد بنية البيانات الهرمية لحجم محيط BVH و التى تستخدم لتحديد مكان وصول الشعاع الى الهندسة و فى السابق كان على BVH التقاط حتى أصغر التفاصيل لتحديد نقطة التقاطع بشكل صحيح و تتلقى بنية تتبع الشعاع في Ada أيضًا ارتفاعًا كبيرًا في الأداء من Shader Execution Reordering (SER) و هى ميزة محددة بالبرمجيات تتطلب وعيا من محركات الألعاب لمساعدة المعالج الرسومى على أعادة تنظيم و تحسين سلاسل العاملين المرتبطة بتتبع الأشعة
تقول Nvidia ان DLSS 3 هو ثورة فى العرض الرسومى و يزيد بشكل كبير من معدل الأطارات باستخدام مسرع التدفق البصرى و من ناحية أخرى يسمح RTX Remix للمطورين بإنشاء تعديلات مذهلة باستخدام تتبع الأشعة و DLSS للألعاب الكلاسيكية و فى معمارية Lovelace حسنت Nvidia أيضا عددا من الميزات الحالية وفقا للفريق الأخضر لتجعل Nvidia Reflex ألعاب الفيديو أكثر استجابة من ذي قبل مما يقلل من تأخر النظام الى 10 مللى ثانية فى ألعاب eSports الشائعة بالاضافة الى ذلك يمكن ل GeForce Experience الآن تسجيل اللعب في وضع HDR بدقة 8K و 60 إطارًا في الثانية و يزيل من Nvidia Broadcast ضجيج الخلفية مرتين بالاضافة الى الإصدار السابق ويحسن الكاميرا لمكالمات الفيديو والبث المباشر
كل اطار بديل مع DLSS 3 يتم إنشاؤه من قبل AI دون ان يكون نسخة طبق الاصل من الاطار الذى تم تقديمه سابقا هذا ممكن فقط فى بنية رسومات ADA بسبب مكون جهاز يسمى التدفق البصرى (OFA) و الذى يساعد فى التنبوء بالشكل الذى يمكن أن يبدو عليه الأطار التالى من خلال أنشاء ما تسميه NVIDIA مجال التدفق البصري يضمن OFA عدم الخلط بين خوارزمية DLSS 3 بواسطة الكائنات الثابتة في مشهد ثلاثي الأبعاد سريع التغير (مثل شريحة السباق) تعتمد العملية بشكل كبير على رفع الأداء الذى قدمه تنسيق الرياضيات FP8 للجيل الرابع من Tensor core المكون الرئيسى الثالث ل DLSS 3 هو Reflex من خلال تقليل قائمة أنتظار العرض الى الصفر و يلعب Reflex دورًا حيويًا في ضمان أن أوقات الإطارات مع DLSS 3 في مستوى مقبول و أن قائمة أنتظار العرض لا تخلط بين المرقى أى مزيج بين OFA ونواة Tensor من الجيل الرابع و هو السبب فى أن معمارية ADA مطلوبة لأستخدام DLSS 3 و لا تعمل على المعمارية القديمة






