لقد رأيت رؤية منظمة العفو الدولية من أجل المعالج أوز في المجال وما زلت في حالة صدمة

على مدار العامين الماضيين ، تعمل Google على استخدام الذكاء الاصطناعى التوليدي إلى الراقية والتوسع الساحر أوزفيلم محبوب من عام 1939 ، والذي تم لمسه للجيل. Google DeepMind و Google Cloud – جنبا إلى جنب مع ديسكفري وارنر بروس و Magnopus – يقومون بهذه المهمة لإظهار الفيلم في جميع أنحاء المجال ، المسرح كروي عبادة في لاس فيجاس.
كنت في الحضور اليوم لأرى أول رؤية لماذا أوز سيكون الأمر كما هو الحال عندما تبدأ في اللعب في 28 أغسطس 2025. ساعد الحدث على بدء Google Cloud في 2025 ، والتي دعتني إليها Google.
يجب أن أقول الكثير عن ذلك ، لذلك سأقفز مباشرة. أولاً أريد أن أخبرك بما يحدث أوز. ثم أريد أن أخبرك بما يقوله جانبي في ذهني حول هذا الموضوع: حفلة المهوس التقنية ومهوس الأفلام. صدقوني ، كل حزب لديه آراء مختلفة للغاية حول هذا الجهد.
الساحر أوزGoogle and Sphere: ما الذي يحدث؟

لقد تعلمنا قبل بضعة أيام الساحر أوز جاء إلى الكرة جنبا إلى جنب مع فيلم جديد من الفريق الإبداعي وراء منفردة مجانيةوثيقة لعب الأوسكار 2018 على أول تسلق فردي مجاني El Capitan. ومع ذلك ، فإن الإعلان الأولي قد حذف التفاصيل الرئيسية: الساحر أوز لن يكون في المجال فيلمًا رأيته سابقًا.
المجال الداخلي هو مسرح مع شاشة تبلغ 16000 (16000 بكسل على كل جانب) الأجنحة فوق رؤوس الجمهور. بالإضافة إلى ذلك ، هناك إضاءة مسرحية في المكان ، وآلات الرياح العملاقة في المقدمة والمحركات المدمجة في المقاعد ، مما يتيح تجربة امتصاص كاملة تستخدم لتأثير كبير مع الأفلام والحفلات الموسيقية الحية والمزيد.
الساحر أوزنظرًا لأنه كان أكثر من 80 عامًا ، فلن يعمل في المجال ، لذلك ستغيره Google AI.
يعرض أوز لأنه في شيء مثل كرة ، لا معنى له. الفيلم يبلغ من العمر 80 عامًا. في عام 2020 ، اكتسبت 4K HDR ، ولكن حتى ذلك الحين ، سيبدو فيلم 4: 3 الذي تم إنشاؤه على الشاشات التقليدية في مهب بغباء في النسب اللازمة للتخطيط الفريد للمجال. فقط تخيل تفاصيل ضبابية عن جارلاند يهودا في ستة قصص ومرئية جزئيًا فقط ، لأن جبهتها تقف خلفك وذقنها أمامك. أشياء مخيفة.
هذا هو المكان الذي يأتي فيه Google. باستخدام DeepMind للمجموعة الضخمة من خوادم Google Cloud ، استخدم فريق ضخم من المهندسين والباحثين الذكاء الاصطناعي للتمديد والتمديد أوز. القصد من ذلك هو أن الفيلم الكلاسيكي يبدو كريستال بوضوح على 16 ألف و باستخدام الذكاء الاصطناعي التوليدي لتوسيع الطلقات لجعل الشاشة المقعرة تعمل بشكل أفضل.
الصورة تساوي ألف كلمة ، لذلك تعرف على ما يجب على Google التغلب عليه:

C. Scott Brown / Android Authorit
خلال عرض Google اليوم ، أظهر عدة مشاهد كلاسيكية من أوز يبدو أنه يبدو عندما لعب بالكامل في نهاية أغسطس. لقد رأينا التسليم الكامل لدوروثي وهو يغني “فوق قوس قزح” ، وهو مشهد تدور فيه الساحرة الشريرة في الغرب على المكان الدقيق للرمال الحمراء بينما تسخر دوروثي ، والمقدمة المخيفة لدوروثي وأصدقائها إلى ساحر غرفة الإطفاء. إذا نظرنا فقط من وجهة نظر فنية ، فقد كان الفك المتناقص تمامًا. هذا هو المكان الذي تركت فيه المهوس التقني الداخلي يركض مجانًا.
منظور التكنولوجيا المهوس: معجزة Gargantuan يقودها الذكاء الاصطناعي

C. Scott Brown / Android Authorit
تضمن الجزء الأول من عمل Google في هذا الفيلم ارتفاعًا إلى 16 ألفًا. هذا يتطلب تقنية لم تكن موجودة من قبل. يمكنك رؤية مستوى متزايد من تفاصيل Google في اللقطة المركبة أدناه:
أثناء الارتقاء الساحر أوز لقد كان في حد ذاته معاناة ، لذلك يتطلب الفيلم في المجال أكثر من ذلك: سيعيد فتحه تمامًا. الفيلم مليء بتفاصيل الأشخاص الذين يتحدثون ويتحدثون ويغنون ويصرخون أو الشخير وما إلى ذلك.
هذا يتطلب “تجاوز”. هذا هو عندما تلتقط صورة (أو مقطع فيديو في هذه الحالة) وأضف المزيد من المعلومات لتكبير دون تغيير نسب الممثلين ، الدعائم ، إلخ.
تحقق من هذين gif وانظر ما أعنيه. اليسار مشهد إعصار أوز كما تم تصويره في الأصل ، وأنه على اليمين هو مشهد تجاوز مع معلومات أخرى تضاف إلى الذكاء الاصطناعي:
هذا مثال بسيط نسبيا. معظم جثث جولاند جارلاند موجودة في اللقطة ، ولا يوجد أي ممثلون آخرون ، لذلك كل ما يتعين على الذكاء الاصطناعي فعله هو إضافة المزيد من الأراضي ، والمزيد من الحطام وأقدام جارلاند ، وهذا ليس صعبًا للغاية لأن مقدار المعلومات الموجودة بالفعل من اللقطة الأصلية.
من ما رأيته حتى الآن ، تقوم Google بعمل لا يصدق للتغلب على التحديات الفنية لهذا المشروع. إنه أمر مذهل حقًا.
عندما تكون الأمور صعبة حقًا ، يكون ذلك عندما يتعين على الذكاء الاصطناعي أن تضيف إلى جزء أكثر أهمية من جسم الشخص أو في بعض الأحيان حتى الممثل بأكمله والذي لم يكن هناك في الأصل. على الرغم من أن Google أظهر لنا وجهات نظر فقط من هذه الأنواع من اللقطات ، إلا أنه يمكنك استخدام خيالك لواحد من أشهر المشاهد في الفيلم: The Endring ، حيث يشرح دوروثي مغامراته لعائلته وأصدقائه (“كنت هناك وكنت هناك!”). لن تعمل اللقطة على وجه دوروثي في المجال خلال هذا المشهد ، لذلك يجب على Google التغلب عليها. ومع ذلك ، إذا كان يستخدم التجاوز لهذه اللقطة ، فسيشمل شخصيات أخرى تحيط دوروثي في السرير. في هذه الحالة ، سيتعين على الذكاء الاصطناعى أن يفهم الشخصيات التي تقع فيها ، وما تبدو عليه ، وما الذي سيفعلونه ، وكيف سيتحركون ، وكيف سيتحدثون ويتجاوزونه. من الصعب للغاية القيام بذلك – أو على الأقل من الصعب القيام بذلك بشكل جيد بما يكفي لجعله يبدو سخيفًا.
كما قلت ، حصلنا للتو على وجهات نظر العرض التقديمي الذي حضرته ، لكن ما رأيته يبدو مثيرًا للإعجاب. من وجهة نظر فنية ، تقوم Google بدقة بأشياء مذهلة هنا. حقيقة أن هذا يحدث في غضون عامين تقريبًا هو دليل على مدى سرعة تحرك الذكاء الاصطناعي.
من حيث تقييم الفيلم ، ومع ذلك ، فإن الأمور أكثر كفاءة بعض الشيء.
منظور المهوس: كنا بحاجة حقًا إلى طبعة جديدة من الذكاء الاصطناعي أوز؟

C. Scott Brown / Android Authorit
إذا كنت قلقًا بشأن كونك فيلمًا فلمًا وأخبرك أن الذكاء الاصطناعى ليس لديه مكان لمس الساحر أوز – لا تقلق لأنني لن أفعل. إنني أنظر إلى ما تفعله Google هنا ، لا يختلف كثيرًا عن الأعمال الفنية التي تراها في المتاحف اليوم. كما تعلمون ، حيث يمكنك “إدخال” الترفيه الظاهري لـ “Night Night” من Van Gogh. ليس هو نفسه عرض الصورة الحقيقية ، ولكن بدلاً من ذلك طريقة جديدة لتجربة هذا الفن. هذا الإصدار الجديد أوز متشابه.
كانت Google متحيزة للغاية فيما إذا لم يتمكن من التوقف عن التفكير إذا كان ينبغي ذلك.
لكنني سأقول أن ما رأيته اليوم في المجال الساحر أوز. خذ التسلسل “من خلال قوس قزح”. لم تكن جودي جارلاند وكأنها رجل حقيقي. يبدو أنها شمع ، وهي مشكلة نراها كثيرًا عندما تحاول الذكاء الاصطناعي تكرار الأشخاص أو الصور القديمة الراقية. في بعض النقاط ، بدا شعرها مثل قطعة من البلاستيك الصلب. لمحاولة إظهارك ، صنعت صورة تراها أعلاه من مقعدي وأقصتها في الصورة أدناه:

C. Scott Brown / Android Authorit
حتى لو كان بإمكانك تجاهل الأشياء الغريبة ، Uncanny Valley Auths التي تقوم بتصوير لقطات أعلاه ، فإن الطلقات الأخرى مختلفة تمامًا عن نفس الشيء. إن المشهد الذي يجتمع فيه دوروثي وجانغ للمرة الأولى مع دليل أوز يختلف أيضًا تمامًا. انظر كيف يقارن أدناه:
هذا يلمس المشكلة برمتها مع هذا الجهد ، مما يعني ما تراه في المجال في أغسطس ليس الساحر أوز لكن التفسير الخوارزمي للفيلم. من الواضح أن فيلم Google لم يتغذى فقط على الجوزاء ثم قال: “اجعل هذا 16 ألفًا ويبدو جيدًا في المجال”. لقد أمضى سنوات من التكرير لجعله أفضل ما يمكن. ولكن بغض النظر عن المدة التي قضاها (وما زالت تنفق) ضبط المنتج ، فإن المنتج النهائي لا يزال هو نفسه: إنه نسخة جديدة من أكثر الأفلام شعبية وتأثيراً في كل العصور. هل نحن حقا بحاجة إليها؟
أنا أيضًا متوتر بشكل لا يصدق من أجزاء من الفيلم حيث يولد الذكاء الاصطناعي الشخصية بأكملها. في عرض فرق Google/Magnopus تتحدث عن المشاهد مع دوروثي ، فزاعة ، أسد جبان ورجل تين. في هذه المواقف ، يتعين على الذكاء الاصطناعى أن تقرر ما تفعله الشخصيات خارج الشاشة في الطلقات التي لم تكن فيها من قبل. بمعنى ما ، توجه Google الآن لقطات جديدة للفيلم وتمسكها بالأصل. لم أرها بعد ، لذلك سأحتفظ بحكم ، لكنني لا أستطيع أن أنكر أنني متوترة للغاية كما يمكن أن تظهر. هناك أشخاص في جميع أنحاء العالم يحملون هذه الشخصيات قريبة ومكلفة للغاية ، وإذا كانت هذه النسخة المتصورة من الفيلم تعطلها بطريقة أو بأخرى ، فسوف تزعجهم.
ومع ذلك ، في النهاية ، آمل بصراحة أن تسير على ما يرام. جعلت أحداث فان جوخ الممتصة فان جوخ أكثر شعبية من أي وقت مضى وقدمت أعمالهم في الجيل الجديد. ربما هذا AI-AUGMENTED الساحر أوز سيكون له تأثير مماثل على الشباب الذين قد لا يبتكرون بمشاهدة فيلم 86 عامًا في المنزل ، ولكن سيشعر بسعادة غامرة بمشاهدته في المجال بمقاعد خداع وآلات الرياح وما شابه ذلك. الساحر أوزبعد كل شيء ، ألهم بعضًا من أعظم صانعي الأفلام في عصرنا ، لذلك ربما ستكون فرصة أن تستمر في القيام بذلك للوصول إلى الأجيال.