Игроделы, похоже, смогли понять, как работает наша Матрица
https://futurism.com/doom-running-on-neural-network
Мы уже видели, как в культовую видеоигру Doom 1993 года играли на устройствах от шоколадного батончика до трактора John Deere, от кубика Lego до клеток E. Coli.
Теперь исследователи из Google и Тель–Авивского университета пошли еще дальше в этой вирусной тенденции, используя генеративную модель ИИ для запуска игры вместо обычного игрового движка.
Результаты примерно такие же странные, как и можно было ожидать, как видно из видео, которым поделились исследователи, с плохими парнями, которые то появляются, то исчезают, а стены странно двигаются.
Однако, если отбросить визуальные странности, это все равно впечатляюще точная интерпретация видеоигры 1993 года и поразительная демонстрация мощи технологии.
«Может ли нейронная модель, работающая в реальном времени, симулировать сложную игру в высоком качестве?» — написали исследователи в своей еще не рецензируемой статье. «В этой работе мы демонстрируем, что ответ — да».
«В частности, мы показываем, что сложная видеоигра, культовая игра Doom, может быть запущена на нейронной сети», — добавили они.
Традиционно игровые движки реагируют на пользовательский ввод и визуализируют сцену в соответствии с вручную запрограммированным набором правил.
Но, используя мощь моделей диффузии, используемых большинством основных генераторов изображений ИИ, таких как Stable Diffusion и DALL–E, исследователи обнаружили, что они могут отказаться от этого подхода в пользу ИИ.
Их новая модель диффузии, названная GameNGen, основана на версии Stable Diffusion с открытым исходным кодом 1.4 и была обучена на 900 миллионах кадров, взятых из существующих игровых кадров Doom.
GameNGen создает следующий кадр в зависимости от ввода пользователя, фактически действуя как иллюзорный игровой движок.
«Хотя это и не точная симуляция, нейронная модель способна выполнять сложные обновления игрового состояния, такие как подсчет здоровья и боеприпасов, атака врагов, повреждение объектов, открытие дверей и сохранение игрового состояния на длинных траекториях», — пишут исследователи в своей статье.
Однако исследователи признали, что у их подхода есть некоторые явные ограничения.
«Модель имеет доступ только к чуть более чем 3 секундам истории», — пишут они в своей статье. В результате такие объекты, как бочки и плохие парни, исчезают и появляются из ниоткуда.
Тем не менее, они обнаружили, что «логика игры сохраняется в течение значительно более длительных временных горизонтов».
«Хотя часть игрового состояния сохраняется через пиксели экрана (например, подсчет боеприпасов и здоровья, доступное оружие и т. д.), модель, вероятно, изучает сильные эвристики, которые позволяют делать значимые обобщения», — говорится в статье.
Технология может открыть множество дверей в мире разработки видеоигр, потенциально снижая затраты и делая процесс разработки более доступным. Игры можно даже писать и редактировать в текстовом формате или путем загрузки образцов изображений ИИ.
«Например, мы могли бы преобразовать набор кадров в новый игровой уровень или создать нового персонажа просто на основе образцов изображений, без необходимости писать код», — написала команда.
«Сегодня видеоигры программируются людьми», — заключили исследователи. «GameNGen — это доказательство концепции для одной части новой парадигмы, где игры — это веса нейронной модели, а не строки кода».
Шокировавший всех в свое время фильм Матрица заставил в 1033–й где–то раз самые лучшие умы задуматься об устройстве нашего мира. И, согласно итогам этого размышления мы живем в Матрице с вероятностью 51% или более. А если учесть, что остальные 49% делят между собой “бескрайний космос от NASA”, Плоская Земля и другие теории, но та тот же “бескрайний космос от NASA” места остается не так много.
Однако, в теории Матрицы есть один нюанс, который все–таки её до конца принять не позволяет, а именно – мощность компьютерной системы, которая создает нашу симуляцию. Разговоры про “высшую сверхцивилизацию” – это бла–бла бла для средних умов. На самом деле мощность компьютера, генерирующего Вселенную, просто невообразима. Для примера мощности самого–самого современного суперкопьютера не хватит, чтобы смоделировать АТОМ. Когда светлые адепты посчитали, сколькими вариантами там могут быть свернуты суперструны – получилось 10 в 500–й степени.
Сказать, что 10 в 500–й степени кошмарное число – это на самом деле не сказать ничего. Самое большое известное человекам число – это 10 в 100–й степени, оно называется googol и в честь него названа одна прославленная фирма. Насколько это много показывает пример числа атомов в видимой Вселенной, которых на 20 порядков меньше чем 10 в 100–й степени – вот насколько оно много. А 10 в 500–й – это на 400 порядков больше googol, то есть число бессмысленное.
А теперь вообразим компьютер, который будет моделировать 10 в 80–й степени атомов Вселенной, каждый из которых может быть собран в 10 в 500–й степени вариантов. Вообразить как–то сложно. Однако, GameNGen если не дает ответ на вопрос, то чуть–чуть приоткрывает завесу.
Согласно принципам традиционных игроделов Матрица работает как: чувак встал утром с кроватки и куда–то там побежал по важным делам. Движок Матрицы смотрит, как чувак и чем двигает – и генерирует ему картинки будильника, завтрака, лестничной площадки, светофора и рожи начальника – босса уровня. Но, GameNGen подходит к вопросу радикально иначе: она генерирует чуваку картинку, построенную на основании предыдущей и грузит в подключенный к башке коаксиальный кабель. Тем самым вычисления облегчаются в миллиарды триллионов раз или как–то так.
На первом этапе, конечно, GameNGen, выглядит очень забавно: использовать 30 000 девайсов NVIDIA для игры 1993–го года – это как для поиска в темноте упавших 10–ти центов не просто поджечь 100–долларовую банкноту, а взорвать к херам соседний банк. Но сам принцип использован правильный: гораздо проще сгенерировать картинку нужного разрешения, чем получить ту же картинку путем не имеющих прямого отношения к ней вычислений – поведения атомов в будильнике, движения молекул воздуха над кроватью и бега электронов на светофоре.
Очевидно именно так и работает Искусственный Интеллект, создающий нашу реальность. Отсюда и проблемы типа Манделы, сдвигов во времени и ситуаций, когда человека с одного шага забрасывает не туда. Ни в одной, даже в глючной видеоигре такого не бывает, там все строго по протоколу, однако Искусственный Интеллект любит такие фокусы – пропадающие стены, аномальной количество пальцев и так далее.
Более того: подобный принцип генерации следующей картинки оставляет поле деятельности для колдовства и магии. В магических ритуалах используются вещи, которые никак не могут повлиять на удаленный физический объект, например те же фотографии. Но если будущее генерируется исходя из текущей картинки, то закапывание фото повлияет на это будущее еще и как – матрица начнет закапывать все объекты с заданной рожей.
Надеюсь, чувакам дадут денег на перспективное исследование и они смогут придумать, как вслед за Нео свалить из этого игрового мира и прислать странам и народам весточку, так что следим за развитием событий.
Написал аннунах–мракобес alcab на bestiarius.d3.ru / комментировать