Dunyasha
6 августа 2025
32

Google представила ИИ-модель Genie 3

DeepMind, исследовательская лаборатория Google в области искусственного интеллекта, объявила о выпуске Genie 3 — новой ИИ-системы, способной создавать интерактивные виртуальные среды в реальном времени.

В обновлении DeepMind Google сообщает, что с помощью простого текстового запроса Genie 3 может создавать динамичные сцены с возможностью навигации, которые воспроизводятся с частотой 24 кадра в секунду в разрешении 720p.

Конечно, Genie 3 можно использовать только на плоских мониторах, поэтому неизвестно, когда мы получим что-то подобное для VR-гарнитур. Например, дисплей Quest 3 имеет разрешение 2064 × 2208 на глаз и базовую частоту обновления 90 Гц, что ставит виртуальную реальность на самый крайний уровень производительности (как обычно).

Но это, несомненно, пророческий взгляд на будущее. В отличие от статичных или предварительно отрендеренных симуляций, Google заявляет, что модель генерирует каждый кадр «на лету», что обеспечивает более быстрое взаимодействие с пользователем и обратную связь с окружающей средой.

Более того, по словам Google, эти сгенерированные миры могут оставаться визуально и физически согласованными в течение нескольких минут, поскольку система сохраняет своего рода кратковременную память для отражения прошлых действий.

Genie 3 также способен моделировать широкий спектр сценариев, включая естественные среды, исторические локации, а также вымышленные и анимированные миры. При этом пользователи могут запускать «управляемые мировые события», внося изменения в мир с помощью текстовых команд, например, изменять погоду или добавлять новые объекты.

На данный момент существует несколько ограничений. Genie 3 в настоящее время имеет ограниченное «пространство действий» для агентов и испытывает трудности с точным моделированием многоагентного взаимодействия в общих средах. Под «агентами» компания подразумевает системы искусственного интеллекта, которые работают автономно в виртуальных средах, принимая решения, выполняя действия и обучаясь на собственном опыте.

Кроме того, Genie 3 сталкивается с трудностями при моделировании реальных локаций с «идеальной географической точностью», чёткой визуализацией текста и поддержанием длительных взаимодействий, превышающих несколько минут.

Тем не менее, это довольно впечатляющий шаг вперёд по сравнению с теми неинтерактивными видеороликами, которые мы сейчас видим в интернете и многие из которых довольно сложно отличить от настоящих. Симуляторы поедания спагетти Уиллом Смитом будут становиться всё более реалистичными, а с появлением таких систем, как Genie 3, — ещё и интерактивными.

поделитесь с друзьями: источник:
0 комментариев Оставить комментарий