Immagina di poter correre, nuotare, sparare e interagire con personaggi non giocabili (NPC) in mondi 3D immersivi creati solo da un'immagine o un semplice testo. Ecco Genie 2, uno strumento rivoluzionario di intelligenza artificiale di Google DeepMind che rende questa visione realtà.

0:00
/0:04
0:00
/0:05

Trasformare Immagini in Mondi 3D Interattivi

Genie 2 può generare mondi 3D basati su un'immagine o una descrizione testuale. Questi ambienti spaziano da prospettive in prima e terza persona a brevi sequenze video con controlli di veicoli che durano fino a un minuto. Le dimostrazioni di Genie 2, evidenziate nel blog di Google DeepMind, mostrano clip fino a 20 secondi.

Una caratteristica affascinante di Genie 2 è la sua capacità di ricordare la disposizione del mondo. Oggetti e luoghi che scompaiono dal campo visivo del personaggio riappaiono nel loro stato originale quando vengono rivisitati. Questo assicura continuità e un senso di realismo mentre si esplorano ambienti dinamici.

0:00
/0:07

Caratteristiche Interattive

Gli utenti di Genie 2 possono interagire attivamente con i mondi generati. Possono:

  • Saltare, nuotare ed esplorare terreni diversi.
  • Interagire con oggetti, come aprire porte o far esplodere esplosivi.
  • Creare e interagire con NPC, aggiungendo profondità e narrazione alle scene virtuali.

Questo livello di interattività eleva l'esperienza oltre le immagini statiche, offrendo infinite possibilità per giochi, formazione e simulazione.

0:00
/0:12

L'Evoluzione di Genie

Genie 2 si basa sul successo del suo predecessore, Genie 1, che Google ha presentato il 23 febbraio 2023. Genie 1, dotato di 11 miliardi di parametri, era focalizzato sulla generazione di mondi 2D. Genie 2, invece, fa un grande passo avanti convertendo input 2D in scene 3D completamente interattive.

Sebbene Google non abbia ancora rivelato quando Genie 2 sarà disponibile al pubblico, le sue potenziali applicazioni sono vaste, dalla progettazione di giochi alla narrazione immersiva e oltre.