Alexa Dungeon Adventure

Ciao a tutti,

Come appassionato di IA (in particolare di Reinforcement Learning) ho seguito abbastanza le tematiche relative ai Chat bot: in particolare mi interessava la possibilità di vedere uno dei suddetti software fare da master, interpretare i PNG, descrivere situazioni e luoghi.

Ora cominciano a vedersi le prime avvisaglie di quello che sarà:
https://www.amazon.com/Fangtastico-Dungeon-Adventure/dp/B01K457ZUS

Che ne pensate?
Molti di voi scrivono avventure per il proprio gruppo…prendereste in considerazione l’idea di scrivere qualcosa da far gestire a un chat bot?
Secondo voi si svilupperà un mercato per questo genere di prodotti?
Quanto rapidamente?

4 apprezzamenti

Non vedo l’ora che Alexa si metta a suggerirmi acquisti su Amazon in base a dati sulla mia personalità che ha determinato osservandomi giocare di ruolo. :slight_smile:

Scherzi a parte, è un argomento interessantissimo e devo pensarci per fare una risposta più ragionata.

1 apprezzamento

Così a naso ti direi che creare una IA che sappia fare da GM è un problema equivalente a creare una AGI o intelligenza artificiale forte, con capacità comparabili con quelle di un adulto. Serve un’intuizione sulle leggi fisiche, una teoria della mente, una cultura e la conoscenza di culture altre, e mille altre cose.

I chatbot funzionano bene nel botta e risposta ma tenere il filo della conversazione non è il loro forte.

4 apprezzamenti

Concordo quello che descrivi è il massimo ottenibile.
Ma qual è il livello attuale?

A quanto vedo è un sorta di MUD con interfaccia vocale. Alexa ti legge le descrizioni dei luoghi e converte in comandi le tue frasi. (che devono comunque essere vicine alla sintassi del comando)

Miglioramenti possibili nel breve termine:

  • Interpretazione dei PNG: qui il chat bot può andare forte…molto più di un software che legge frasi preconfezionate. Potresti in teoria intrattenerti per diversi minuti con il taverniere a parlare di quanto sia duro fare l’oste e pagare il pizzo alla gilda dei ladri, di come il nord stia perdendo le sue tradizioni nel corso dei secoli, della pericolosità dei goblin nelle fattorie vicine… il tutto senza l’interfaccia domande/risposte preconfezionate tipica dei video giochi moderni ma usando la conversazione libera. Ci sono chat bot avanzati che offrono risultati decenti sotto questo punto di vista già oggi ed è un campo in forte espansione. (Meet Meena, Google's most advanced conversational Artificial intelligence / Digital Information World)

  • traduzione delle descrizioni in comandi. Anche qui non sarebbe difficile realizzare in interprete che traduca un tuo ‘mi lancio mulinando la spada, senza badare alla precisione, contro il goblin’ in ‘attack(accuracy=0.1, damage=0.9)’

Alla fine questo thread mi ha ispirato un post con un po’ di considerazioni storiche (che volevo condividere anche altrove):

Ho appena finito di presentare ai miei studenti un modulo sull’argomento - quindi mi sono andato a studiare (o ripassare) un po’ di cose; ma non sono un espertone, anzi. Appena ho un attimo leggo bene tutto e se poi posso, mi piacerebbe farti delle domande specifiche @Jean_Luc_Picard

1 apprezzamento

Ma certo: neanche io sono un esperto e, onestamente, non credo che l’apprendimento supervisionato (reti neurali) sia l’approccio che alla lunga prevarrà con i chat bot. (spero nel reinforcement learning…ma forse solo perché mi piace/interessa di più) tuttavia riponderò volentieri alle tue domande.

1 apprezzamento

Stavo pensando a possibili conseguenze nel sistema magico dell’uso di chat bot.

  • potresti dover recitare le formule magiche: tanto meglio le reciti tanto più è potente l’effetto. Se le reciti male si scatena un effetto casuale di magia selvaggia.

  • alcune forme di magia (divinazioni?) potrebbero essere mediate da spiriti, elementali, demoni o divinità che potresti evocare per intrattenerti con essi in brevi conversazioni.

Vedo un grande potenziale in questo mezzo…speriamo gli sviluppi siano veloci…se raggiunge un buon livello magari potrei pensare di scrivere un modulino anche io.

Visto quanto il mondo videoludico ha investito nel comparto della grafica, in questi ultimi venti (?) anni, e quanto poco in quello dell’IA, direi che non avrò il piacere di essere intrattenuto insieme ai miei amici ad un tavolo da un master-bot.
Mi piacerebbe vederlo, quel giorno, ma non ci spero molto.

Ho trovato questo link vagamente attinente:

https://chatbotslife.com/a-cognitive-mystery-277650e02108

“We had a hackathon in the Watson Assistant team, and a few of us decided to create a murder mystery game. The idea is that you would need to interact with several characters to determine who the murderer was, and each of these characters would be a chat bot. We also created an assistant called Dr Watson, who was also a chat bot.”

Immaginate cosa potrebbe fare Google con le sue risorse computazionali…spero sviluppino un reparto per applicazioni dell’IA al settore videoulico.

1 apprezzamento

Qualcuno di voi conosce AI Dungeon basato sul deep learning [ https://play.aidungeon.io]? Se sì in cosa differiscono le due implementazioni?

1 apprezzamento

Sembra usare l’IA per generare contenuto. Non so se puoi conversare liberamente con i PNG. Certo anche l’idea di generare mondi sempre diversi è ottima.

Questa affermazione non è del tutto corretta. Ci sono giochi che hanno investito TANTISSIMO nel comparto AI, per il loro gioco.
Al massimo non hanno investito in tecnologie nuove, ma hanno portato ad altissimi livelli quelle già utilizzate.
Se prendi The Last of US che usa una “banale” state machine, fa cose incredibili
Lo stesso per Alien Isolation (che però usa un behaviour tree)

Può essere, ma mentre giocavo a The Last of Us non mi sono accorto di niente. I soliti nemici che corrono qua e là, e usano qualche copertura, cose viste da Gears of War in poi (forse anche prima). Oppure i mostri attirati lanciando un sasso o facendo rumore muovendosi, anche questa non è nulla di che.

Ma in realtà stavo pensando più al comparto GdR dei videogiochi. Provo un po’ a sognare:

  • Un albero di scelte di trama decenti, con una vera ramificazione che dia un peso alle decisioni del giocatore, supportato da PNG che reagiscano in modo leggermente convincente a quello che il protagonista ha fatto finora in altri luoghi / quest (Fable ha fatto qualcosina in merito, ma siamo davvero ad un livello embrionale).
  • L’utilizzo di generatori text-to-speech con tonalità decenti per emulare l’emozione provata in quel momento, invece di basarsi su costoso materiale pre-registrato dagli attori (che ovviamente non permette una grande ramificazione di scelte, dato che ti obbliga a registrare una montagna di roba), oppure al solo testo, che rompe mostruosamente l’immersione e l’atmosfera. Questo permetterebbe anche di avere l’eroe chiamato con nome, nickname, e suoi vari epiteti del momento, aumentando il coinvolgimento.
  • Generazione procedurale avanzata di luoghi, quest, incontri casuali, combinata con un tema che comunque leghi in modo sensato i vari eventi, per dare una parvenza di campagna sottostante.
  • Una struttura decente di camere intelligenti ed un minimo di set di movimenti che permetta di avere scene di dialogo, e di interazione nel downtime, decenti (ovvero, basta con il mondo che si freeza, mentre passi dieci minuti a leggere testo e fare scelte che praticamente influenzano solo il modo di dire la stessa cosa): i personaggi dovrebbero gesticolare, muoversi leggermente, sedersi se nei dintorni ci solo punti comodi per farlo, prendersi per la collottola quando sono arrabbiati ecc. Naturalmente, l’opposto di questo sono le cutscene esageratamente curate (ma totalmente railroadate) fatte tutte in motion capture, che solluccherano il giocatore ma che sono riservate per quei momenti che, qualunque scelta (inutile) tu abbia fatto finora, ti portano comunque lì.

In tutti questi campi, son convinto che si possa fare moltissimo, ma non ci sia alcuna volontà di investire, e siamo fermi a più di vent’anni fa. Ma, ehi, abbiamo la colonna sonora di Hans Zimmer, e il raytracing che mi mostra il riflesso del mio PG nella caffettiera, che tra l’altro probabilmente non posso nemmeno spostare dal tavolo con una fucilata.

Provo per una decina di minuti. Fin dall’inizio finisco in un non-sense con pezzi totalmente rotti:
image

Sigh.

2 apprezzamenti

XD era chiaramente un uomo terrorrizzato! Onestamente finchè mantiene l’interfaccia puro testo non mi va di provare: già sto al computer tutto il giorno, nel tempo libero preferisco fare altro. (Per questo abbandonai i video giochi in favore dei GDR)

Certo se ci fosse una voce narrante e comandi vocali sarebbe molto diverso.

Aiuterebbe a mio avviso concentrarsi su un solo obiettivo: invece di usare l’IA per generare il setting e il plot, avere un setting e un plot prestabiliti e focalizzarsi sull’interazione tra PG e PNG in un contesto il più circoscritto possibile.

Un pò come nell’esperiemento dei murder mistery. Forse un video game come Ace Attorney in cui c’è una fase di raccolta indizi e una con il processo vero e propio (in tribunale) potrebbe funzionare con conversazione libera gestita da chat bot.

L’ho provato anche io, considerando quello che c’è dietro non possiamo aspettarci niente di più di un generatore di continuità intuitiva (a volte neanche tanto continua, come nel tuo caso).
La versione premium dovrebbe essere migliore di quella gratis, ma dubito che sia molto meglio.

Sono pienamente d’accordo, il vero problema è che i sistemi di AI che abbiamo funzionano bene solo su compiti specifici.

  1. Generare ambientazioni e storie infinite, coerenti ed avvincenti.
  2. PNG che sappiano sostenere conversazioni interessanti.

Sono già di per se due obiettivi molto ambiziosi, sufficienti a impegnare per decenni anche se propulsi da una mole di finanziamenti imponente.
Cercare di realizzarli tutti e due contemporaneamente con una tecnologia immatura come quella attuale è la strada sicura per ottenere un risultato mediocre in entrambi i campi.

Fosse per me procederei a piccoli passi:

  1. Murder mistery: alcuni chat bot mentiranno, andando in contraddizione con se stessi o con quanto hanno detto altri chat bot o con gli indizi raccolti dall’investigatore. Alla fine del gioco l’investigatore indica il colpevole.

  2. Clone di Phoenix Wright: Ace Attorney
    Come il passo di cui sopra ma c’è anche la fase del processo. Invece che indicare il colpevole l’investigatore deve provare la colpevolezza ad altri chat bot (giudici e giuria).

Fatte queste esperienze si potrebbe cominciare ad esplorare il campo delle avventure (con trama e ambientazione fisse). In un contesto Fantasy potrebbero essere disponibili dei PNG sempre accessibili al protagonista (spiriti evocabili ad esempio) in grado di fornire informazioni difficili da ottenere in altro modo.

Tutto questo presuppone che il giocatore si sforzi di non tentare interazioni del genere:
«Oste: recitami una poesia!» oppure «Se un corpo parte fermo ad un’altezza di quattro metri dimmi, caro oste, dopo quanti secondi toccherà il suolo?»

Interazioni simili, cioè del tutto comparabili a quelle che abbiamo con normali esseri umani, richiedono ovviamente un interlocutore di intelligenza umana, tra l’altro pieno di nozioni avanzate, che rimane fuori gittata con le tecnologie attuali. Questo non vuol dire che non si possano ottenere conversazioni interessanti entro i limiti che ci si deve auto-imporre.

A domande del genere può sempre rispondere come un noto macellaio, e sarebbe anche la riposta più adatta :grin:

2 apprezzamenti