Uno sguardo più da vicino a DeepMind, l'IA di Google che sta padroneggiando StarCraft 2

closer look deepmind

L'intelligenza artificiale cambierà il mondo. Vuole solo padroneggiare prima il gioco online

31 maggio 2020Questa funzione è stata originariamente pubblicata nel gennaio 2019.



Saresti perdonato se presumi che la tecnologia di intelligenza artificiale di DeepMind abbia già dimostrato le sue capacità.



Nel 2016 il celebre laboratorio informatico ha visto uno dei suoi programmi di intelligenza artificiale fare l'impensabile e vincere una partita di Go contro l'allora campione del mondo - ed essere umano - Lee Sedol. La padronanza dell'antico gioco da tavolo cinese era solo un esempio dell'apprendimento automatico che DeepMind spera di poter utilizzare alla fine per rivoluzionare settori come la scienza, la sanità e l'energia.

Per il passo successivo di quel viaggio, DeepMind ha rivolto la sua attenzione a StarCraft II. L'RTS di sette anni potrebbe ancora essere una sensazione di eSport, ma non è un evidente passo avanti rispetto a Go. Dopotutto, e con scusa a Blizzard, il gioco di strategia astratto di 2.500 anni è considerato un apice del design del gioco, della profondità strategica e dell'elegante complessità. Ma il bello di Go - e di quell'altro grande sparring partner di IA, gli scacchi - è che è ordinato con precisione e ben strutturato. Nonostante le scoraggianti combinazioni di possibili mosse offerte da questi giochi, la loro profondità non è necessariamente accompagnata dall'ampiezza.



Un RTS multiplayer, d'altra parte, è un po 'più caotico. I migliori giocatori professionisti di StarCraft II possono ottenere fino a 800 azioni significative di mouse e tastiera al minuto. È un gioco di strategia dinamico e irregolare giocato alla velocità di un inferno di proiettili, in cui una miriade di sistemi di interazione si scontrano in un groviglio sconcertante. StarCraft II richiede che i suoi giocatori gestiscano l'incertezza e diano un senso agli ambienti spaziali sfumati. Tutto ciò rappresenta una vera sfida per un'IA.

Miniatura di YouTube

Pertanto, DeepMind ha creato un programma di intelligenza artificiale chiamato AlphaStar, con uno scopo nella vita: padroneggiare il multiplayer competitivo di StarCraft II. In effetti, è già stato affrontato un testa a testa con alcuni dei migliori giocatori del mondo.

Siamo tutti più della nostra esperienza; centinaia di anni in più



Ecco perché mi ritrovo a trascinarmi in uno studio televisivo ad hoc allestito nella sede di Google nel Regno Unito. Nelle ultime settimane DeepMind, che è di proprietà di Alphabet, il genitore di Google, ha inviato AlphaStar a combattere con gli stimati professionisti del Team Liquid Dario 'TLO' Wünsch e Grzegorz 'MaNa' Komincz. Ora la società è pronta a condividere i giochi preregistrati e i commentatori che non hanno visto i giochi prima sono stati chiamati a portare un po 'di energia. È impostato un palcoscenico molto brillante.

Quello che stanno per rivelare sembra importante. Non si tratta solo dell'IA che si scontra con un paio di compagni di squadra di eSport. AlphaStar sfida l'idea di cosa significhi abilità nel gioco. Le ramificazioni potrebbero cambiare il modo in cui giocano i giocatori professionisti umani, come vengono sviluppati i titoli futuri e, naturalmente, come l'IA aumenta le capacità umane nel mondo più ampio.

DeepMind ha iniziato costruendo un giocatore artificiale di StarCraft II senza alcun senso del gioco. In effetti, il primo programma di intelligenza artificiale di StarCraft II - o 'agente' - che hanno creato non poteva nemmeno comprendere un mouse e una tastiera, per non parlare di regole o strategie. Ma continuava a staccarsi, guardando mezzo milione di giochi StarCraft umani, imparando tutto il tempo. AlphaStar ha imitato, sperimentato, fallito e imparato. Questo è il processo combinato di 'apprendimento approfondito' e 'apprendimento per rinforzo' al centro dell'offerta di DeepMind.

Alla BlizzCon 2018 all'inizio di novembre, AlphaStar aveva compreso le regole dell'RTS e padroneggiato alcune strategie di base basate su macro. Entro il 10 dicembre, dopo aver giocato numerose partite contro diverse versioni di se stessa, l'IA aveva abilmente battuto il giocatore umano più esperto di StarCraft nel team di DeepMind. Era giunto il momento di migliorare il suo gioco.

Nove giorni dopo, il manager del Team Liquid TLO è volato nel Regno Unito. Come giocatore professionista di StarCraft II ha schierato tutte le diverse razze del gioco, ma è conosciuto come un giocatore Zerg estremamente capace. AlphaStar, tuttavia, si era concentrato su Protoss vs Protoss per mantenere il suo apprendimento coerente. Una partita di soli Protoss contro TLO sarebbe quindi un primo test perfetto e gentile: lanciare l'agente di DeepMind contro un esperto fuori dalla sua zona di comfort.

Auto senza pilota:Questo è come Codemasters insegna all'IA a guidare

All'inizio del flusso, AlphaStar batte TLO nella prima partita usando uno stile di gioco silenziosamente non convenzionale, rifiutandosi di murare una rampa di strozzatura, un approccio ben consolidato data la mappa selezionata. Fuori dal cancello, l'IA ha preso il comando sugli umani e non sembra eccessivamente preoccupata di ballare al ritmo delle convenzioni. Nonostante tutta la teoria su cui i giocatori di StarCraft sono ossessionati, AlphaStar sta già facendo le cose in modo diverso.

Miniatura di YouTube

Tuttavia, l'agente DeepMind è costretto a essere il più umano possibile. Ci sono limiti alla velocità con cui può interagire e concessioni per assicurarsi che il suo approccio non sia così astratto che i giochi siano resi ingiocabili. In effetti, TLO ha fatto più 'azioni al minuto' di AlphaStar nel loro primo scontro, dimostrando che non c'è motivo di sostenere che prevale un ingiusto vantaggio di velocità.

'Ho iniziato quella partita con molta sicurezza', dice TLO della sua sconfitta, sfoggiando un sorriso confuso. Quindi il giocatore del Team Liquid afferma di aver imparato dall'esperienza, tuttavia, e si sente pronto a sconfiggere AlphaStar nelle prossime partite.

Le cose però vanno un po 'diversamente. Ad ogni round, AlphaStar cambia la sua strategia. L'intelligenza artificiale è sempre implacabile, sempre efficiente, ma mai prevedibile. TLO è battuto 5-0.

DeepMind chiaramente non si era trattenuto. AlphaStar in realtà combina cinque diversi agenti, qualcosa come una diffusione di diverse versioni di se stesso. Inoltre, DeepMind dice che AlphaStar ha giocato per circa 200 anni del gioco, un fatto che ha chiaramente preso un po 'di conforto da TLO. Ma in realtà, è più paragonabile all'apprendimento umano di quanto si possa pensare.

L

L'evoluzione dell'IA

L'intelligenza artificiale esiste da molti anni. In precedenza, tuttavia, abbiamo visto dominare l ''IA stretta'. Quel tipo fornisce applicazioni altamente specializzate; pensa che l'IA che trovi il percorso aiuti un NPC ad attraversare un ambiente di gioco. Poi viene l ''intelligenza artificiale generale', come AlphaStar, che può imparare dall'esperienza, far evolvere le proprie capacità e prendere decisioni. In un lontano futuro passeremo alla 'super AI', che supererà notevolmente l'intelligenza e le capacità umane. Potrebbe o no essere quando arriverà la rivolta dei robot.

    Quei 200 anni includono tuttoogni versionedi AlphaStar ha imparato a suonare da solo. Allo stesso modo, un giocatore di StarCraft II con 500 ore di gioco alle spalle eredita anche l'apprendimento collettivo dei giocatori che lo hanno preceduto e di quelli con cui hanno combattuto. Siamo tutti più della nostra esperienza; centinaia di anni in più.

    Indipendentemente da ciò, era ora di raccogliere la sfida. MaNa è sia un talento che un giocatore fiducioso concentrato sui Protoss. Sicuramente ora AlphaStar incontrerebbe la sua partita?

    Dopo cinque sconfitte consecutive per mano di AlphaStar, MaNa sembra essere in parti uguali esasperato, deliziato e affascinato. Come TLO, è stato chiaramente colto di sorpresa. Sebbene AlphaStar segua le regole del gioco alla lettera, semplicemente non rispetterà le strategie di gioco stabilite che i giocatori di StarCraft II hanno sviluppato collettivamente.

    Conversazione in tempo reale:Il migliori giochi RTS su PC

    MaNa, almeno, ottiene una grazia salvifica per se stesso, così come per il rispetto pubblico delle abilità di eSport e forse dell'umanità in generale. DeepMind ospita una partita dal vivo in studio, trasmette in streaming le verruche e tutto il resto. Ed emerge che questa è la prima partita contro un professionista in cui l'IA di DeepMind è stata bloccata per utilizzare la videocamera del giocatore. AlphaStar non vede il gioco, in quanto tale, ma in precedenza è stato in grado di comprendere un'intera area di partita, piuttosto che sperimentarla attraverso una visuale della telecamera.

    Questa volta, MaNa vince ed è chiaramente tremendamente sollevata.

    Con le telecamere spente c'è un senso collettivo di illuminazione nello studio temporaneo di DeepMind. AlphaStar potrebbe aver perso la sua ultima battaglia, ma un punteggio finale di 11-1 a favore dell'IA ha lasciato le menti sconvolte. E i giocatori professionisti si sentono ottimisticamente riflessivi.

    Forse gli esseri umani possono apprendere nuovi approcci dall'intelligenza artificiale, proprio come apprende osservando gli umani

    TLO ci dice che MaNa ha già preso una tattica che ha visto schierare AlphaStar e l'ha usata nei giochi del mondo reale. Se AlphaStar può continuare a cambiare il suo stile di gioco in modo imprevedibile, forse gli esseri umani possono apprendere nuovi approcci da esso, proprio come l'IA impara guardando gli umani. Potremmo vedere nuove teorie dirompenti sui giochi emergere negli eSport competitivi che non erano stati originariamente concepiti da organismi biologici.

    Nel frattempo, il team di DeepMind sta chiacchierando con entusiasmo sulle implicazioni di giocatori di intelligenza artificiale altamente capaci sullo sviluppo dei giochi. In definitiva, potrebbero sperare di vedere la loro tecnologia migliorare le catene di approvvigionamento globali, i soccorsi in caso di catastrofi e il lavoro degli operatori sanitari, ma per ora l'idea di giocare con IA a livello umano ha ispirato tutti. Cosa potrebbe significare AlphaStar per i test di gioco? Le sue capacità potrebbero non solo valutare la validità del design di un determinato gioco, ma addirittura alimentare il processo creativo? Potrebbe l'IA riuscire a creare giochi perfettamente bilanciati, liberi da interferenze umane?

    Spostati:Cannon correre il migliori giochi di strategia su PC

    Forse, riflette TLO. Ma sottolinea che un gioco perfettamente bilanciato potrebbe non essere intrinsecamente un buon gioco. Dopotutto, sono le piccole imperfezioni nel bilanciamento che hanno permesso ai giocatori di StarCraft II di costruire una così densa libreria di teoria dei giochi attorno al loro amato RTS. Ecco da dove viene la capacità di estro individuale e di drammatiche svolte del destino.

    L'intelligenza artificiale potrebbe già essere in grado di migliorarci, ma ciò non significa che la perfezione sia perfetta per i giochi.