
Autoprogrammandosi, Alpha Go Zero è riuscito ad avere la meglio sul suo predecessore Alpha Go, che pure in passato si era fatto onore, battendo in un torneo il campione di Go, Lee Sedol. Era stato il risultato di un addestramento nel quale aveva osservato e memorizzato milioni di mosse di giocatori umani e ‘messo in pratica’ quello che aveva appreso correggendo i suoi errori autonomamente.
AlphaGo Zero invece impara esclusivamente dall’esperienza che acquisisce giocando, analizzando le possibili mosse e memorizzando le strategie di gioco vincenti per ogni situazione. E’ stato un apprendimento intensivo, durante il quale in pochi giorni il programma ha giocato in pochi giorni quasi cinque milioni di partite contro se stesso. Forte di questa esperienza, è riuscito a battere l’uomo.
