Depois do xadrez e antes de nossos deliciosos cérebros, a IA está chegando para jogos de estratégia social - e está ganhando
Desde que o computador de xadrez Deep Blue derrotou o campeão mundial de xadrez Garry Kasparov em 1997, a inteligência artificial manteve um crescente influência sobre os seres humanos em um punhado de jogos 'adversários'-aqueles em que a interação humana desempenha um papel limitado. Agora, no entanto, um grupo de pesquisadores revelou uma nova IA que está tentando expandir o pool de jogos em que um computador pode vencê-lo.
Em um artigo (abre no novo guia) publicado nesta semana, os pesquisadores revelaram Cícero, uma IA treinada para ganhar jogos de diplomacia, um jogo de tabuleiro de sete jogadores no qual cada turno, todos os jogadores se envolvem em [...] formato livre diálogo com os outros durante um período de negociação antes de tomar uma ação. Essa fase de discussão é o que diferencia os esforços de Cícero de outras IA.
O artigo afirma que quase todos os avanços anteriores da IA estiveram nos jogos de dois jogadores de soma zero, nos quais ganhando vantagem para si mesmo coloca o outro jogador em desvantagem direta. Nesses jogos, Starcraft, Go e Poker-a IA pode aprender a estratégia ideal jogando contra si mesmo em um padrão conhecido como 'auto-jogador'. Eventualmente, ele terá uma abordagem que não pode ser espancada em um jogo equilibrado. Nesses exemplos, a complexidade do jogo em si não é importante; O que importa é que a comunicação não é um mecânico de jogo central e que cada ação se esforça para impedir outro jogador em seu objetivo.
Isso não é verdade para a diplomacia, um jogo em que a conversa entre os jogadores é importante (se não totalmente crucial) e no qual obter um ganho não prejudica necessariamente um oponente. Aqui, o auto-jogo produziu linguagem ininterpretável. Esse foi um grande obstáculo a ser superado, pois o anonimato foi fundamental para um experimento justo. A comunicação entre os jogadores teve que ser fundamentada no estado do jogo, ou eventos que já haviam ocorrido, e se Cícero escorregasse, a probabilidade era que isso seria descoberto devido à sua incapacidade de explicar seu erro.
Ainda mais importante, no entanto, foi a capacidade de construir confiança com colegas jogadores. Teoricamente, esse conceito seria estranho a Cícero, mas para ter sucesso, precisaria estabelecer uma capacidade de raciocinar sobre as crenças, objetivos e intenções dos outros, bem como uma capacidade de persuadir e construir relacionamentos através do diálogo.
Para estabelecer Cicero, os pesquisadores fizeram um conjunto de dados de mais de 40.000 jogos de diplomacia orientados a diálogos a partir de uma versão on-line do jogo. Um modelo de diálogo básico foi treinado nos logs de bate-papo da diplomacia e depois treinado para prever mensagens com base em uma matriz de dados do jogo. Eventualmente, Cícero foi treinado para explorar as informações em uma mensagem ao decidir sobre sua próxima ação, além de raciocinar o que outros jogadores podem estar tentando fazer.
Eventualmente, Cícero foi inserido anonimamente em uma liga on-line que aconteceu de agosto a outubro de 2022. Jogou em 40 jogos, classificando-se entre os 10% melhores daqueles que jogaram mais de uma vez, e ficando em segundo dos 19 jogadores que jogaram mais do que cinco jogos. No geral, Cícero foi o vencedor do torneio, com uma pontuação média mais do que o dobro de alguns de seus 82 adversários.
Pode não ter sido uma aniquilação completa, mas foi um esforço vencedor do torneio para uma IA lançando algumas bases significativas para esforços futuros semelhantes. Por enquanto, pode ser limitado à diplomacia, mas me impressiona que uma tecnologia semelhante a Cícero poderia um dia chegar a jogos como colonos de Catan, ou mesmo videogames de dedução social como a cidade de Salem ou entre nós. Agora seria sus.
Comentários
Enviar um comentário