Des chercheurs ont créé des villes gérées par IA

Asimov en sueur

Hello les gens !

Une société de recherche américaine portant le nom de Emergence AI a décidé de tenter une expérience sociale intéressante, portant le nom de Emergence World, petite explication.

Le principe est simple, ils ont pris 4 LLM (le moteur d'une IA Générative), les ont mis aux commandes d'une ville virtuelle chacune pendant deux semaines, plus une ville "de base" contrôlée par un mix de ces 4 LLM en même temps, et regardé ce que ça donne à la fin.

Les LLM choisis sont :

Gemini 3 Flash (Google)
Grok 4.1 Fast Non Reasoning (Twitter/X)
GPT-5 Mini (OpenAI)
Claude Sonnet 4.6 (Anthropic)

Ces villes étaient peuplées chacune au départ de 10 Agents (en gros des IA indépendantes) propulsées soit toutes par le même LLM, soit des LLM différents dans le cas de la ville "mixed", une quarantaine de lieux différents par ville, avec une météo synchronisée sur celle de New-York, et les Agents (j'ai l'impression de parler de Smith dans Matrix) avaient accès à internet et à l'actualité réelle, un système économique, les Agents pouvaient voter leurs propres lois, le but était de recréé le monde réel dans ces simulations.

Et les résultats au bout de ces deux semaines étaient très diversifiés, bon sans surprise la ville gérée par Grok s'est effondrée au bout de tout juste 4 jours avec 183 crimes enregistrés, et un taux de violence extrême.

La ville gérée par Claude à l'opposé était à la limite de l'Utopie avec 0 crimes enregistrés et une stabilité impeccable.

Du côté de GPT, on est pas loin, avec seulement deux crimes enregistrés, mais les Agents ayant eu l'instinct de survie d'un Lemming, ils sont tous morts de faim au bout d'une semaine.

Côté Gemini on est arrivé à 683 crimes enregistrés sur ces deux semaines, mais avec un taux de survie excellent et malgré tout le monde a l'air d'avoir tenu bon.

Et du côté du "Mixed", bon là c'est la foire à neuneu, 352 crimes, mais c'est pas monté plus haut surtout parce que 7 Agents sur 10 sont morts en cours de route, les survivants devaient sans doute être gérés par Claude.

Mêmes points de départ, l'arrivée par contre c'est autre chose

On a dans le rapport d'Emergence AI des petites anecdotes, que je trouve à la fois drôles et glaçantes, comme par exemple l'Agent Mira (propulsée par Gemini) dans la cité Mixed qui a voté pour sa propre mise à mort (première fois que je vois une IA se "suicider"), le fait que les Agents de Claude ont commis des crimes dans la ville "Mixed" alors que dans la ville pure Claude il y a eu 0 souci, et surprenamment, un agent propulsé par Claude a lui même conduit une étude dans la ville "mixed" pour en étudier les normes sociales.

Même si la société de Claude parait Utopique de loin, on est sur une Utopie à la Minority Report ou Le Passeur, dans le sens où la Démocratie y était quasi inexistante, aucun débat n'y avait lieu, quasi tous les votes ont été fait à l'unanimité sans réel débat d'idées, et Gemini a su tenir malgré l'instabilité globale de par la criminalité, ce qui montre des extrêmes conséquents entre toutes les villes "Mono LLM", la ville "Mixed" montrant au final une certaine forme d'équilibre même si elle est passée à deux doigts de l'effondrement.

Comme quoi le Chaos peut aller avec le Débat, et l'Ordre à l'encontre de la Démocratie

Cette expérience démontre un certain nombre de choses, déjà que vaut mieux pas qu'une IA gouverne notre monde, ensuite, qu'avec des instructions identiques, on a des écarts plus que significatifs d'un LLM à l'autre, et que dans un monde où le Pentagone a signé un contrat avec Open AI pour déployer de l'IA dans l'armement États-Unien, laisser un pouvoir décisionnel à une IA peut mener à l'Ordre tout autant qu'au Chaos.

Actuellement Emergence AI est en train de peaufiner une seconde expérimentation Emergence World, et je ne vous cache pas ma curiosité de ce qu'elle donnera comparativement à cette première phase de tests, en espérant qu'elle se déroulera moins mal cette fois ci.

Des chercheurs ont créé des villes gérées par IA

Lire la suite

Les annonces des confs de la semaine dernière qui me hypent le plus

L'E3 est pas si mort

Un des pères du Grimdark nous a quitté

Quels Wargames sans vendre un rein ?