rapport de recherche rédigé dans le cadre de mon DÉA « Communication Homme-Machine & Ingénierie de l'Enseignement ».
Après un bref rappel historique, je présente la situation actuelle de l'intelligence artificielle dans les jeux et les problématiques qui y sont liées.
J'ouvre alors sur des perspectives d'avenir.
4. Chapitre 1
Des jeux intelligents ?
1.1 Historique
Au d´but ´tait l’informaticien. Et cet informaticien, venant du monde des
e e
math´matiques, se mit ` rˆver. Rˆver que ces nouveaux ordinateurs, capable
e a e e
d’effectuer plusieurs milliers d’op´rations par secondes, seraient un jour en
e
mesure de r´soudre des probl`mes complexes. Un autre de ses espoirs ´tait
e e e
de donner vie ` la machine, ou tout du moins l’intelligence dans un premier
a
temps, cela lui suffirait largement.
Au fur et ` mesure que les ann´es passaient, que les ordinateurs gagnaient
a e
en puissance, que les algorithmes s’am´lioraient et que la connaissance glo-
e
bale du domaine s’accroissait, les probl`mes abord´s devinrent de plus en
e e
plus complexes. D´j`, le morpion laissait la place aux ´checs, aux dames et
ea e
au go[1]. Des voyageurs de commerce parcouraient inlassablement les routes
a
` la recherche d’un chemin optimal sur des cartes colori´es au plus juste.
e
On assistait ` la d´finition de cat´gories de probl`mes, et ` l’´mergence de
a e e e a e
nouvelles approches. Cela se passait des ann´es 60 ` 90. De l’apparition des
e a
premiers ordinateurs dans les universit´s jusqu’au d´barquement massif de
e e
l’informatique individuelle.
Lorsque John MacCarthy affirmait que ”toute activit´ intellectuelle peut
e
ˆtre d´crite avec suffisamment de pr´cision pour ˆtre simul´e par une ma-
e e e e e
chine”, il ne songeait probablement pas aux jeux actuels sur ordinateur.
Depuis une dizaine d’ann´es, les jeux informatiques ne se contentent plus de
e
` oe
reproduire des principes existants, mais en inventent d’autres. A cˆt´ des
3
5. jeux traditionnels comme les ´checs se trouvent les wargames dont les figu-
e
rines jadis de plombs s’animent d´sormais au son du clairon virtuel, mais
e
aussi des simulations de courses de v´hicules ou des immersions ` la premi`re
e a e
personne dans un univers tridimensionnel rempli d’adversaires hostiles.
1.2 Attraits de l’intelligence artificielle
Les principaux avantages d’un adversaire informatique sont qu’il est tou-
jours disponible et d’humeur ´gale, mˆme quand il perd. D’autres qualit´
e e e
sont sa capacit´ d’adaptation de niveau, sa logique et sa facult´ ` suivre
e e a
des raisonnements pr´d´finis. Cela permet d’essayer des variantes ou encore
e e
d’affiner des strat´gies en les reprenant ` un certain point. Au-del` de ces
e a a
´l´ments, des logiciels sachant jouer sont de nos jours consid´r´s comme des
ee ee
adversaires ` part enti`re. Il n’est pas rare de voir des titres de rang at-
a e
tribu´s ` des programmes, les joueurs pouvant ainsi se comparer ` eux. Cet
e a a
aspect culturel est entr´ dans le monde du jeu depuis de nombreuses ann´es
e e
et devrait y rester. Quel joueur d’´checs pourrait aujourd’hui affirmer que
e
Deeper Blue n’est pas un vrai joueur d’´checs, capable non seulement d’ana-
e
lyse, mais ´galement de prise de d´cision strat´gique et d’improvisation ? La
e e e
complexit´ de son raisonnement est devenue telle que ses d´veloppeurs ne
e e
sont plus capables de pr´dire avec certitude ses actions ` venir, mais juste
e a
de donner des indications sur son travail en cours. Trop complexe pour ˆtre
e
rang´ dans la cat´gorie des programmes pousseurs de pions, mais pas encore
e e
assez pour pr´tendre pouvoir se passer de ses concepteurs afin de continuer
e
a
` s’am´liorer. Si son cas n’est pas repr´sentatif de l’intelligence artificielle
e e
en elle-mˆme, il en est certainement un symbole fort.
e
Un int´rˆt indirect de l’intelligence artificielle se cache dans la maniabilit´
ee e
d’un jeu. Si l’ordinateur arriver ` rep´rer des habitudes chez un joueur, il
a e
peut lui proposer de prendre en charge lui-mˆme ces tˆches, afin que l’ˆtre
e a e
humain puisse se consacrer ` autre chose. Par exemple, en s´lectionnant un
a e
groupe d’unit´s, si le joueur en laisse une de cˆt´ car manifestement son
e oe
action ´tait trop malhabile, l’ordinateur pourra juger s’il est pertinent d’in-
e
clure ou non cette unit´. Cette cat´gorie, plus orient´e sur les interactions
e e e
homme-machine que sur la r´flexion pure, connaˆ actuellement une forte
e ıt
croissance. Les jeux ´tant de plus en plus riches, il devient n´cessaire de
e e
4
6. fournir aux joueurs des outils en ad´quations avec la complexit´ des inter-
e e
actions disponibles.
1.3 Quelques rep`res
e
Une poign´e de grands jeux, connus de tous et faisant l’objet d’´tudes
e e
depuis de nombreuses ann´es, font office d’´chelle de comparaison dans le
e e
domaine du jeu sur ordinateur. Voici les principaux d’entre eux[2]. Chacun
caract´rise une fa¸on d’aborder la question du jeu, mais quasiment tous
e c
emploient la mˆme m´thode, la force brute. Des approches diff´rentes comme
e e e
la reconnaissance de formes pour le Go ou les r´seaux de neurones pour
e
othello sont parfois utilis´s, mais cette approche reste tr`s minoritaire malgr´
e e e
les succ`s rencontr´s.
e e
Nb possibilit´s
e Jeu Nb emplacements Nb pi`ces
e
1012 Aw´l´
ee 12 trous 48 graines
1032 Dames 100 cases 2 x 20 pions noirs et blancs
1060 Othello 64 cases 64 pions bicolores
10128 ´
Echecs 64 cases 2 x 16 pi`ces noires et blanches
e
10172 Go 361 points 180 pierres blanches et 181 pierres noires
´
Etat actuel :
* Bridge : les programmes ne d´passent pas le niveau d’un d´butant
e e
* Aw´l´ : 889 063 398 406 parties possibles, jeu maˆ e
ee ıtris´
* Dames : les IA ont d´pass´ les champions humains
e e
* Othello : victoire sans appel de l’ordinateur en 1997
´
* Echecs : uniquement une poign´e d’humaisn arrivent ` tenir tˆte aux
e a e
ordinateurs
* Go : l’ordinateur a le niveau d’un faible joueur en club
5
7. Chapitre 2
Les modes fondamentaux
2.1 Tours de jeu
Nous distinguerons deux grands modes de fonctionnement des jeux : le
tour par tour et le continu, souvent nomm´ ` tord ”temps r´el”.
ea e
2.1.1 Tour par tour
Nous ´voluons ici dans le domaine des jeux dit ”classiques”. Morpion,
e
´checs, dames, go ou backgammon, ces jeux ont en commun plusieurs ca-
e
ract´ristiques[3] : les joueurs jouent ` tour de rˆle, ` chaque tour ils choi-
e a o a
sissent une action parmi un nombre ferm´ et petit de possibilit´s et on peut
e e
pr´dire l’effet d’une action sur le jeu. Ce type de fonctionnement laisse un
e
temps de r´flexion ´lev´ ` l’ordinateur. Celui-ci peut en effet exploiter non
e e ea
seulement le temps qui lui est imparti durant son tour, mais ´galement du-
e
rant celui de son (ou ses) adversaire(s). De plus, la gestion du jeu ` propre-
a
ment dit est souvent extrˆmement simple, requ´rant donc peu de ressources.
e e
L’essentiel des calculs se porte par cons´quent sur la r´flexion en elle-mˆme.
e e e
Traditionnellement, les probl`mes pos´s dans cette cat´gorie de jeu sont
e e e
r´solus par la force brute. La repr´sentation des situations passant par des
e e
arbres, on se retrouve ` employer des algorithmes bien connus, sur lesquels
a
sont apport´es des am´liorations mineures. Les heuristiques[4] sont les fers
e e
de lance de ce type de r´solution car intervenant aux endroits critiques de
e
ces algorithmes, ` savoir comment juger quelles branches de l’arbre il est
a
int´ressant de d´velopper.
e e
6
8. Les probl`mes rencontr´s dans ces cas sont principalement la taille des
e e
arbres ` explorer
a 1 . Plus la fonction d’´valuation est ´labor´e, plus il faudra
e e e
de temps pour la calculer, ce qui limite la profondeur de l’arbre ´tudi´. En
e e
revanche, une fonction simple donnera une r´ponse rapide, mais potentiel-
e
lement d’une qualit´ faible par rapport ` ce qui aurait pu ˆtre trouv´. Tout
e a e e
l’art des heuristiques repose sur le subtil compromis entre l’efficacit´ et la
e
vitesse.
2.1.2 D´roulement continu (temps r´el)
e e
Les jeux ` d´roulement continu constituent une gageure pour l’ordinateur.
a e
Non seulement doit-il g´rer le jeu en lui-mˆme, planifier ses actions et tenir
e e
compte des agissements des autres participants (humains ou informatiques),
mais ´galement le faire rapidement, et de fa¸on continue. On imagine mal
e c
les joueurs d’une ´quipe de football s’arrˆtant toutes les 3 minutes afin de
e e
d´cider des actions ` suivre. Certain jeux n’existent que par cette notion de
e a
continuit´, afin de mettre ` l’´preuve les r´flexes et capacit´s de raisonnement
e a e e e
instantan´ de l’ˆtre humain.
e e
Dans cette approche, la question de la r´activit´ est primordiale. Ne pas
e e
agir est souvent aussi lourd de cons´quences que de mal agir. Les m´thodes
e e
de prise de d´cision ont donc une tr`s forte contrainte temporelle. Ainsi, dans
e e
les jeux d’´checs on pourra s’astreindre de rendre une r´ponse en un temps
e e
donn´. L’accent est par cons´quent mis sur la segmentation d’un probl`me
e e e
en un ensemble pouvant ˆtre traiter plus simplement, et rapidement. Une
e
pratique courante est d’affecter un facteur de priorit´ ` chacune de ces sous-
ea
tˆches, et d’effectuer une juste r´partition du temps de calcul disponible
a e
selon des crit`res relatifs ` la situation actuelle dans le jeu.
e a
Ici aussi, les heuristiques jouent un rˆle primordial dans la d´termination
o e
des actions ` effectuer en priorit´. On les retrouve ` diff´rents niveaux,
a e a e
mais celles suscitant actuellement le plus d’int´rˆt sont celles en haut de la
ee
pyramide de d´cision, car ce sont elles qui conditionnent la strat´gie globale
e e
de l’ordinateur. Mieux vaut-il attaquer que se d´fendre ? Sur quelle partie
e
1
Un joueur d’´checs a en moyenne 35 possibilit´s de jeu ` chaque coup, une partie
e e a
tenant habituellement lieu sur 30 demi-coups, la taille de l’espace d’´tats est de l’ordre de
e
30
35
7
9. du jeu dois-je fournir un effort ? Les meilleurs techniques de jeu ne servent
a
` rien au niveau local si elles ne sont pas d´cid´es d’un point de vue global.
e e
2.2 Raisonnements
Il existe 3 grandes fa¸on de raisonner pour l’ordinateur[5].
c
2.2.1 Algorithmique
La r´solution du probl`me est obtenue par la m´canisation. Il s’agit de
e e e
trouver une m´thode syst´matique conduisant au r´sultat. Tout le chemin
e e e
a
` parcourir est d´crit pas ` pas pour atteindre le r´sultat d´sir´. Il s’agit
e a e e e
l` d’une proc´dure d’automate totalement planifi´e et pr´sent´e selon une
a e e e e
s´quence tr`s pr´cise ` respecter. Il faut ´tudier compl`tement le probl`me
e e e a e e e
et codifier exhaustivement la solution. Il est n´cessaire de bien d´cortiquer
e e
celle-ci pour la mettre dans un automate rapide qui va la d´rouler beaucoup
e
plus rapidement que le cerveau. On peut y ajouter un peu de r´flexion et
e
optimiser le calcul, mais cela restera une proc´dure imagin´e par l’homme.
e e
Les jeux mettant en oeuvre cette m´thode sont les plus courants. En effet,
e
dans la grande majorit´ des probl`mes, la d´finition d’un algorithme suffit
e e e
a
` obtenir une r´ponse ` une question donn´e. Cependant, on se prive de la
e a e
capacit´ d’apprentissage.
e
2.2.2 Expertise
On effectue une m´canisation du raisonnement pour obtenir des d´ductions
e e
et des conclusions. Grˆce ` la connaissance du domaine, pr´alablement et
a a e
consciencieusement communiqu´e par un expert, on d´crit les r`gles ` suivre.
e e e a
Il s’agit ensuite de les enchaˆ ıner d’une fa¸on g´n´rale en employant les
c e e
r´sultats fournis au fur et ` mesure. Cela revient ` transcrire tout le savoir
e a a
et la maˆ ıtrise d’un expert d’un jeu pr´cis dans une base de connaissance,
e
puis de confronter le syst`me au probl`me.
e e
Cette m´thode est tr`s rarement employ´e pour des raisons de perfor-
e e e
mances. C’est un syst`me dont on ne sait pas pr´dire l’arrˆt, et dont les
e e e
´tapes interm´diaires sont insatisfaisantes. Il n´cessite une compr´hension
e e e e
8
10. aigu des m´canismes du jeu et n’est (pratiquement) pas capable d’apprendre
e
a
` partir de situations inconnues.
2.2.3 Neuronique
Le but de cette m´thode est l’apprentissage par la pratique, en tentant de
e
m´moriser les diff´rences entre les parties. Aucune expertise externe n’est
e e
apport´e, si ce n’est lors de la cr´ation du r´seau et par mim´tisme des op-
e e e e
posants. Un programme de s´lection r´compense les meilleures m´thodes et
e e e
´limine les plus faibles. Ce proc´d´ est gourmand en temps, et est g´n´ralement
e e e e e
r´alis´ en deux phases. La premi`re consiste ` laisser la machine apprendre
e e e a
et ` d´velopper sa propre logique de r´solution du probl`me. La 2`me est
a e e e e
l’exploitation proprement dite, o` l’on confronte la m´thode de la machine
u e
a
` la situation afin de la r´soudre.
e
Cette fa¸on d’aborder la r´solution de probl`me est consid´r´ comme la
c e e ee
plus ´l´gante et la plus efficace car l’ordinateur d´cide seul de la mani`re
ee e e
de r´soudre la situation qui lui est expos´, sans aide ext´rieur et en s’adap-
e e e
tant. Malheureusement, elle demeure fort difficile ` exploiter ` cause de la
a a
longueur d’apprentissage, et de la complexit´ inh´rente ` la gestion des neu-
e e a
rones.
9
11. Chapitre 3
Domaines concern´s
e
3.1 Adversaire informatique
Une fa¸on naturelle d’aborder la question des adversaires informatiques
c
est d’envisager la simulation des raisonnements humains. Or, les r´alisations
e
de ces dix derni`res ann´es ont montr´s que les performances n’´taient pas
e e e e
a
` la hauteur des esp´rances. Outre le fait d’ˆtre trop lourde et complexe
e e
a
` mettre en oeuvre pour ˆtre efficace, cette m´thode implique aussi une
e e
connaissance suffisante de l’intelligence humaine telle que nous l’employons
au quotidien. Cette voie est donc laiss´e de cˆt´ en faveur d’une approche
e oe
oppos´e, ` savoir cr´er une forme de raisonnement propre ` la machine.
e a e a
Une des questions revenant fr´quemment en avant est de savoir s’il est
e
souhaitable pour l’utilisateur de pouvoir diff´rencier un adversaire humain
e
d’un opposant informatique, en se basant uniquement sur ses r´actions dans
e
le jeu. On voit d´j` le test de Turing[6] poindre son nez ` l’horizon. Si l’on
ea a
interroge les principaux int´ress´s, ` savoir les joueurs eux-mˆmes, il ressort
e e a e
globalement que ceux-ci pr´f`rent affronter des adversaires ayant un compor-
ee
tement semblable ` celui-d’un humain plutˆt qu’un ”stupide programme”.
a o
Le crit`re de qualit´, fort subjectif au demeurant, semble ˆtre la capacit´
e e e e
d’un programme ` s’inspirer de comportement humain afin d’assurer une
a
bonne efficacit´. Mˆme si cela peut en r´alit´ impos´ une fa¸on de jouer
e e e e e c
plus faible ` l’ordinateur, car la strat´gie humaine n’est pas toujours la plus
a e
pertinente. Ainsi, l` o` l’ordinateur pourrait d´terminer que la m´thode ga-
a u e e
gnante est d’effectuer toujours le mˆme parcours entre diff´rents points du
e e
jeu afin de r´aliser des objectifs mineurs, le joueur humain emploiera un
e
10
12. autre comportement en argumentant que oui, peut-ˆtre que cette fa¸on de
e c
jouer est efficace en terme de victoire, mais elle ne l’est pas du point de vue
ludique.
Un individu humain joue principalement pour le plaisir[7], alors que l’or-
dinateur joue pour gagner. Il y a l` une diff´rence fondamentale entre nos
a e
deux protagonistes. ` ma connaissance, il n’existe pas de travaux actuels
a
prenant en compte l’aspect qu’un opposant informatique doit avant tout
distraire l’humain avant de lui opposer une r´sistance farouche.
e
3.2 Relations vis ` vis de l’environnement
a
La tendance actuelle dans le domaine des jeux sur ordinateur est l’agran-
dissement massif des zones exploitables. Les cartes deviennent de plus en
plus vastes, avec toujours plus de complexit´. Reliefs, moyens de d´placement,
e e
perspectives, ´l´ments ´volutifs, tout ceci contribue ` offrir ` l’utilisateur en-
ee e a a
core plus d’interactions, et donc d’amusement. L` o` les choses deviennent
a u
difficiles, c’est que notre ami l’ordinateur, lui, s’arrache les puces. Comment
tenir compte de tous ces param`tres[8] ? Quels sont les crit`res permettant
e e
de calculer le d´placement optimum de ses unit´s ? Et s’il doit en outre
e e
g´rer des groupes d’´l´ments aux caract´ristiques h´t´rog`nes (vitesse de
e ee e ee e
d´placement, puissance de feu pour forcer le passage, etc), il fini par ne plus
e
s’en sortir. Il est toutefois possible de d´composer une situation complexe
e
en plusieurs sous-probl`mes. Ainsi, le d´placement coordonn´ de plusieurs
e e e
groupes d’unit´ (niveau macro) pourra ˆtre g´r´ en employant une m´thode,
e e ee e
tandis que la gestion d’un groupe sera confi´ ` un autre, pour finir au niveau
ea
micro, l’unit´ en elle-mˆme, qui ne se d´placera que dans le cadre restreint
e e e
du groupe. Selon les cas, on peut employer algorithmes comme A* ou des
techniques multi-agents communicant via un blackboard. Mais cette derni`re e
m´thode est peu usit´e, car difficilement employable dans des logiciels ` la
e e a
dur´e de vie courte.
e
La capacit´ pour l’ordinateur ` tirer profit de l’environnement est aujour-
e a
d’hui un des ´l´ments cl´ en mati`re de strat´gie[9].Non seulement cela lui
ee e e e
permet de faire la diff´rence entre les bons et les mauvais endroits (”hum,
e
ceci est de la lave, et je sais que m’y immerger n’est pas une action souhai-
table pour ma survie”), mais permet ´galement d’associer des notes ` un
e a
11
13. emplacement (”je suis mort ici durant les 3 derni`res parties, donc je ne vais
e
pas retourner dans ce tunnel sans en savoir plus”)
Dans cette cat´gorie de probl´matique se trouve ´galement des cas plus
e e e
traditionnels, comme la question de d´terminer le chemin optimal entre 2
e
points. Aux difficult´ de la NP-completude s’ajoutent les param`tres ´voqu´s
e e e e
ci-dessus. Tout ce petit monde ´voluant naturellement constamment dans le
e
temps.
Il existe deux fa¸ons d’appr´hender la gestion du terrain dans un jeu
c e
sur ordinateur : l’approche g´n´rique consistant ` d´finir des m´canismes
e e a e e
abstraits de perception et d’analyse de cartes, et l’approche sp´cifique o`
e u
l’ordinateur se base sur des informations construites lors de la cr´ation de la
e
carte[10]. S’il est commun´ment admis que l’id´al semble ˆtre de d´velopper
e e e e
des solutions de haut niveau afin de pouvoir les r´employer partout, comme
e
le ferait un ˆtre humain, dans la pratique les d´veloppeurs ajoutent souvent
e e
aux cartes des m´tadonn´es relatives ` l’environnement. Comment atteindre
e e a
rapidement un point difficile, dans quelle zone se trouve tel objet, etc. La
simplification des calculs qui en r´sulte permet ` l’ordinateur de se consa-
e a
crer ` d’autres tˆches, permettant ainsi de ne pas s’engluer dans des d´tails
a a e
secondaires. l’inconv´nient de cette tactique est que si la carte est modifi´e
e e
apr la suite, ces m´tadonn´es risquent fort de devenir obsol`tes. La com-
e e e
plexit´ du d´veloppement est donc plus importante. La conception de cartes
e e
demandant ´norm´ment de temps, et n´cessitant diff´rents experts, on com-
e e e e
prend le besoin d’am´lioration de l’approche g´n´rique. Cependant, celle-ci
e e e
semble de nos jour encore loin d’ˆtre r´ellement exploitable.
e e
La majorit´ de ces probl`mes sont de nos jours peu trait´s, ou bien
e e e
na¨ıvement. Des pistes sont ´tudi´es du cˆt´ des syst`mes d’information
e e oe e
g´ographique pour en retirer de l’aide, mais les liaisons ne sont pas ´videntes.
e e
Le plus souvent, des heuristiques larges sont employ´es, avec des probabilit´s
e e
de succ`s fortement li´s ` un contexte pr´cis.
e e a e
3.3 Acquisition et analyse d’informations
La prise de position repose sur la connaissance d’informations. Elles peuvent
ˆtre per¸ues ou d´duites, compl`tes ou partielles, certaines, impr´cises voir
e c e e e
12
14. mˆme erron´es, mais toutes participent ` l’´laboration d’une repr´sentation
e e a e e
de la situation par l’ordinateur qui lui servira ` d´cider de ses prochaines
a e
actions.
Tout comme le joueur, l’ordinateur commence par rassembler des infor-
mations sur son environnement. L’ˆtre humain le fait de fa¸on intuitive et
e c
effectue ´norm´ment d’assomptions sur des implications de sens commun :
e e
les murs sont solides, le feu brˆle, une porte doit pouvoir s’ouvrir, etc. L’or-
u
dinateur, lui, part de z´ro. Le probl`me est donc de fournir ` l’ordinateur
e e a
ces renseignements, de les tester, de le remettre en cause et d’en apprendre
de nouveaux.
Une autre facette des connaissances que doit acqu´rir l’ordinateur est que
e
chaque joueur, humain ou informatique, influe sur l’environnement : une
porte que l’on a laiss´e ferm´e pourra ˆtre retrouv´e ouverte, un objet que
e e e e
l’on a laiss´ pourra avoir disparu. Ces connaissances ne sont pas fig´es, elles
e e
´voluent en fonction des ´v´nements. Par cons´quent, il faut trouver une
e e e e
m´thode pour attribuer un score de v´racit´ ` chaque information, avec un
e e ea
affaiblissement en fonction du temps : si on laisse de l’argent au milieu d’une
rue fr´quent´e au temps t, il sera tr`s probablement encore l` au temps t+1 ;
e e e a
mais ` t+1000, ce n’est plus aussi certain...
a
Il peut ˆtre judicieux de faire la distinction entre 2 types de connaissances.
e
Les premi`res sont celles du monde, fixes, universelles et absolue. Ce sont
e
par exemple la gravit´, le fait que la pierre est plus r´sistante que le bois, que
e e
l’on se noie dans l’eau, etc. Ces informations sont habituellement fournie par
le d´veloppeur, l’ordinateur n’ayant pas ici ` red´couvrir la roue, ce qui lui
e a e
permet de tenir tˆte ` l’humain. l’int´rˆt de ce type de connaissance r´side
e a ee e
dans leur g´n´ricit´. Si les ´l´ments ont un comportement identique d’un
e e e ee
terrain ` l’autre, voir d’un jeu ` l’autre, il est possible de d´finir des collec-
a a e
tions de connaissances pouvant servir de base ` de futurs d´veloppements.
a e
De plus, la d´finition commune permet d’assurer une coh´rence vis ` vis
e e a
du joueurs : dans un certain type de jeux, il est logique que des ´l´ments
ee
semblables adoptent des r´actions similaires face ` un stimulus r´p´t´.
e a e ee
Le second type d’information englobe le reste. Susceptibles d’´voluer, elles
e
devront ˆtre remise en question. L’ˆtre humain les per¸oit avec ses sens et les
e e c
13
15. traduit en sch´mas mentaux ; l’ordinateur, lui, n’a pas d’action particuli`res
e e
a
` effectuer. La position d’un ´l´ment, le niveau d’un autre, qu’importe, il
ee
lui suffit de consulter sa m´moire. Une situation inacceptable pour le joueur
e
humain qui se sent ici l´s´ car il ne peut pas savoir ce qui se trouve derri`re le
ee e
mur, lui. Cette question d’´thique est en fait souvent ignor´e afin d’am´liorer
e e e
les performances de l’ordinateur. Au lieu de passer de nombreux cycles de
calculs ` d´terminer ce que peux ”voir” un personnage contrˆl´ par l’ordi-
a e oe
nateur, il est plus rapide de prendre directement les informations dans le
r´f´rentiel et de les exploiter. Le temps ici gagn´ sera employ´ ` d’autres
ee e e a
tˆches.
a
Dans le cas o` l’on dispose des ressources informatiques n´cessaires ` la
u e a
r´solution de ces calculs de perceptions, on rentre dans une optique d’ap-
e
prentissage. L’ordinateur doit donc poss´der des capacit´s ` comparer des
e e a
´l´ments, ` reconnaˆ des sch´mas plus ou moins similaires et ` les associer.
ee a ıtre e a
Les r´seaux de neurones peuvent ici ˆtre employ´s, mais les contraintes de
e e e
r´activit´ font que souvent on leur pr´f`re des solutions plus rapides comme
e e ee
les classiques parcours d’arbres. Ces derniers font d’ailleurs des merveilles
dans la gestions de petits nombres d’´l´ments, ce qui tend ` d´montrer que
ee a e
dans de tr`s nombreux cas des heuristiques suffisent ` r´soudre des probl`mes
e a e e
semblant n´cessit´ de ”l’intelligence”.
e e
La plupart du temps, l’ordinateur se basera donc sur les informations du
monde pour prendre ses d´cision, et la petite partie d’apprentissage ne ser-
e
vira qu’` moduler l´g`rement ses d´cisions. Ce probl`me profite des avanc´es
a e e e e e
de l’intelligence artificielle en la mati`re, et trouve ici des domaines d’appli-
e
cations concrets.
La limitation de l’acquisition des connaissances dans le domaine du jeu
provient surtout du mat´riel, et non pas des m´thodes de calculs. D’avantage
e e
de puissance de calcul permettrait de r´aliser des progr`s sans remettre en
e e
question les m´thodes de raisonnement actuelles.
e
14
16. Chapitre 4
Projection dans l’avenir
4.1 Support mat´riel
e
Un des goulets d’´tranglement actuel en mati`re d’intelligence artificielle
e e
´tant la puissance de calcul disponible, on pourrait imaginer dans un futur
e
proche le d´veloppement de supports mat´riels d´di´s. Cette pratique a en
e e e e
effet permit aux technologies de l’imagerie de r´aliser des progr`s spectacu-
e e
laires il y a quelques ann´es grˆce ` des produits comme la 3Dfx1 .
e a a
Des supports tels que la NNPC-122 commencent ` apparaˆ
a ıtre, mais dans
des environnements sp´cialis´s. Je pense toutefois qu’il y a un avenir certain
e e
pour ces supports mat´riels. La sous-traitance des calculs r´p´titifs que sont
e e e
les parcours d’arbres ou les it´rations dans un r´seau de neurones pouvant
e e
ˆtre confi´ ` des processeurs sp´cialis´s, il serait ainsi possible d’am´liorer
e ea e e e
les capacit´s d’analyse du syst`me.
e e
Cependant, cela reviendrait ` figer des m´thodes de r´solutions, et les
a e e
jeux voulant exploiter ces supports devraient le faire avec des contraintes
immuables. Il y aurait donc un risque de perdre le cˆt´ ´volutif de cette
oe e
solution.
1
http://www.nvidia.com
2
http://www.modulusfe.com/nnpc12/default.asp
15
17. 4.2 Gestion de profils
Plusieurs jeux commencent ` int´grer la notion de profil d’utilisateur.
a e
Au fil ses parties, l’ordinateur en apprend de plus en plus sur celui-ci, lui
permettant d’adapter ainsi sa fa¸on d’agir pour toujours renouveler l’int´rˆt
c ee
du jeu. Plus l’utilisateur progresse, plus l’ordinateur est capable de soutenir
son niveau. Toutefois, un apprentissage est sp´cifique ` un jeu, pour un
e a
utilisateur donn´.
e
Il pourrait ˆtre int´ressant d’´tendre ce principe ` un ensemble de jeux,
e e e a
toujours pour un mˆme utilisateur. On aura donc un profil g´n´rique de lui
e e e
que pourraient interpr´ter diff´rents logiciels, afin de s’adapter d`s le d´but
e e e e
a
` ses caract´ristique. Un utilisateur mettant du temps ` progresser se verrait
e a
ainsi oppos´ d`s le d´but des adversaires informatiques adapt´s ` son niveau,
e e e e a
au lieu de se baser sur un mod`le relativement abstrait du joueur d´butant.
e e
Je vois apparaitre dans cette solution des questions d’´thiques : que se
e
passera-t’il si l’on essaye de d´duire les facult´s intellectuelles d’une per-
e e
sonne ` partir de ces informations ? Y’a-t’il des risques de d´rives possibles
a e
en extrapolant depuis une activit´ ludique, donc non productive, des capa-
e
cit´s de travail ? Mais si l’on tient compte de ces concid´rations, pourrait-on
e e
profiter de cette masse d’information afin d’accroˆ ıtre la connaissance sur
l’ˆtre humain ?
e
16
18. Chapitre 5
Conclusion
Edward Fredkin disait que l’intelligence, c’est d’avoir un probl`me et de
e
savoir le r´soudre
e 1 . S’il est vrai que d´sormais on comprend mieux les
e
probl´matiques qui se posent en mati`re de jeux sur ordinateurs, on sait
e e
´galement que l’intelligence artificielle n’est pas la panac´e que l’on croyait.
e e
Les m´thodes de r´solutions classiques que sont les algorithmes de par-
e e
cours de graphes montrent aujourd’hui qu’elles ne sont pas prˆtes de partir.
e
Et d’ailleurs, pourquoi le feraient-elles ? Elles s’acquittent parfaitement des
tˆches qui leur sont confi´es.
a e
Face ` la complexit´ croissante des jeux, la d´finition de cat´gories a per-
a e e e
mit la segmentation de probl`mes complexes en sous-ensemble de domaines
e
r´duits, ce qui a contribu´ ` la r´alisation d’approches plus fines en mati`res
e ea e e
de r´solution. Chaque cat´gories peut en effet ˆtre vue comme une appli-
e e e
cation concr`te des grandes probl´matiques d’intelligence artificielle. Re-
e e
cherche de parcours, prises de d´cision, apprentissage, tout est repris et ex-
e
ploit´. Les jeux commerciaux profitent tr`s rapidement des avanc´es des do-
e e e
maines, et en sont mˆme parfois les moteurs. Des logiciels comme Creatures 2
e
ou plus r´cemment Black and White 3 ont surpris bon nombre de joueurs
e
grˆce ` leurs r´seaux de neurones. Mais apr`s une phase de d´couverte,
a a e e e
le temps pour l’ˆtre d’humain d’apprendre comment la machine r´agissait,
e e
ces jeux ont rapidement d´clin´s ; l’homme s’adaptant en effet plus vite
e e
que la machine. Trop pauvres pour ˆtre r´ellement amusants, leur int´rˆt
e e ee
1
Sciences, 17 octobre 1980
2
de Creatures Labs
3
de Lionhead Studios
17
19. r´sidait surtout dans leur capacit´s ` apprendre de l’humain. Il faut peut-
e e a
ˆtre ´galement envisager le fait que le battage m´diatique autour d’eux a fini
e e e
par convaincre les joueurs qu’ils ´taient r´volutionnaires. Ils l’´taient sans
e e e
doute, mais pas dans une fa¸on qui soit perceptible par le grand publique.
c
De la mˆme fa¸on que les avions volent sans battre des ailes, les ordi-
e c
nateurs peuvent gagner sans suivre une logique humaine. Si DeeperBlue se
d´brouille mieux aux ´checs que 99.99% de la population humaine, cela fait
e e
de lui un joueur d’´checs, malgr´ qu’il soit fait de silice et non de carbone.
e e
Le pi`ge concisterait donc ` m´langer le but ` atteindre et la fa¸on d’y
e a e a c
parvenir. La question du dicernement entre ce qui n´cessite r´ellement de
e e
l’intelligence, et ce qui peut se r´soudre d’une mani`re algorithmique est par
e e
cons´quent cruciale ` mes yeux. Ce qui nous renvoit ` l’´ternelle question :
e a a e
au fond, qu’est-ce que l’intelligence, et une machine peut-elle l’ˆtre ? John
e
Searl a clairement statu´ que le cerveau est le si`ge de la pens´e et qu’il
e e e
peut-ˆtre totalement d´crit par des m´canismes chimiques et physiques[11],
e e e
donnant l’espoir au futur de l’intelligence artificielle forte.
Actuellement, il est difficile d’avoir du recul sur l’efficacit´ de l’intelligence
e
artificielle dans les jeux sur ordinateurs, car son apparition est encore trop
r´cente. Mais l’identification des probl`mes ` r´soudre ayant ´t´ ´tablie par
e e a e eee
la recherche depuis de nombreuses ann´es, la difficult´ r´side surtout dans
e e e
le fait d’employer ces technologies dans des logiciels grands publiques.
18
20. Bibliographie
[1] Daniel Crevier. `
A la recherche de l’intelligence artificielle.
Champs/Flammarion, 1999. Origine et histoire de l’intelligence arti-
ficielle.
[2] John H. Conway. L’´chec de l’intelligence artificielle. Sciences et vie,
e
d´cembre 2002.
e
[3] John H. Conway. On Numbers and Games. Academic Press, 1976.
[4] Levy and Bealjournal. Heuristic programming in artificial intelligence :
The first computer olympiad. 1989.
[5] G´rard Villemin. Intelligence artificielle. 2003. http://membres.lycos.
e
fr/villemingerard/Logique/IAintro.htm.
[6] A.M. Turing, C. Strachey, M.A. Bates, and B.V. Bowden. Digital com-
puters applied to games. In B.V. Bowden, editor, Faster Than Thought,
pages 286–310. Pitman, London, 1953.
[7] James P. Carse. Finite and Infinite Games. Ballantine Books, 1987.
R´flexions philosophiques sur les jeux et la vie en g´n´ral.
e e e
[8] B. Girard and G. Robert. Intelligence artificielle situ´e et jeux vid´o. In
e e
Actes de Conf´rence du IV`me colloque Jeunes Chercheurs en Science
e e
Cognitives (CJC4), pages 157–160. ISC Lyon, 2001.
[9] William van der Sterren. Terrain Reasoning for 3D Action Games.
Proceedings of the 2001 Game Developer Conference, 2001.
[10] J.M.P. van Waveren. The Quake 3 Arena Bot. PhD thesis, University of
technology, Delft, 2001. Th`se portant sur la conception d’un adversaire
e
informatique pour le jeu Quake 3.
[11] John R. Searle. Du cerveau au savoir. Hermann, 1985.
19