Note publique d'information : Cette thèse propose une approche évolutionnaire de la robotique autonome à mi-chemin
entre l'architecture de subsomption de Brooks, basée sur une conception réaliste et
modulaire d'un contrôleur de robot, et les approches purement boîte moire de la robotique
évolutionnaire. Toutes ces approches passent en effet difficilement à l'échelle lorsque
avec la complexité du problème.L'approche des ``contrôleurs symboliques'' utilise
comme sorties du contrôleur des comportements déterministes de haut niveau, comme
``aller tout droit'', ``tourner à gauche''. L'étape suivante est l'approche par "superviseurs",
dans laquelle le contrôleur prescrit lequel des comportements présents dans une librairie
sera utilisé -- les-dits comportements pouvant être eux-même le résultat d'évolutions
antérieures (comme ``explorer'', ``aller vers la lumière'',...). Cette approche a
été validée expérimentalement dans une experience d'exploration avec recharge d'énergie.Nous
nous sommes intéréssés dans un second axe de recherche à l'apprentissage pendant la
vie du robot. L'architecture auto-teaching, proposée par Nolfi et Parisi, a été testée
en détail, et des défauts patents de ses propriétés de généralisation ont été mis
en évidence. L'architecture baptisée Action, Anticipation, Adaptation (AAA) a été
créée pour pallier ces défauts : elle utilise les erreurs sur la prédiction des futures
sensations du robot pour modifier en ligne les poids du contrôleur.Malgré certaines
divergences de comportements en généralisation, l'étude de cette architecture a révélé
quelques capacités d'adaptation. Les résultats obtenus suite à la modification de
certains paramètres montrent des potentialités intéressantes.
Note publique d'information : In this thesis, we propose some original approaches to autonomous robotics tha are
somehow intermediate between Brooks'subsumption architecture and the pure black-box
Evolutionary Robotics approach. Both those approaches badly scale up with the complexity
of the task of the robot.The "symbolic controllers" approach uses some high level
behaviors as output of the controller (e.g. move forward, turn left, ...). The following
step is that of the "supervisors", where the controller simply chooses between different
possible behaviors from a library of behaviors that can themselves be the result of
previous evolutions (e.g. explore, go to the light, ...). This approach is then validate
on a homing experiment with battery recharge.Finally, we studied the coupling between
evolution and life-time learning for the robot. The "auto-teaching" architecture,
proposed by Nolfi and Parisi, has been thoroughly tested, and some clear defects of
its generalization properties have been shown. The AAA architecture (Action, Anticipation
Adaptation) was designed to remedy those defects: it uses the errors made by the anticipatory
part of the controller compared to its actual sensations to on-line modify the weights
of the controller.Even though some long-term weaknesses still remain, this architecture
showed some small adaptation capabilities, and some prmosing results were obtained
after tuning some parameters of the model.