11 September 2006
Application du Reinforcement Learning à un jeu de Markov de type évasion-poursuite - Where is Ploum ?
by fredbird & 1 otherCe mémoire étudie le problème évasion-poursuite dans le cas d'un "Markov Decision Process" et dans le cas d'un jeu de Markov. Le problème est ici symbolisé par un ou plusieurs chats cherchant à attraper une souris dans un espace discret torique. La méthode de "Q-Learning" pour résoudre ce problème de "Reinforcement Learning" est étudiée. Il est aussi nécessaire de prévoir une coopération entre les chats afin d'atteindre l'objectif. Une méthode de coopération dite "agent et sous-agents" est développée et testée.
L'implémentation en Python d'un framework généraliste typique pour ce genre de problème est ensuite décrite en détails avec les résultats obtenus pour la méthode de coopération proposée.
09 September 2006
BAsCET - Wikipédia
by fredbird (via)BAsCET, acronyme de Blackboard, Agents, Concepts, Exemples et Température, est une architecture d'intelligence artificielle générale fortement inspirée de celle de Copycat.
28 July 2006
RobotJabberFR - JabberFR
by fredbird & 1 other (via)Projet de Robot multifonction pour la communauté JabberFR
26 July 2006
IA, internet et assistants personnels
by fredbird & 3 others, 2 commentsUn bot, c'est à dire un programme d'intelligence articielle, accèdera pour vous à toutes ces interfaces, suite à des demandes effectuées en language naturel via un protocole de messagerie instantanée (standard bien sur, c'est à dire jabber). Cet assistant personnel aura accès via le web à tous vos contenus et services, et pourra chercher à votre place, reserver des billets, verifier votre disponibilité dans votre agenda, filtrer vos emails, vous avertir d'un contenu interessant dans vos flux de syndication, d'une attaque de spam sur votre blog.
1
(4 marks)