L'essaim de particules vu comme un système dynamique :  
convergence et choix des paramètres
 
Christian Trelea
UMR Génie et Microbiologie des Procédés Alimentaires
INA P-G, BP 01, 78850 Thiverval-Grignon
 trelea@grignon.inra.fr
Les utilisateurs de l'algorithme d'optimisation par essaim de particules (OEP) savent bien que le choix des paramètres a une influence directe sur les performances. Dans certains cas les particules convergent prématurément vers un point non optimal, dans d'autres ne convergent jamais, ou l'essaim tend à se disperser de plus en plus. Des heuristiques ont été proposées dans la littérature pour limiter ce phénomène, par exemple en limitant la vitesse maximale ou en remettant la vitesse à zéro dès que la particule a tendance à sortir du domaine de recherche fixé. L'analyse mathématique rigoureuse des propriétés de l'essaim est complexe et n'a été réalisée pour l'instant que pour la version déterministe de l'algorithme, rarement utilisée en pratique.
Un éclairage intéressant est apporté en assimilant l'essaim à un système dynamique, les positions et les vitesses des particules constituant l'état du système. Pour l'essaim déterministe, la théorie des systèmes dynamiques permet de construire facilement dans l'espace des paramètres des cartes bidimensionnelles, où apparaissent le domaine de convergence et certains domaines de comportement dynamique des particules (mouvement asymptotique, oscillations harmoniques, zigzags). Pour l'essaim stochastique, ces cartes restent valables qualitativement et donnent des indications sur le choix des paramètres en fonction du comportement désiré de l'essaim.
Des essais d'optimisation ont été réalisés avec cinq fonctions de test, trois tailles de l'essaim et deux jeux de paramètres. Les résultats sont quantifiés en fonction du nombre attendu d'évaluations de la fonction de coût pour atteindre un objectif fixé, tiré de la littérature. Le nombre attendu d'évaluations de la fonction de coût prend en compte la taille de l'essaim, le nombre d'itérations et la probabilité d'atteinte de l'objectif. Il apparaît qu'une taille de l'essaim plus grande et un jeu de paramètres à convergence plus lente favorise l'exploration du domaine de recherche, au détriment de l'exploitation des solutions candidates prometteuses. La probabilité de converger vers un optimum local est plus faible mais la localisation exacte d'une bonne solution plus lente. Inversement, un nombre de particules réduit et un jeu de paramètres à convergence rapide favorise l'exploitation au détriment de l'exploration, avec un nombre d'évaluations de la fonction de coût par essai plus réduit, mais un risque plus élevé d'être piégé dans un optimum local. Finalement, en termes de nombre attendu d'évaluations, le meilleur choix des paramètres semble dépendre de la forme de la fonction de coût : présence d'optima locaux et courbure générale vers l'optimum global, capable de guider l'optimisation à grande échelle. Un paramètre important, qui n'a pas été exploré dans cette étude, est la topologie de l'essaim.
Les cartes de convergence dans l'espace des paramètres permettent donc de guider les décisions de l'utilisateur face au comportement observé de l'essaim pour un problème d'optimisation donné. L'analyse rigoureuse de la convergence de l'essaim stochastique, ainsi que la détermination directe, sans tâtonnements, du jeu de paramètres le plus approprié pour un problème donné, restent des questions ouvertes.