L'ANALYSE DE PARCIMONIE DE WAGNER

On trouvera un exposé de la méthode (et de son application à un bassin versant d'une rivière de Normandie, France) dans Masselot et al. (1997).

On en trouvera le résumé en cliquant ici. 

clignote.GIF (9371 octets)

Principe et méthode

Si la phylogénie est "le cours historique de la descendance des êtres organisés" (Darlu & Tassy, 1993), cette recherche de filiation entre espèces ou groupes d'espèces ("arbres phylogénétiques") a donné lieu à des discussions conceptuelles (généalogie et connexions entre les groupes, etc.) mais aussi à l’élaboration de méthodes d'approche différentes. Une classification phénétique doit être basé sur le plus grand nombre possible de caractères, et seulement cela, tandis qu'une classification cladistique doit refléter l’ordre d’apparition des caractères dérivés (Janvier, 1987). Un arbre construit à partir d'une matrice de distances ne donne pas d'information sur l'état des caractères aux nœuds, ni sur leur sens d'évolution (plésiomorphies ou apomorphies, cas de convergences ou de réversions). Enfin, le risque de raisonnement circulaire est très important. Hennig (1950, 1966, 1969, 1981) a défini les principes de l'analyse cladistique. Le concept fondamental consiste à mettre en évidence la série de transformations des caractères des taxons étudiés, de l'état initial (qualifié d’ancestral ou de plésiomorphe), à l'état dérivé (apomorphe).

Dans le cadre de l’application à l’écologie, il est impossible d’utiliser tel quel le vocabulaire cladistique puisqu’il n’est pas fait réfèrence à des études morphologiques et de parentés. Nous proposons donc les termes d’état plésioèce pour un état initial et d’état apoèce pour un état dérivé.

En phylogénie, les regroupements de taxons en groupes-frères ("sister-groups") définis par les états apomorphes qu'ils partagent (synapomorphies) sont appelés monophylétiques car ils correspondent à l’ensemble des descendants connus d’un ancètre commun. En synécologie, les regroupements définis par les états apoèces partagés (synapoècies) ne peuvent être qualifiés de monophylétiques car ils ne correspondent pas à un lien de parenté entre groupes-frères. Par contre, nous proposons de les qualifier de monocénotiques. Les regroupements fondés sur des symplésioècies (états plésioèces partagés) peuvent être appelés paracénotiques.

Darlu & Tassy (1993) qualifient la méthode cladistique d'hypothético-déductive. Les seules hypothèses sont :1) que les caractères sont indépendants les uns des autres, condition réalisée dans le cas d'une analyse de ‘freshwater biomonitoring’ basée sur l'étude des Ephémères, Plécoptères et Trichoptères puisque les chorologies de ces insectes sont indépendantes ;2) que les caractères sont obtenus par héritage avec modification, condition essentielle pour éviter les polytomies irréductibles lors de l’analyse. Cette condition est, en général, réalisée pour les études phylogénétiques. Dans des analyses synécologiques, l’héritage avec modification n’est pas garanti car des échanges de caractères / taxons peuvent se produire entre les stations. L’application technique de la méthode cladistique est néanmoins possible, avec le risque de voir apparaître des polytomies irréductibles. De plus, ces polytomies pourraient, en théorie, permettre de détecter de tels échanges.

Le cladogramme est la représentation graphique des relations entre taxons en analyse phylogénétique. Comme la notion de clade est exclue en application à l’écologie, nous proposons le terme Ecogramme pour les arbres représentant les relations entre stations.

Les programmes informatiques permettant le traitement des matrices de données reposent tous sur la méthode de parcimonie : le nombre de solutions (arbres) étant très grand, le programme retient la (les) solution(s) la (les) plus courte(s) (minimisation de la longueur de l’arbre = nombre de "pas" = nombre de transformations subies par les caractères). Si plusieurs arbres, également parcimonieux ressortent du traitement des données, un arbre de consensus strict, synthèse entre toutes les solutions également parcimonieuses, est construit (option nelsen dans le logiciel Hennig86 par exemple). Il existe plusieurs méthodes de construction d'arbres de consensus, dont aucune n'est totalement satisfaisante. Le consensus strict, qui ne retient des arbres comparés que les groupements de taxons qui sont identiques dans tous les arbres, les points de conflits étant représentés par des multifurcations, apparaît comme celle qui introduit le moins d'a priori dans sa construction (Darlu & Tassy, 1993). Malgré tout, l'arbre de consensus strict constitue une certaine perte de potentialité pour les tests d’attributs ultérieurs, relativement aux arbres minimaux correspondants.

C'est l'homoplasie qui est responsable de l'apparition de plusieurs arbres également parcimonieux. Par homoplasie, on entend l'apparition indépendante de caractères similaires chez des taxons proches. L'homoplasie est subdivisée en convergence (apparition indépendante d'un même caractère chez deux taxons ou plus) et réversion (apparition d'un caractère ayant l'apparence d'un caractère plésioèce). Le degré d'homoplasie est estimé à l'aide de l'Indice de Cohérence IC (Consistency Index sensu Kluge & Farris, 1969), de l’Indice de Cohérence corrigé (ou IC-), excluant les caractères non informatifs (Swofford, 1991) et de l'Indice de Rétention IR (Retention Index sensu Farris, 1989). Enfin, l’indice RC (ou Rescaled Consistency Index = IC x IR) fait l’équilibre entre IC et IR.

L'analyse de parcimonie, car elle exclut le plus possible tout recours à un scénario préalable, conscient ou non, et parce qu'il est possible de ne pas pondèrer artificiellement les états des caractères, offre une possibilité objective de tester des situations évolutives. Elle permet de prendre en compte les états successifs d'une Unité Evolutive ou Ecologique. Son utilisation pour l'appréciation des phénomènes de disparition et d’installation d'espèces aurait dû être plus importante.

Or, très peu de travaux en ont fait usage. Lambshead & Paterson (1986) ont comparé, sur cinq exemples, les résultats de l'analyse cladistique, avec des Analyses en Composantes Principales. Ils concluent :

  1. à la validité théorique de la méthode de parcimonie de Wagner ;
  2. à son pouvoir explicatif plus important que les méthodes classiques ;
  3. à l'objectivité de l'explication (rigueur de la méthode de parcimonie) excluant les possibilités d'interprétation, nécessairement subjectives. Bellan-Santini et al. (1994) arrivent à des conclusions analogues : 1) que les dendrogrammes construits à partir de matrices de similarité étant fonction de l'algorithme choisi, l'interprétation peut donc être fonction de la méthode utilisée ; 2) que l'analyse de parcimonie, en proposant par nature l'hypothèse la plus simple, minimise l'importance des espèces à distribution aléatoire (les caractères dérivés correspondants apparaissant alors comme des homoplasies) ; 3) que la cohérence de l'ensemble est mesurable (Indice de Cohérence, etc.) ; 4) que la signification des espèces rares peut être étudiée (absence de pondération).

Enfin, si l'analyse de parcimonie ne peut se substituer aux analyses statistiques classiques, elle apporte une vision évolutive des stations étudiées et la possibilité d'une étude séquentielle de cette évolution, que ne peuvent fournir calculs de distance, matrices de similarité et dendrogrammes.

Le schéma ci-après nous semble expliquer plus simplement la différence fondamentale entre l'approche phénétique d'une part, et l'approche selon la méthode de parcimonie, d'autre part.

tableau méthode...

La méthode de parcimonie de Wagner autorise la navette constante entre l'arbre minimal de consensus et la matrice d'origine, caractère par caractère.

Ainsi, une succession d'impacts apparaît de la façon suivante sur un arbre (en l'occurence, plus la station est "basique" sur l'arbre, moins elle est "polluée", c'est-à-dire plus proche de la station "idéale" constituant l'outgroup). Par ailleurs l'incidence des impacts sur l'arbre, taxon par taxon, est très aisément accessible.

Enfin, il est possible de tester la congruence entre l'arbre, et des caractéristiques physico-chimiques, hydrologiques, etc. considérées comme attributs.

Il est également possible d'établir un arbre sur la base de données temporelles (même station au cours du temps)