mardi 2 janvier 2018

Loi de Hardy, grande stabilité des phénotypes démontrée à l'aide de maths simples.

Nous avons entendu parlé à l'école d'allèles dominants ou récessifs, pour un gène, qui causent des phénotypes comme la couleur des yeux. Sachant que chaque parent apporte un allèle, dans une population non isolée, on trouverait normal à ce que tout le monde finisse par avoir les yeux de la même couleur foncée sous l'effet d'une forme de dilution génétique.

On a alors tendance à supposer que la couleur bleue apparue dans des populations du nord de l'Europe,
devrait disparaître à mesure que les groupes se mélangent, au fil des migrations de l'histoire   
 
Or on constate qu'il n'en est pas ainsi, il y a toujours, en France par exemple, une population dont les yeux sont de la couleur du ciel, et même aussi dans les îles des Antilles par exemple on voit des personnes d'origine africaine aux yeux clairs et parfois bleus. 

Il y avait avant la publication de Hardy une controverse entre experts en statistique et de génétique, et c'est en voulant rendre service à son partenaire du jeu de croquet qu’Hardy se pencha sur le sujet.
 
La surprise est donc venue en constatant qu’il n’y avait pas besoin d'une modélisation complexe usant de processus aléatoires, mais que tout le résultat repose sur la simple identité  : (a+b)^2=a^2+2ab+b^2.  
  
Un gène possédant deux allèles, chacun provenant d’un parent,  ayant 2 formes possibles notées A,a
Par exemple, A désignerait la couleur marron pour les yeux, a la couleur bleue.
Les fréquences des allèles dans la population sont notées (on distingue Aa de aA pour suivre le mécanisme de meïose où chaque parent fourni un seul allèle).

Les proportions sont notées par les lettres p, q, et r, comme suit, le tableau étant symétrique, et aA,  Aa sont indistincts dans la nature, on peut poser que Aa et aA existent avec suivant une proportion q qui est identique considérant que Aa et aA constituent le même cas, d'où : 
AA p, Aa q, q, aa r

À partir de 2 individus, sous l’hypothèse dite panmictique on compte alors les fréquences des croisements dans une table de multiplication comme celle produite par Hardy.
Parent1 / Parent2
AA p
Aa q
aA q
aa r
AA p
AA
Aa
AA
Aa
Aa q
AA
Aa
AA
Aa
aA q
aA
aa
aA
aa
aa  r
aA
Aa
aA
aa

Pour alléger la notation,  x2 désigne une quantité x élevée au carré, soit x^2, à ne pas confondre avec 2x indiquant la quantité doublée. F est la fréquence pour les génotypes des descendants de la première génération.

F(AA) = P = p2+pq+qp+q2 = p2+2pq+q2=(p+q)2
F(Aa) = Q= pq+q2+pr+qr = (p+q)(q+r)
F(aA) = Q= qp+q2+rp+rq
F(aa) = R= q2+rq+qr+r2 =  (q+r)2=q2+2qr+r2

Hypothèse : si q2=pr  (on verra ce qu’il en est par la suite)
En remplaçant q2 par pr dans les expressions de P et R on a :
P=p2+2pq+pr
R=pr+2rq+r2
et donc P/R = p(p+2q+r)/r(p+2q+r) = p/r. Pour montrer le résultat, sachant que p+2q+r=P+2Q+R=1, il faut une relation supplémentaire, et ce sera que (Q/R)2=(q/r)2=(p/r). En effet, l’hypothèse est q2=pr qu’on divise par r2 d’une part, et on a constaté que Q2=PR par lecture directe des expressions de P, Q, R, qu’on divise par R2 pour obtenir (Q/R)2=(P/R)=p/r soit (q/r)2, d’autre part.

En résumé sous l’hypothèse q2=pr on a P/R=p/r et Q/R=q/r et sachant que la somme P+2Q+R=p+2q+r est égale à 1, la seule solution possible est P=p, Q=q, R=r.

Cest ingénieux, car s’il n’y a aucune raison pour que q2=pr, les calculs deviennent néanmoins valables à partir de la génération suivante, car Q2=PR, par construction. Le mathématicien anglais Hardy le formulait ainsi.
«The interesting question is — in what circumstances will this distribution be the same as that in the generation before? It is easy to see that the condition for this is q^2 = pr. And since q_1^2 = p_1r_1, whatever the values of p, q, and r may be, the distribution will in any case continue unchanged after the second generation ».
Les proportions d’allèles se stabilisent immédiatement, par un mécanisme d’identité remarquable.  

Hardy, spécialiste en théorie des nombres, et mentor du génial mathématicien Indien Ramanujan, n’était pas particulièrement impressionné par sa découverte, mais voilà peut-être enfin la justification de l'adjectif « remarquable » de l'identité de nos souvenirs scolaires.
La conséquence de la « loi », qui est plutôt un théorème, est que dans une population fermée, nombreuse et non soumise à la sélection naturelle, il n’y aurait pas comme on pourrait le croire un phénotype unique auquel un mélange qui équivaut à une dilution mènerait au fil du temps.

Par ailleurs il existe des maladies qui persistent par le même mécanisme de rencontre entre 2 allèles récessifs. La génétique semble préférer une sorte de statu quo opposé au changement, mais sans stabilité la vie existerait-elle ?
   
PS : L’ «évolution allèlique » est enseignée en classe de première, ce résultat de Hardy pourrait aussi l'être, les mathématiques nécessaires étant très simples.