0:14 Le repliement des protéines.
Il s’agit d’un problème qui résistait aux biologistes depuis plus de 50 ans.
1:40 Il existe un très grand nombre de protéines différentes.
Rien que chez l’être humain, on en compte des dizaines de milliers,
et sur l’ensemble du vivant, on en connait à ce jour près de 200 millions.
2:01 Ce qui permet cela, c’est le fait que toutes les protéines du monde vivant
sont fabriquées à partir d’une liste très restreinte de briques :
les acides aminés.
Le vivant utilise 21 types différents d’acides aminés,
qui permettent de fabriquer toutes les protéines.
4:05 Chaque protéine a sa forme attitrée, et c’est ça qui lui donne sa fonction.
C’est le cas par exemple des anticorps,
qui ont généralement une structure en forme de Y
qui leur permet de s’accrocher aux agents pathogènes
afin de déclencher une réaction immunitaire.
4:44 L’importance de la forme des protéines est telle
qu’un certain nombre de maladies sont dues au fait
que certaines protéines n’adoptent pas la bonne configuration.
On pense que c’est notamment le cas pour des formes de phénylcétonurie,
ou des maladies neurodégénératives comme les maladies d’Alzheimer ou de Parkinson.
6:04 La base de données UniProt recense comme ça
les séquences de 200 millions de protéines différentes,
et le compte augmente d’environ 30 millions chaque année.
Mais sur ces 200 millions, il n’y en a que 170 000 dont on connaisse la forme.
9:30 On ne connaît donc pas a priori la forme, mais ce qu’on sait,
c’est le principe physique qui gouverne ça.
C’est le fait que les interactions entre les acides aminés
permettent en fait de minimiser l’énergie de la molécule.
11:40 La compétition CASP a lieu tous les deux ans depuis 1994.
13:50 Et en 2020, cette même équipe (DeepMind) a explosé le plafond.
17:50 La première partie de l’algorithme essaye de fabriquer une matrice de distance
à partir de la séquence, et la deuxième partie
de produire une forme complète à partir de la matrice.