haut
Twitter  RSS




Définition Wikipédia de : Bio-informatique







Introduction :

      La bio-informatique est un champ de recherche multi-disciplinaire oĂą travaillent de concert biologistes, informaticiens, mathĂ©maticiens et physiciens, dans le but de rĂ©soudre un problème scientifique posĂ© par la biologie. Le terme bio-informatique peut Ă©galement dĂ©crire (par abus de langage) toutes les applications informatiques rĂ©sultant de ces recherches.







Suite de l'article :

Cela va de l'analyse du gĂ©nome Ă  la modĂ©lisation de l'Ă©volution d'une population animale dans un environnement donnĂ©, en passant par la modĂ©lisation molĂ©culaire, l'analyse d'image, le sĂ©quençage du gĂ©nome et la reconstruction d'arbres phylogĂ©nĂ©tiques (phylogĂ©nie). Cette discipline constitue la « biologie in silico Â», par analogie avec in vitro ou in vivo.





Image (cliquez pour agrandir) :

Cartographie du chromosome X humain (tirĂ©e du site internet du NCBI) ; le sĂ©quençage du gĂ©nome humain reprĂ©sente une des plus grandes rĂ©alisations de la bio-informatique.


- Sommaire de la page -









Chapitre : Constitution et Portée



     La bio-informatique est constituĂ©e par l'ensemble des concepts et des techniques nĂ©cessaires Ă  l'interprĂ©tation de l'information gĂ©nĂ©tique (sĂ©quences) et structurale (repliement 3D). C'est le dĂ©cryptage de la « bio-information Â». La bio-informatique est donc une branche thĂ©orique de la biologie.


     Il s'agit en fait d'analyser, modĂ©liser ou prĂ©dire les informations issues d'activitĂ©s de recherche.


     Dans un sens encore plus Ă©tendu, on peut aussi inclure sous le concept de bio-informatique le dĂ©veloppement d'outils de traitement de l'information basĂ©s sur des systèmes biologiques comme, par exemple, l'utilisation des propriĂ©tĂ©s combinatoires du code gĂ©nĂ©tique pour la conception d'ordinateurs Ă  ADN permettant de rĂ©soudre des problèmes algorithmiques complexes.






Chapitre : L'analyse de séquence



     Alors que de plus en plus de sĂ©quences de gĂ©nome, de transcriptome ou de protĂ©ome sont disponibles, la signification de la plupart de ces sĂ©quences reste Ă  comprendre. La première difficultĂ© a Ă©tĂ© d'organiser cette Ă©norme masse d'information et de la rendre disponible Ă  l'ensemble de la communautĂ© des chercheurs. Cela a Ă©tĂ© rendu possible grâce Ă  diffĂ©rentes bases de donnĂ©es, accessibles en lignes, comme GenBank, UniProt, PDB, etc. (cf. liens en fin d'article).


     Il faut ensuite dĂ©velopper des outils d'analyse de sĂ©quences afin de pouvoir dĂ©terminer leurs propriĂ©tĂ©s.

    Liste :
  • Recherche de protĂ©ines Ă  partir de la traduction de sĂ©quences nuclĂ©iques connues. Celle-ci passe par la dĂ©termination des phases ouvertes de lecture d'une sĂ©quence nuclĂ©ique et de sa ou ses traduction(s) probables.
  • Recherche de sĂ©quences dans une banque de donnĂ©es Ă  partir d'une autre sĂ©quence ou d'un fragment de sĂ©quence. Les logiciels les plus frĂ©quemment utilisĂ©s sont de la famille BLAST (blastn, blastp, blastx, tblastx et leur dĂ©rivĂ©s).
  • Alignement de sĂ©quences : pour trouver les ressemblances entre deux sĂ©quences et dĂ©terminer leurs Ă©ventuelles homologies. Les alignements sont Ă  la base de la construction de parentĂ©s suivant des critères molĂ©culaires, ou encore de la reconnaissance de motifs particuliers dans une protĂ©ine Ă  partir de la sĂ©quence de celle-ci.
  • Recherche de motifs ou structures consensus pour caractĂ©riser les sĂ©quences .

     La bio-informatique intervient aussi dans le sĂ©quençage, avec par exemple l'utilisation de puces Ă  ADN ou biopuce. Le principe d'une telle puce repose sur la particularitĂ© de reformer spontanĂ©ment la double hĂ©lice de l’acide dĂ©soxyribonuclĂ©ique face au brin complĂ©mentaire. Les quatre molĂ©cules de base de l'ADN ont en effet la particularitĂ© de s'unir deux Ă  deux. Si un patient est porteur d'une maladie, les brins extraits de l'ADN d'un patient, vont hybrider avec les brins d'ADN synthĂ©tiques reprĂ©sentatifs de la maladie.






Chapitre : La modélisation moléculaire



     Les molĂ©cules de par leurs dimensions sont invisibles Ă  tout moyen d'investigation direct tel que la microscopie. C'est par l'analyse de donnĂ©es indirectes que les chercheurs peuvent reconstituer un modèle molĂ©culaire, c'est-Ă -dire une construction intellectuelle prĂ©sentant la meilleure adĂ©quation avec les rĂ©sultats expĂ©rimentaux. Ces donnĂ©es sont issues principalement d'analyses cristallographiques (Ă©tude des figures de diffraction des rayons X par un cristal), de spectromĂ©trie de masse, ou de rĂ©sonance magnĂ©tique nuclĂ©aire. Elles reprĂ©sentent les contraintes expĂ©rimentales exercĂ©es sur le modèle. Le modèle molĂ©culaire obtenu ensuite est un ensemble de coordonnĂ©es atomiques dans l'espace. L'informatique intervient dans toutes les Ă©tapes conduisant de l'expĂ©rimentation au modèle, puis ensuite dans l'analyse du modèle par la visualisation molĂ©culaire (voir les protĂ©ines en 3D).


     Un dernier aspect est la prĂ©diction de la structure 3D d'une protĂ©ine Ă  partir de sa structure primaire (la liste des acides aminĂ©s qui la composent), en modĂ©lisant les diffĂ©rentes caractĂ©ristiques des acides aminĂ©s. Cela a un grand intĂ©rĂŞt car la fonction, l'activitĂ© d'une protĂ©ine dĂ©pendent grandement de sa forme. De mĂŞme, la modĂ©lisation des structures 3D d'acides nuclĂ©iques (Ă  partir de leur sĂ©quence nuclĂ©otidiques) revĂŞt la mĂŞme importance que pour les protĂ©ines.


     La connaissance de la structure tri-dimensionnelle permet d'Ă©tudier les sites actifs d'une enzyme, mettre au point informatiquement une sĂ©rie d'inhibiteurs potentiels pour cette enzyme, et ne synthĂ©tiser et ne tester que ceux qui semblent convenir. Cela permet de rĂ©duire les coĂ»ts en temps et en argent de ces recherches.


     De mĂŞme la connaissance de cette structure permet de faciliter l'aligment de sĂ©quences protĂ©iques.


     La visualisation de la structure tridimensionnelle d'acides nuclĂ©iques (ARN et ADN) fait Ă©galement partie de la palette des outils bio-informatiques très utilisĂ©s.






Chapitre : Construction d'arbres phylogénétiques



     On appelle gènes homologues des gènes descendant d'un mĂŞme gène ancestral. De façon plus spĂ©cifique, on dit de ces gènes qu'ils sont orthologues s'ils se retrouvent dans des espèces diffĂ©rentes (spĂ©ciation sans duplication), ou qu'ils sont paralogues s'ils se retrouvent chez la mĂŞme espèce (duplication Ă  l'intĂ©rieur du gĂ©nome).


     Il est alors possible de quantifier la distance gĂ©nĂ©tique entre deux espèces en comparant leurs gènes orthologues. Cette distance gĂ©nĂ©tique est reprĂ©sentĂ©e par le nombre et le type de mutations qui sĂ©parent les deux gènes.


     AppliquĂ©e Ă  un nombre plus important d'ĂŞtres vivants, cette mĂ©thode permet d'Ă©tablir une matrice des distances gĂ©nĂ©tiques entre plusieurs espèces. Les arbres phylogĂ©nĂ©tiques rapprochent les espèces qui ont la plus grande proximitĂ©. Plusieurs algorithmes diffĂ©rents sont utilisĂ©s pour tracer des arbres Ă  partir des matrices de distance. Ils reposent chacun sur des modèles de mĂ©canismes Ă©volutifs diffĂ©rents. Les deux mĂ©thodes les plus connues sont la mĂ©thode UPGMA et la mĂ©thode du Neighbour Joining mais il existe d'autres mĂ©thodes basĂ©es sur le Maximum de Vraisemblance et le BayĂ©sien NaĂŻf.


     La construction d'arbres phylogĂ©nĂ©tiques est utilisĂ©e par les programmes d'alignements multiples de sĂ©quences afin d'Ă©liminer une grande partie des alignements possibles et de limiter ainsi les temps de calcul : il permet ainsi de guider l'alignement total.






Chapitre : La modélisation de population







Chapitre : Exemples de tâches/débouchés



     Voici un exemple de tâches/dĂ©bouchĂ©s rĂ©alisĂ©s par plusieurs Ă©tudiants et professeurs

    Liste :
  • Aide Ă  la crĂ©ation de nouveaux mĂ©dicaments (prĂ©diction de structure, d'interactions)
  • DĂ©veloppement de logiciels pour l'analyse et prĂ©diction de donnĂ©es biologiques (gĂ©nomique, transcriptomique, proteomique, etc)
  • DĂ©veloppement de logiciels pour la biologie : (LIMS, interface web, etc)
  • Recherche dans un laboratoire (entreprise publique, biotechs, pharmaceutique, etc).
  • ModĂ©lisation d'Ă©cosystèmes ou de processus Ă©cosystĂ©miques (du gène au rĂ©seau Ă©cologique)
  • ModĂ©lisation physiologique et simulation informatique d'organes
  • Informatique pure
  • Aide Ă  la crĂ©ation d'Organismes GĂ©nĂ©tiquement ModifiĂ©s (bactĂ©ries, plantes, etc)
  • Aide Ă  la crĂ©ation de tests et de systèmes de diagnostics destinĂ©s aux laboratoires d'analyses mĂ©dicales, aux centres de transfusion sanguine et aux laboratoires de contrĂ´le industriel
  • Enseignement
  • Adaptation de technologies informatiques au domaine de la biologie
  • CrĂ©ation, entretien et dĂ©veloppement d'entrepĂ´ts de donnĂ©es
  • Utilisation de logiciels pour l'analyse et prĂ©diction de donnĂ©es biologiques (gĂ©nomique, transcriptomique,proteomique, etc)





Chapitre : Vous pouvez voir également :


  - Sous-chapitre : Articles connexes

  - Sous-chapitre : Liens externes

  - Sous-chapitre : License (BaccalaurĂ©at) en Bioinformatique :

  - Sous-chapitre : DESS en Bioinformatique :

  - Sous-chapitre : Masters Bioinformatique :

  - Sous-chapitre : Doctorat en Bioinformatique :

  - Sous-chapitre : RĂ©fĂ©rences

  1. ↑ Tout comme l'informatique peut être considérée, suivant les situations, comme une science ou comme une technologie.
  2. ↑ Jean-Michel Claverie, « La bioinformatique : une discipline stratĂ©gique Â». ConsultĂ© le 7 janvier 2009
  3. ↑ Jean-Baptiste Waldner, Nano-informatique et Intelligence Ambiante - Inventer l'Ordinateur du XXIe Siècle, Hermes Science, London (rĂ©impr. 2007), 121 p. (ISBN 2746215160) 
  4. ↑ Site des Etudiants de la filière de BioInformatique et BioStatistiques d'Orsay (Description, Ressources, Wiki, et forum sur la bioinformatique)

     


© Source : Wikipedia sous licence GFDL







Robothumb