fabriquer un fichier de séquences pour Anagène avec Mega 4.1
mis à jour le 26/09/2010
Le logiciel Mega 4.1 permet d'interroger la banque de données moléculaires NCBI pour afficher et importer des séquences utilisables ensuite dans Anagène. Cela donne la possibilité de travailler sur la biodiversité génétique et celle des organismes d'un même échantillonnage d'espèces.
mots clés :
Anagène, tutoriel, Mega 4.1, ADN, protéine, séquences, biodiversité,
Les nouveaux programmes de seconde demandent d'explorer la biodiversité de l'échelle des écosystèmes à celle des gènes. Il peut être intéressant de présenter la biodiversité des organismes et la biodiversité génétique sur un échantillonnage d'espèces commun. Cela nécessitera la plupart du temps de constituer un fichier de séquences correspondant aux espèces étudiées dans la nature ou dans un Musée. Ce fichier est ensuite exploité avec Anagène.
La voie la plus rapide pour acquérir des fichiers de séquences pour Anagène est bien entendu de
consulter la banque de séquences disponible sur le site de l'INRP. De nombreuses séquences y sont classées en fonction des intitulés des programmes en cours. Pour ceux qui disposent de données acquises par d'autres moyens, Anagène dispose aussi de modules de création et d'édition de données. L'aide du logiciel donne la marche à suivre.
Dans l'exemple traité ci-dessous, l'utilisation des collections du Muséum d'Histoire Naturelle de Nantes a conduit à comparer un lion (
Panthera leo), un tigre (
Panthera tigris) et une Panthère (
Panthera pardus). Ces données n'étant pas disponibles sur le site de INRP, l'utilisation de données du NCBI (National Center for Biotechnology Information) a permis de mener à bien la comparaison avec Anagène des séquences du gène de la cytochrome oxydase b de ces espèces. La
démarche pédagogique est décrite dans une ressource séparée.Dans la construction des fichiers au format .edi pour Anagène, le logiciel Mega 4.1 est d'un très grand secours et permet d'éviter les étapes les plus fastidieuses. La présente ressource ne prétend pas être un tutoriel complet de Mega mais décrit les étapes nécessaires à la fabrication d'un fichier de séquences opérationnel pour Anagène.
Télécharger et installer Mega 4.1Interroger la base NCBIImporter les séquences au format megaConstituer et utiliser le fichier au format .ediRemerciements
Télécharger et installer Mega 4.1
![mega01 mega01](https://www.pedagogie.ac-nantes.fr/medias/photo/mega01_1285509343118.jpg?ID_FICHE=1285509146493)
Le logiciel Mega est un logiciel conçu par des chercheurs en génétique et téléchargeable sur le site de
http://www.megasoftware.net/.
Dans l'état actuel du développement (septembre 2010) préférer la version 4 à la version 5.
Un clic sur cette image ouvre la page de téléchargement.
Le logiciel est distribué gratuitement pour la recherche et l'éducation.
Après avoir complété le formulaire, il faut télécharger le logiciel.
La décompression est suivie de l'exécution du fichier d'installation obtenu.
Au besoin, l'icône de Mega sera installée sur le bureau.
![mega03 mega03](https://www.pedagogie.ac-nantes.fr/medias/photo/mega03_1285509447195.jpg?ID_FICHE=1285509146493)
Interroger la base NCBI
![mega05 mega05](https://www.pedagogie.ac-nantes.fr/medias/photo/mega05_1285509673893.jpg?ID_FICHE=1285509146493)
La fenêtre d'accueil de Mega fournit un certain nombre de fonctions.
![mega04 mega04](https://www.pedagogie.ac-nantes.fr/medias/photo/mega04_1285509752479.jpg?ID_FICHE=1285509146493)
La commande "Alignment/Query Databanks" ouvre le site du NCBI dans un navigateur internet spécifique .
![mega06 mega06](https://www.pedagogie.ac-nantes.fr/medias/photo/mega06_1285509824789.jpg?ID_FICHE=1285509146493)
![mega07 mega07](https://www.pedagogie.ac-nantes.fr/medias/photo/mega07_1285509867785.jpg?ID_FICHE=1285509146493)
Après avoir choisi le type de séquence recherché, il faut saisir le nom de l'espèce en latin et le nom anglais ou le code de la molécule recherchée. Cette saisie se fait en clair sans langage de programmation. Il faut ensuite cliquer sur "Search".
![mega08 mega08](https://www.pedagogie.ac-nantes.fr/medias/photo/mega08_1285509940301.jpg?ID_FICHE=1285509146493)
La liste de résultats offre toutes les séquences correspondant à la requête.
Le gène complet comporte 1 140 nucléotides mais il n'existe pas pour le moment de description de cette séquence complète pour
Panthera pardus. Les séquences des 219 premières bases sont par contre présentes pour les trois espèces étudiées (
P. leo, P. tigris et P. pardus).
![mega09 mega09](https://www.pedagogie.ac-nantes.fr/medias/photo/mega09_1285510072630.jpg?ID_FICHE=1285509146493)
Il faut donc prendre toutes les précautions d'usage afin que les différentes séquences importées soient bien homologues.
En cliquant sur le lien "Fasta" de la séquence choisie, on affiche la séquence recherchée dans la fenêtre du navigateur.
Importer les séquences au format mega
![mega10 mega10](https://www.pedagogie.ac-nantes.fr/medias/photo/mega10_1285510378155.jpg?ID_FICHE=1285509146493)
Un fois la séquences affichée, un clic sur "Add to alignment" transfère la séquence en question dans un nouvel afficheur appelé "Alignment Explorer".
![mega11 mega11](https://www.pedagogie.ac-nantes.fr/medias/photo/mega11_1285510449013.jpg?ID_FICHE=1285509146493)
Mega étant un logiciel complet d'affichage, d'alignement et de construction de matrices et d'arbre. Il est possible d'importer ainsi plusieurs séquences mais il est préférable de faire les importations une à une pour simplifier les manipulations ultérieures.
![mega12 mega12](https://www.pedagogie.ac-nantes.fr/medias/photo/mega12_1285510537296.jpg?ID_FICHE=1285509146493)
Une fois la première séquence affichée, il faut l'exporter au format Mega par "Export Alignment/MEGA Format".
![mega13 mega13](https://www.pedagogie.ac-nantes.fr/medias/photo/mega13_1285510602230.jpg?ID_FICHE=1285509146493)
Donner un nom très explicite au fichier qui portera l'extension .meg.
![mega14 mega14](https://www.pedagogie.ac-nantes.fr/medias/photo/mega14_1285510654813.jpg?ID_FICHE=1285509146493)
La saisie du titre permet de préciser encore.
![mega15 mega15](https://www.pedagogie.ac-nantes.fr/medias/photo/mega15_1285510717793.jpg?ID_FICHE=1285509146493)
On répond "Yes" à cette question si la séquence est codante.
La totalité de cette démarche sera répétée pour chacune des séquences à importer à partir de NCBI.
Comme indiqué plus haut, il est impératif que les séquences soient homologues pour que le travail ait un sens.
Constituer et utiliser le fichier au format .edi
![mega16 mega16](https://www.pedagogie.ac-nantes.fr/medias/photo/mega16_1285510897228.jpg?ID_FICHE=1285509146493)
Il est tout à fait possible d'importer les fichiers .meg directement dans anagène, cependant pour se conformer aux normes d'affichage de ce logiciel, les fichiers .meg seront renommés en .adn ou en .pro selon la nature de la séquence.
On voit ici les trois fichiers après ce changement.
![mega17 mega17](https://www.pedagogie.ac-nantes.fr/medias/photo/mega17_1285510979801.jpg?ID_FICHE=1285509146493)
Il faut ensuite ouvrir le logiciel Anagène.
![mega18 mega18](https://www.pedagogie.ac-nantes.fr/medias/photo/mega18_1285511035544.jpg?ID_FICHE=1285509146493)
La commande "Fichier/Ouvrir" donne accès à l'explorateur qui permet de choisir l'un des fichiers ".adn"
![mega19 mega19](https://www.pedagogie.ac-nantes.fr/medias/photo/mega19_1285511093782.jpg?ID_FICHE=1285509146493)
A ce message d'avertissement il faut répondre "Oui".
La séquence trouvée par le logiciel est détectée comme de l'ADN. Confirmer en cliquant sur "OK".
![meag21 meag21](https://www.pedagogie.ac-nantes.fr/medias/photo/mega21_1285511259900.jpg?ID_FICHE=1285509146493)
On ouvre et on affiche ainsi successivement toutes les séquences à importer.
![mega22 mega22](https://www.pedagogie.ac-nantes.fr/medias/photo/mega22_1285511361914.jpg?ID_FICHE=1285509146493)
La commande "Fichier/Enregistrer" ouvre une boîte de dialogue.
![mega23 mega23](https://www.pedagogie.ac-nantes.fr/medias/photo/mega23_1285511436219.jpg?ID_FICHE=1285509146493)
Pour implanter le fichier .edi sur le réseau ou l'ENT de l'établissement il faut faire les choix portés sur l'image ci-contre.
![mega24 mega24](https://www.pedagogie.ac-nantes.fr/medias/photo/mega24_1285511515703.jpg?ID_FICHE=1285509146493)
Choisir le nom du fichier avec soin pour que les élèves l'identifient facilement.
Le fichier ainsi fabriqué peut être ouvert avec Anagène sur n'importe quel poste du laboratoire.
Remerciements
Au Dr. Mathilde Cordellier, Biodiversität und Klima Forschungszentrum, Frankfurt/Main pour son aide concernant le logiciel MEGA 4.1 et la base de données de génétique NCBI.
auteur(s) :
François Cordellier, professeur de SVT au lycée Jean Perrin de Rezé
information(s) pédagogique(s)
niveau : Lycée tous niveaux
type pédagogique : tutoriel, préparation pédagogique
public visé : enseignant
contexte d'usage : salle multimedia, laboratoire
référence aux programmes :
La biodiversité, résultat et étape de l'évolution
Parenté entre êtres vivants actuels et fossiles - phylogenèse - évolution
Stabilité et variabilité des génomes et évolution
le brassage génétique et sa contribution à la diversité génétique
Diversification génétique et diversification des êtres vivants
haut de page
sciences de la vie et de la Terre
- Rectorat de l'Académie de Nantes