Espace pédagogique

fabriquer un fichier de séquences pour Anagène avec Mega 4.1

Le logiciel Mega 4.1 permet d'interroger la banque de données moléculaires NCBI pour afficher et importer des séquences utilisables ensuite dans Anagène. Cela donne la possibilité de travailler sur la biodiversité génétique et celle des organismes d'un même échantillonnage d'espèces.

Les nouveaux programmes de seconde demandent d'explorer la biodiversité de l'échelle des écosystèmes à celle des gènes. Il peut être intéressant de présenter la biodiversité des organismes et la biodiversité génétique sur un échantillonnage d'espèces commun. Cela nécessitera la plupart du temps de constituer un fichier de séquences correspondant aux espèces étudiées dans la nature ou dans un Musée. Ce fichier est ensuite exploité avec Anagène.

La voie la plus rapide pour acquérir des fichiers de séquences pour Anagène est bien entendu de consulter la banque de séquences disponible sur le site de l'INRP. De nombreuses séquences y sont classées en fonction des intitulés des programmes en cours. Pour ceux qui disposent de données acquises par d'autres moyens, Anagène dispose aussi de modules de création et d'édition de données. L'aide du logiciel donne la marche à suivre.

Dans l'exemple traité ci-dessous, l'utilisation des collections du Muséum d'Histoire Naturelle de Nantes a conduit à comparer un lion (Panthera leo), un tigre (Panthera tigris) et une Panthère (Panthera pardus). Ces données n'étant pas disponibles sur le site de INRP, l'utilisation de données du NCBI (National Center for Biotechnology Information) a permis de mener à bien la comparaison avec Anagène des séquences du gène de la cytochrome oxydase b de ces espèces. La démarche pédagogique est décrite dans une ressource séparée.

Dans la construction des fichiers au format .edi pour Anagène, le logiciel Mega 4.1 est d'un très grand secours et permet d'éviter les étapes les plus fastidieuses. La présente ressource ne prétend pas être un tutoriel complet de Mega mais décrit les étapes nécessaires à la fabrication d'un fichier de séquences opérationnel pour Anagène.

Télécharger et installer Mega 4.1
Interroger la base NCBI
Importer les séquences au format mega
Constituer et utiliser le fichier au format .edi
Remerciements

Télécharger et installer Mega 4.1


Dans l'état actuel du développement (septembre 2010) préférer la version 4 à la version 5.

Un clic sur cette image ouvre la page de téléchargement.
Le logiciel est distribué gratuitement pour la recherche et l'éducation.

Après avoir complété le formulaire, il faut télécharger le logiciel.

La décompression est suivie de l'exécution du fichier d'installation obtenu.

Au besoin, l'icône de Mega sera installée sur le bureau.

mega03
mega02

Interroger la base NCBI


mega05La fenêtre d'accueil de Mega fournit un certain nombre de fonctions.
mega04La commande "Alignment/Query Databanks" ouvre le site du NCBI dans un navigateur internet spécifique .
mega06mega07Après avoir choisi le type de séquence recherché, il faut saisir le nom de l'espèce en latin et le nom anglais ou le code de la molécule recherchée. Cette saisie se fait en clair sans langage de programmation. Il faut ensuite cliquer sur "Search".

Le gène complet comporte 1 140 nucléotides mais il n'existe pas pour le moment de description de cette séquence complète pour Panthera pardus. Les séquences des 219 premières bases sont par contre présentes pour les trois espèces étudiées (P. leo, P. tigris et P. pardus).

En cliquant sur le lien "Fasta" de la séquence choisie, on affiche la séquence recherchée dans la fenêtre du navigateur.

Importer les séquences au format mega


mega11Mega étant un logiciel complet d'affichage, d'alignement et de construction de matrices et d'arbre. Il est possible d'importer ainsi plusieurs séquences mais il est préférable de faire les importations une à une pour simplifier les manipulations ultérieures.
mega12Une fois la première séquence affichée, il faut l'exporter au format Mega par "Export Alignment/MEGA Format".
mega13Donner un nom très explicite au fichier qui portera l'extension .meg.
mega14La saisie du titre permet de préciser encore.

La totalité de cette démarche sera répétée pour chacune des séquences à importer à partir de NCBI.

Comme indiqué plus haut, il est impératif que les séquences soient homologues pour que le travail ait un sens.

Constituer et utiliser le fichier au format .edi



On voit ici les trois fichiers après ce changement.
mega17Il faut ensuite ouvrir le logiciel Anagène.
mega18La commande "Fichier/Ouvrir" donne accès à l'explorateur qui permet de choisir l'un des fichiers ".adn"

La séquence trouvée par le logiciel est détectée comme de l'ADN. Confirmer en cliquant sur "OK".
mega20
meag21On ouvre et on affiche ainsi successivement toutes les séquences à importer.
mega22La commande "Fichier/Enregistrer" ouvre une boîte de dialogue.
mega23Pour implanter le fichier .edi sur le réseau ou l'ENT de l'établissement il faut faire les choix portés sur l'image ci-contre.

Le fichier ainsi fabriqué peut être ouvert avec Anagène sur n'importe quel poste du laboratoire.

Remerciements

Au Dr. Mathilde Cordellier, Biodiversität und Klima Forschungszentrum, Frankfurt/Main pour son aide concernant le logiciel MEGA 4.1 et la base de données de génétique NCBI.

Information(s) pédagogique(s)

Niveau :
Lycée tous niveaux
Type pédagogique :
tutoriel, préparation pédagogique
Public visé :
enseignant
Contexte d'usage :
salle multimedia, laboratoire
Référence aux programmes :

La biodiversité, résultat et étape de l'évolution

Parenté entre êtres vivants actuels et fossiles - phylogenèse - évolution

Stabilité et variabilité des génomes et évolution

le brassage génétique et sa contribution à la diversité génétique

Diversification génétique et diversification des êtres vivants