Comment faire pour convertir la séquence de Fasta

Un objectif commun dans la recherche médicale implique l'identification des erreurs , ou mutations , dans la séquence d' ADN qui pourraient causer des maladies liées génétique . Technologie et de l'informatique ont avancé la recherche génétique à un niveau où des milliers de données sur les séquences peuvent être analysés simultanément . Une stipulation de nouveaux logiciels est la conversion préalable de données de séquences au format FASTA . FASTA est similaire au format texte simple. Il permet à plusieurs morceaux de données à compiler en un seul fichier et accélère l'analyse . Cependant , la plupart des instruments génèrent des fichiers de séquences en format texte . Conversion de texte au format FASTA est un processus simple en utilisant un logiciel d'édition de texte . Choses que vous devez
le programme de l'éditeur de texte informatique de
Afficher Instructions
Le 1

Ouvrez la séquence fichier texte d'ADN désignée en utilisant le programme d'édition de texte . Ce serait l'éditeur de texte pour MacIntosh et Notes pour les systèmes compatibles Windows . Fichiers texte des séquences originales pourraient avoir une extension alternative comme suivants pour les données générées sur un analyseur génétique automatisé Applied Biosystems .
2

Commencez la première ligne en tapant > suivi d'un identificateur de séquence . Le symbole de plus désigne le format FASTA des programmes qui analysent les données FASTA . Il n'y a pas de règles spécifiques concernant l'identifiant tant qu'il n'y a pas d'espaces. Un exemple d'une entrée acceptable pour la première ligne
Appuyez sur la touche 3

"Retour" pour créer un saut de ligne et de commencer la deuxième ligne est > Cat_Isomerase_Exon3 . .

4

Début des données de séquence sur la ligne deux . Directives de format FASTA exigent des données de texte d'ADN suivantes Union internationale de chimie pure et appliquée , IUPAC , les codes . Chaque ligne est limité à 80 caractères représentant 80 bases de l'ADN et peut être majuscules ou en minuscules . Une entrée acceptable, y compris des bases mixtes est AGCTTCGTGG ... CVTGCGTTGT .
Appuyez sur la touche 5

" retour " pour commencer la prochaine ligne de données de séquence. Chaque ligne doit être composé de 80 bases représentées par le code de l'UICPA .
6

Enregistrez le fichier en utilisant l'extension de fichier txt ou extension de fichier FASTA approprié . Programmes qui traitent des données au format FASTA nécessitent souvent une extension spécifique FASTA comme FSA , fna , ffn ou FRN .