Jak konwertować sekwencji do Fasta

Jeden wspólny cel w badaniach medycznych obejmuje identyfikację błędów, lub mutacji w sekwencji DNA , które mogą powodować genetyczne powiązane choroby. Technologia i informatyka mają zaawansowane badania genetyczne do poziomu , w którym tysiące danych sekwencyjnych można analizować równocześnie . Jeden warunek z nowszego oprogramowania jest przed konwersja do formatu danych sekwencji FASTA . FASTA jest podobny do prostego formatu tekstowego . Pozwala to wielu fragmentów danych , które mają być zebrane w jednym pliku i przyspiesza analizę . Jednak większość instrumentów generowania plików sekwencji w formacie tekstowym. Konwersja tekstu do formatu FASTA jestprosty proces korzystania z oprogramowania edytor tekstu . Rzeczy, które musisz Komputer
edytor tekstu
Pokaż więcej instrukcji
1

Otwórz plik tekstowy wyznaczony sekwencji DNA za pomocą programu do edycji tekstu . Byłoby to edytor tekstu dla systemu Macintosh i Notatnik w systemach kompatybilnych z systemem Windows. Oryginalne pliki tekstowe sekwencji może mieć alternatywny rozszerzenia takie jak nast dla danych generowanych na Applied Biosystems zautomatyzowanego analizatora genetycznego .
2

Rozpocznij pierwszą linię wpisując> następnie identyfikator sekwencji. Większa niż symbol oznacza formatu FASTA programów , które analizują dane FASTA . Nie istnieją szczególne przepisy dotyczące identyfikator , o ile nie ma spacji . Przykład dopuszczalnego wejścia do pierwszej linii jest> Cat_Isomerase_Exon3 .
3

Naciśnij przycisk " Powrót " , aby utworzyć koniec linii i rozpocząć drugą linię .

4

Rozpocznij danych sekwencyjnych na drugiej linii. Wytyczne wymagają formatu FASTA DNA następujące dane tekstowe Międzynarodowej Unii Chemii Czystej i Stosowanej , IUPAC , kody . Każda linia jest ograniczona do 80 znaków , reprezentujących 80 zasad DNA i mogą być duże lub małe litery . Wpis w tym podstaw do przyjęcia mieszanych jest AGCTTCGTGG ... CVTGCGTTGT .
5

Naciśnij przycisk " Powrót " , aby rozpocząć następny wiersz danych sekwencji. Każda linia powinna składać się z 80 baz reprezentowanych przez kod IUPAC .
6

Zapisz plik za pomocą rozszerzenia pliku txt lub odpowiednie rozszerzenie pliku FASTA . Programy , które przetwarzają dane w formacie FASTA często wymagają FASTA określone rozszerzenie np. FSA Fina FFN lub FRN . Imperium