Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
Základom súboru je riadok začínajúcich " > " znak a nasleduje texte identifikácia pôvodu poradí . Záhlavie je zvyčajne menej ako 80 znakov . Linka na základe tohto záhlavia riadku obsahuje rad postáv predstavujúcich nukleotidov v DNA alebo aminokyselín zvyškov v peptidovej sekvencii .
Povolené DNA znaky
iba významné znaky sú povolené ako súčasť postupnosti fast . Sekvencia sa môže skladať z A , C , T , G alebo U , zodpovedajúce nukleotidy adenozín , cytozín , guanín , tymidín alebo uracil , resp . Avšak , nemusí byť vždy presná identita nukleotidu darček od sekvenovania . Fast tiež obsahuje kódy , ktoré predstavujú možné nukleotidov , keď je prítomná neistota . Kód N sa používa , keď nemôže byť rozhodnuté , a X , keď je nukleotid maskuje inými molekulami . " - " Kód sa používa na reprezentáciu medzeru neurčitej dĺžky
povolená Peptidy Znaky
alfanumerický kód môže byť tiež použitý na reprezentáciu . na 24 aminokyselín prítomných v sekvencii peptidu . Ak je peptid , nemožno určiť , kód X sa používa , podobne ako DNA sekvencie . " * " So používa na označenie terminus alebo translačný stop sekvenciu peptidu . " - " . Je tiež používaný reprezentovať medzeru v sekvenčných dát pre peptidy
Ďalšie informácie
NCBI určí paušálne sekvencie ID , alebo SEQ ID , pre použitie v fast záhlavie riadkov , hoci nie je tam žiadny konečný štandard pre zaradenie do fast riadok hlavičky . Súbor fast obsahujúce viac sekvencií je známy ako súbor multi - fast . Fast súbory môžu mať príponu " . Fasta , " " . Fna , " " . FFN , " " . FAA , " " . FRN " alebo " . Fas . "
Copyright © počítačové znalosti Všetky práva vyhradené