Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Ako extrahovať záznamy z viac Fasta

Fast je formát založený na texte používa v oblasti bioinformatiky pre zastupovanie sekvencie , zvlášť tie , nukleotidov a peptidov , u párov báz zastúpené jediným písmenom . Fast sekvencia sa skladá z opisu jedného riadku , vyznačuje tým , " väčší ako " symbol na prvom riadku , nasledovaný multiriadkového nukleotidu alebo peptidové sekvencie . Môžete extrahovať viac sekvencií zo súboru fast pomocou špeciálnych modulov , alebo add - ons, na programovací jazyk Perl , známy ako Bioperl , ktoré boli špeciálne vyvinuté pre spracovanie formátu fast . Môžete tiež ručne kódovať skript v Perlu , aby zodpovedali vzory v súbore alebo pomocou ďalších dostupných nástrojov pre extrakciu fast sekvencie . Veci , ktoré budete potrebovať klipart Fast súbor klipart Perl Editor
Bioperl
ActiveState Perl
Biopieces
Zobraziť ďalšie inštrukcie Cestuj 1

Vytvorte si Perl aplikácie editor . Môžete použiť jednoduchý textový editor , napríklad Poznámkový blok . Budete musieť uložiť súbor s " . Pl " rozšírenie ukázať , že je to program Perl .
2

Výpis sekvencie zo súboru viac fast prevedením sa zadaným vzorkou v Perlu , zadaním nasledujúci kód do editora : !

# /usr /bin /perlmy $ fasta_seq = presunúť , my $ sekvencia = shift ; my $ WORKFILE = ` cat $ fasta_seq ` ; my ( $ fasta_seq ) = $ WORKFILE = ~ /( > $ sekvencia [ ^ > ] + ) /s ; vytlačiť $ fasta_seq ;
3

Výpis sekvencie zo súboru fast pomocou Bioperl . Môžete extrahovať viac sekvencií zadaním nasledujúci kód do editora :

# /bin /perl - w

používať Bio :: SeqIO ;

$ sequenceobject = Bio ! :: SeqIO - > new ( - file = > " fasta_file_path " , - format = > " fasta " ) ;

Bio :: SeqIO modul umožňuje bezproblémové spracovanie sekvencie . Môžete získať jednu sekvenciu pomocou nasledujúceho príkazu :

$ retrievedsequence = $ sequenceobject - > next_seq ;

Môžete slučku cez objekt a získať viac sekvencií , takto :

while ( $ retrievedsequence = $ sequenceobject - > next_seq ) { print $ retrievedsequence - > seq , " \\ n" ; }
4

Výpis sekvencie zo súboru fast pomocou " Biopieces " aplikácie , ktorá je rámec , ktorý obsahuje sadu modulárnych nástrojov pre manipuláciu s bioinformatiky dát . Môžete spustiť príkaz svojej Biopieces na príkazovom riadku

read_fasta - i fasta_file

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené