💻 Б4: Yersinia pestis ДНА секвенца

Опис на барање

Да се преземе комплетната ДНА секвенција на Yersinia pestis (бактерија која ги инфектира белите дробови и предизвикува пневмонија). До неа се пристапува со употреба на идентификациониот број NC_005816 во GeneBank базата (работете со SeqIO објекти, имате детали во документацијата).

Читање на Genbank фајл и принтање на секвенцата:

from Bio import SeqIO

record = SeqIO.read("yersinia-pestis-fasta/NC_005816.gb", "genbank")
# print(record)

print(f'Секвенцата: {record.seq[:15]}...{record.seq[-1]}')
print(f'Сите влезови во feature табалета: {len(record.features)}')
print(f'Извор за базата:  {record.annotations["source"]}')
Секвенцата: TGTAACGAACGGTGC...G
Сите влезови во feature табалета: 41
Извор за базата:  Yersinia pestis biovar Microtus str. 91001

Транскрипција на прочитаната секвенца:

rna_seq = record.seq.transcribe()
print(f'РНА од секвенцата: {rna_seq[:20]}...{rna_seq[-2]}{rna_seq[-1]}')
РНА од секвенцата: UGUAACGAACGGUGCAAUAG...UG

Транслација на нуклеотидите:

protein_seq = record.seq.translate()
print(f'Протеинска секвенца: {protein_seq[:40]}...{protein_seq[-2]}{protein_seq[-1]}')
Протеинска секвенца: CNERCNSDPHPTPEIRSRG*SALLIQESLWSLLRQLWKLK...PL

Транслација на нуклеотидите то првиот стоп кодон и потоа прекинува:

protein_seq_w = record.seq.translate(to_stop=True)
print(f'Протеинска секвенца до прв стоп кодон: {protein_seq_w}')
Протеинска секвенца до прв стоп кодон: CNERCNSDPHPTPEIRSRG