Вовед

Опис на книга: Лабораториска вежба по предметот Вовед во биоинформатика
Рок за изработка на вежба: 01-Јуни-2021
Изработил: Кирил Зеленковски [161141]
Линк до фајлови: https://osf.io/pc7q9/

Детален опис на барања [1-13]

💻 Барање 1: Парсирање на фајлови
Да се реализираат примери за парсирање на FASTA и GenBank формати, онака како што е објаснето во поглавје 2.4 од туторијалот.

💻 Барање 2: Поврзување со биолошки бази
Да се напишат 3 примери за поврзување со различни биолошки бази, како што е опишано во поглавје 2.5 од туторијалот.

💻 Барање 3: Seq објекти
Да се напише пример за работа со Seq објекти, како што е опишано во поглавје 3, и да се обрне внимание на процесите транскрипција и транслација.

💻 Барање 4: Yersinia pestis ДНА секвенца
Да се преземе комплетната ДНА секвенца на Yersinia pestis (бактерија која ги инфектира белите дробови и предизвикува пневмонија). До неа се пристапува со употреба на идентификациониот број **NC_005816** во GeneBank базата (работете со **SeqIO** објекти, имате детали во документацијата).

💻 Барање 5: Репликација на секвенца
Имплеметирајте репликација на секвенцијата потпомогнатаод функции во BioPython.

💻 Барање 6: Пронаоѓање на сите CDS
Со помош на biopython, пронајдете ги секвенциите на различните кодни региони означени како (CDS). CDS се регионите добиени после процедурата на отсекување на интроните.

💻 Барање 7: Старт/стоп кодони во произволен CDS
Одберете еден CDS (во мојот случај "pim") и најдете ги сите старт и стоп кодони во неговата РНА.

💻 Барање 8: Транслација на секвенца
Од произволниот CDS што го избравте добивте стоп/старт кодони. Направете транслација за да ги добиете сите можни протеински секвенции.

💻 Барање 9: Мутација на секвенца
Одберете еден од кодните региони и направете мутација со поместување на рамката за 2 нуклеотиди. Анализирајте ги новите протеински секвенции. Внимавајте, сега има нови старт и стоп кодони.

💻 Барање 10: Креирање на FASTA фајл
Да се разработи поглавје 5.5 за креирање на сопствени записи во fasta формат.

💻 Барање 11: Предвидување на структурата на оперон со SVM
Да реализира примерот за предвидување на структурата на оперонот кај бактеријата Bacillus subtilis опишан во поглавје 16 од туторијалот. Да се употреби методот на Логистичка регресија и Машини со Поддржувачки Вектори (SVM) и да се споредат резултатите.

💻 Барање 12: Имплементација на Nussinov функција
Да се испрограмира алгоритмот на Nussinov како функција во python која на влез ќе добива стринг од нуклеотиди, а на излезе ќе ја дава нивната секундарна структура.

💻 Барање 13: BioPython за предвидување на секундарна структура
Да се истражи можноста на biopython за одредување на секундарна структура опишана во поглавје 11.6.9.

Користење на Jupyter-book

Форматот на извештајот за решенијата на лабораториската вежба е во облик на книга (jupyter-book) која е:

Интерактивна: Книгата содржи голем број на интерактивни графици кои ја користат Python библиотеката Plotly, каде може да се манипулираат исходите на кривите со променување на иницијалните вредности со помош на лизгачи, мени со опции и временски зависни лизгачи.

Репродусибилна: Тетратките во книгата се репродусибилни (или во фаза да бидат) во две инстанци:

Надградба на PDF: Извештајот од ваков облик нуди можност за highlighting и додавање на annotations при потреба. Доколку селектирате текст ви овозможува да бирате дали сакате да додадете highlight или annotation. Оваа карактеристки користи Hypothes. Повеќе за Hypothes може да прочитате на следниот линк.

За Google Colab и Hypothes потребно е само gmail профил, додека за Binder нема потреба од никакво поврзување.



Пролет, 2021