Ремесло программиста

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.



Кодоны

Сообщений 1 страница 8 из 8

1

Что это такое?  Просили помочь с алгоритмами для решения задачек на Rosalind. Очень много специфики, которая сильно тормозит процесс.

2

utkin написал(а):

Что это такое?  Просили помочь с алгоритмами для решения задачек на Rosalind. Очень много специфики, которая сильно тормозит процесс.

https://ru.wikipedia.org/wiki/Кодон

это очень базовые знания, их проходят в школе (только потом со временем забывают из-за ненужности)

Генетический код - исторически сложившаяся организация молекул ДНК и РНК, при которой последовательность нуклеотидов в них несет информацию о последовательности аминокислот в белковых молекулах. Свойства кода: триплетность (кодон), неперекрываемость (кодоны следуют друг за другом), специфичность (один кодон может определять в полииептидной цепи только одну аминокислоту), универсальность (у всех живых организмов один и тот же кодон обусловливает включение в полипептид одну и ту же аминокислоту), избыточность (для большинства аминокислот существует несколько кодонов). Триплеты, не несущие информации об аминокислотах, являются стоп триплетами, обозначающими место начала синтеза и-РНК. (В.Б. Захаров. Биология. Справочные материалы. М.,1997

http://www.examen.ru/add/manual/school- … nformaczii

в 10-м 11-м классах:
http://festival.1september.ru/articles/645611/

3

А это, в Розалинде вместо этих триплетов сразу какие-то короткие имена бывают типа AKMMAF и дальше последовательность. То есть уже я так понял эти триплеты имеют и короткие названия в виде одной буквы?

4

utkin написал(а):

А это, в Розалинде

Логично предположить, что если кодон (триплет) кодирует аминокислоту, то эти твои цепочки букв - это последовательность названий аминокислот
табличка с буквами

Глицин

Gly

G

Glycine

Аланин

Ala

A

Alanine

Валин

Val

V

Valine

Изолейцин

Ile

I

Isoleucine

Лейцин

Leu

L

Leucine

Пролин

Pro

P

Proline

Серин

Ser

S

Serine

Треонин

Thr

T

Threonine

Цистеин

Cys

C

Cysteine

Метионин

Met

M

Methionine

Аспарагиновая кислота

Asp

D

asparDic acid

Аспарагин

Asn

N

asparagiNe

Глутаминовая кислота

Glu

E

gluEtamic acid

Глутамин

Gln

Q

Q-tamine

Лизин

Lys

K

before L

Аргинин

Arg

R

aRginine

Гистидин

His

H

Histidine

Фенилаланин

Phe

F

Fenylalanine

Тирозин

Tyr

Y

tYrosine

Триптофан

Trp

W

tWo rings

Смысл такой:
1) сама программа сборки белков (цепочка ДНК или РНК) записывается основаниями (их четыре - ACTG)
2) основания берутся по три штуки (это триплет/кодон), и для него подбиратся аминокислота (обнаружено 26 аминокислот. Частовстречающимися считаются 20 аминокислот, в таблице выше - как раз 20 штук)
кодон - это максимум count(A,C,T,G)3 = 43 = 64 варианта, преобразование с потерями: 64 -> 20 (некоторые кодоны кодируют одинаковые аминокислоты)
3) аминокислоты склеиваются в нужной последовательности в белки (белков очень много разных)
(катализирует образование пептидной связи между последней аминокислотой растущего пептида и аминокислотой, присоединённой к тРНК, позиционируя атомы азота и углерода в положении, благоприятном для прохождения реакции)

Белки́ (протеи́ны, полипепти́ды) — высокомолекулярные органические вещества, состоящие из альфа-аминокислот, соединённых в цепочку пептидной связью.
https://ru.wikipedia.org/wiki/Белки

Белки образуют основу костей, сухо­жилий, мышц, соединительной ткани, нервной ткани, крови. Все ферменты, стимулирующие биохимические процессы также являются белками.
http://medbooka.ru/belki
Жизнь—это способ существования белковых тел (c) Ф. Энгельс

Химия такая, вероятностная. рибосома прицепляется к цепочке ДНК или РНК и ползёт по ней, синтезируя другие белки.
Аминокислоты, из которых собираются белки, они поступают с кровотоком из желудка после расщепления съеденных белков (и между клетками через мембраны, в теле человека как в деревьях). Синтез нужных новых белков идёт по всему телу (в каждой живой клетке).
http://biokhimija.ru/lekcii-po-biohimii … brany.html

Скорость синтеза белков выше у прокариот и может достигать 20 аминокислот в секунду
https://ru.wikipedia.org/wiki/Биосинтез_белка
Синтез требует значительных затрат энергии (мясо кушаем с картошечкой).

Когда клетка делится/размножается в процессе роста организма, ДНК как есть копируется=реплицируется. Репликацию ДНК осуществляет сложный ферментный комплекс, состоящий из 15—20 различных белков. https://ru.wikipedia.org/wiki/Репликация_ДНК

А когда зигота (две клетки = оплодотворённая яйцеклетка) делится, то там идёт перемешивание Митоз/Мейоз - https://ru.wikipedia.org/wiki/Мейоз

Написание компилятора для разных ДНК пока не представляется возможным в связи с высокой вычислительной сложностью, имитации сворачивания белков в библиотеке рантайма (см. проект folding@home).

кто такие гаплогруппы - пока сам не знаю.

Отредактировано ВежливыйЛис (2017-05-23 21:35:34)

5

Спасибо, так я сам биоинформатиком скоро стану  :crazyfun:

6

utkin написал(а):

Спасибо, так я сам биоинформатиком скоро стану  :crazyfun:

Расскажи, пожалуйста, каков твой план становления биоинформатиком? Как ты собираешься получать синтезированную ДНК? Откуда ты возмёшь химическую лабораторию? Вот отправишь резюме, а тебе HR-ка отпишет: "вы сначала научитесь хоть что-нибудь делать" (реально мне такая хамка попалась).

не на эту вакансию (тут сказано - любой другой лис, это потому что я 1С не знаю)
https://blastim.ru/job/менеджер-лаборатории-3/
а на другую.

Микрософт планирует заменить бекапы на магнитные ленты бекапами на ДНК в датацентрах.
Слабо опередить и сделать российскую компанию, предлагающую такие услуги?
Сайт для продажи услуг я тебе так и быть запрограммирую, а от тебя хотелось бы экономичную возможность синтезировать (считывать дешевле) ДНК.

Облизываюсь от предвкушения, глядя на тебя, Уткин. Жду. Надеюсь. Лис.

Отредактировано ВежливыйЛис (2017-05-25 04:26:31)

7

Расскажи, пожалуйста, каков твой план становления биоинформатиком?

Это была шутка. Трагедия заключается в том, что для решения некоторой части задач на  http://rosalind.info/problems/list-view/ требуются некоторые знания по биологии.  А так вообще сами по себе эти задачки хорошая зарядка для мозга.

8

Вежливый Лис промолчал, потому что был очень вежливый.