Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~vasilisa/Rudneva_cr2.doc
Дата изменения: Wed Apr 2 16:30:04 2008
Дата индексирования: Tue Oct 2 03:25:47 2012
Кодировка: koi8-r

Поисковые слова: цинк

[pic]

Протокол к первому занятию студентки второго курса Рудневой Василисы.

1-1. (*) Знакомство с базой данных GO: http://www.geneontology.org/ .
Был сделан запрос «KAD_ECOLI» в разделе «Genes or proteins», в качестве
выдачи:

|Term |Ontology |Evidence |Reference |
|protein |molecular |IPI |PMID:15690043 |
|binding |function |With | |
| | |UniProtKB:P0A8T7 | |
| | |With | |
| | |UniProtKB:P77806 | |


В терминах GO, молекулярной функцией белка KAD_ECOLI является связывание с
белком, данные были получены из физического взаимодействия.
Далее, при помощи опции «Graphical View» была получена схема.
Данную схему можно прочитать следующим образом:
Белковое связывание(GO: 0005515) является связыванием(GO: 0005488), которое
в свою очередь является молекулярной функцией(GO: 0003674), а она уже
включается в понятие «все».
Но, как оказалось, белковое связывание - это тоже не последняя ступень, оно
включает в себя множество подпунктов.
Рассмотрим для примера кальмодулиновое связывание.
Кальмодулин участвует в возбуждении гладких мышц: кальмодулин связывается с
кальцием и активирует киназу лёгких цепей миозина, которая в свою очередь
переносит фосфатную группу с АТФ на миозин. Такое фосфорилирование
запускает взаимодействие актина с миозином, а значит, и сокращение гладкой
мышцы.
Рассмотрим следующий путь:
. [pic]all : all [500952]
.
o [pic][pic]GO:0003674 : molecular_function [338428]
o
. [pic][pic]GO:0005488 : binding [93902]
.
. [pic][pic]GO:0005515 : protein binding [48252]
.
. [pic][pic]GO:0005516 : calmodulin binding [844]

.
. [pic][pic]GO:0005517 : calmodulin
inhibitor activity [8]

Графическое его отображение:

Все листья данного пути относятся к своим предшественникам как is_a.
Теперь мы дошли до конца пути, в самом низу(соответсвенно, на вершине в
графическом изображении) - «calmodulin inhibitor activity», из 8-ми
предложенных продуктов генов, выберем белок крысы (Rattus norvegicus)
GRM5_RAT(TAS: Traceable Author Statement, значит, этому можно верить; в
поддержку прилагается ссылка на статью в PubMed). Данный белок является
метаботропным предшественником рецептора глутамата 5 (mGluR5), его
последовательность состоит из 1203 аминокислотных остатков.
Может присутствовать альтернативный сплайсинг, получаются две изоформы:
5b (IsoId=P31424-1) и 5a (IsoId=P31424-2).
Активируется квисквалатом > глутамат > ибутенат > транс-1- аминоциклопентил-
1,3-дикарбоксилат. Принадлежит к семейству связанных с G-белком рецепторов
типа 3, является продуктом гена с GeneID=24418.
Его UniProt AC= P31424. В базе данных UniProt нашлись ссылки на интересные
статьи про этот белок, например, статья 1993 года "A variant of
metabotropic glutamate receptor subtype 5: an evolutionally conserved
insertion with no termination codon." Авторов Minakami R., Katsuki F.,
Sugiyama H. К сожалению, полного текста статьи найти не удалось.
Там же многое говорится о механизме работы белка. Это мебранный белок,
широко распространен в нейронах ЦНС. Его активность регулируется G-белком,
который активирует внутриклеточную систему второго посредника
фосфатидилинозитола и генерирует ток Cl-. Может присутствовать
альтернативный сплайсинг, получаются две изоформы:
5b (IsoId=P31424-1) и 5a (IsoId=P31424-2).
Активируется квисквалатом > глутамат > ибутенат > транс-1- аминоциклопентил-
1,3-дикарбоксилат. Принадлежит к семейству связанных с G-белком рецепторов
типа 3.
В базе данных GO в его описание входит 12 терминов, приведённых в таблице:
|Term|Ontology |Evidence |Reference |Assigned by| |
| |Постсинаптическа|компонент |TAS |PMID:109361|UniProt|
| |я мембрана |клетки | |69 |KB |
| | | | | | |
| |Кальмодолуновый |Молекулярн|TAS |PMID:120213|UniProt|
| |ингибитор |ая функция| |91 |KB |
| | | | | | |
| |Связывание с PDZ|Молекулярн|TAS |PMID:109361|UniProt|
| |доменом |ая функция| |69 |KB |
| | | | | | |
| |PLC активация | |TAS |PMID:157581|UniProt|
| |метаботропного |Молекулярн| |84 |KB |
| |рецептора |ая функция| | | |
| |глутамата | | | | |
| | | | | | |
| | | |TAS |PMID:125142| |
| | | | |08 | |
| | | | | | |
| |Белковое |Молекулярн|IPI |PMID:157581|UniProt|
| |сявзывание |ая функция| |84 |KB |
| | | | | | |
| | | |С | | |
| | | |UniProtKB:Q9Z2| | |
| | | |14 | | |
| | | |С | | |
| | | |UniProtKB:O888| | |
| | | |01 | | |
| | | | | | |
| |Активация MAPKKK|Биологичес|IDA |PMID:157581|UniProt|
| |активности |кий | |84 |KB |
| | |процесс | | | |
| | | | | | |
| |Активация | |IDA |PMID:125142|UniProt|
| |протеин киназы C|Биологичес| |08 |KB |
| | |кий | | | |
| | |процесс | | | |
| | | | | | |
| | | |TAS |PMID:157581| |
| | | | |84 | |
| | | | | | |
| |Десенситивизация|Биологичес|IDA |PMID:125142|UniProt|
| |связанного с |кий | |08 |KB |
| |G-белком |процесс | | | |
| |рецептора | | | | |
| |белкового | | | | |
| |сигнального пути| | | | |
| | | | | | |
| |Повышение |Биологичес|TAS |PMID:157581|UniProt|
| |концентрации |кий | |84 |KB |
| |ионов кальция во|процесс | | | |
| |время | | | | |
| |сигнального | | | | |
| |каскада G-белка,| | | | |
| |связанного со | | | | |
| |вторым | | | | |
| |посредником | | | | |
| |инозитоллтрифосф| | | | |
| |ата (активация | | | | |
| |фосфолипазы C) | | | | |
| | | | | | |
| |Метаботропный |Биологичес|TAS |PMID:125142|UniProt|
| |рецептор |кий | |08 |KB |
| |глутамата, |процесс | | | |
| |фосфолипазный | | | | |
| |путь | | | | |
| | | | | | |
| |Фосфоинозитидный|Биологичес|TAS |PMID:157581|UniProt|
| |сигнальный |кий | |84 |KB |
| |каскад |процесс | | | |
| | | | | | |
| |Аминокислотная | |IDA |PMID:157581|UniProt|
| |фосфориляция |Биологичес| |84 |KB |
| | |кий | | | |
| | |процесс | | | |
| | | | | | |

Итак, опишем данный путь.
Ингибитор кальмодулина (нет определения) GRM5_RAT является белком,
связывающим кальмодулин (селективно взаимодействует с
кальмодулином),этот процесс в свою очередь является процессом
связывания белка (селективное взаимодействие с любым белком или
белковым комплексом), который является процессом
связывания(селективное, часто стехиометрическое взаимодействие одной
молекулы с одним или несколькими специфическими сайтами другой). А
процесс связывания является молекулярной функцией (элементарная
активность, такая как катализ или связывание, определяющая действия
продукта гена на молекулярном уровне. Продукт гена может выполнять
одну или несколько функций). Молекулярная функция уже является частью
всего (этот термин наиболее общий термин из всех возможных).

1-2. Вопрос: насколько полно описаны в унифицированных терминах БД GO
протеомы прокариот?
Заданный мне штамм бактерии:

|Фамилия|Имя |user |Genus |Species |ID |PDB |GO in |
| | | | | | | |entry |
|Руднева|Василиса |vasilisa|Candidatus |Pelagibacte|KAD_ECOLI |1AKE | |
| | | | |r | | | |

На сайте EBI => Genome Reviews (http://www.ebi.ac.uk/genomes/bacteria.html)
был определён идентификатор полного генома данного штамма:

| |
|species Candidatus Pelagibacter ubique |
|117 Candidatus Pelagibacter ubique HTCC1062 1,308,759 CP000084 CP000084 |
|Proteome |

Pelagibacter ubique принадлежит к SAR11 таксону, состоящему из небольших
гетеротрофных морских альфа-протеобактерий, которые обитают в морях, где
они составляют около 25% всей микробной флоры. P.ubique имеет наименьший
геном среди всех свободно-живущих микроорганизмов. Имеет полные
биосинтетические пути для всех 20 аминокислот. Не имеет псевдогенов,
экстрахромосомных элементов, транспозонов (участки генома с непостоянной
локализацией), интронов или интеинов (белковых интронов).

Определение числа белков в протеоме:
Proteome -> Proteome Analysis -> Select analysis: General Statistics.
Результат:

|Oscode |Number of |Proteins with|Number of |Number of |
| |proteins in |InterPro |signatures |InterPro |
| |proteome |matches (% of| |entries |
| | |all proteins)| | |
|PELUB |1354 |1166 (86.12%)|3014 |1764 |

Таким образом, число белков в протеоме - 1354.
Был произведён поиск на странице http://srs.ebi.ac.uk по базе данных
UniProt, в Extended query form в разделе DbXref указан идентификатор
CP000084, в графе Links subentry fields указано go.
В результате в 1069 идентификаторах UniProt нашлись идентификаторы GO.
Можно сделать вывод о том, что не все белки имеют записи GO, а примерно
78.95%.
Если не выбирать в графе Links subentry fields указано go, то в выдаче
будет 1354 записи, то есть все белки протеома Candidatus Pelagibacter
ubique аннотированы в UniProt.
В графе Display Options выбрана опция Complete entries.
Результаты сохранены в виде File(text), занесены в таблицу Excel, таблица
приведена к требуемому виду:
Сначала файл выдачи был обработан в программе WordPad - проведены замены с
учетом регистра ID -> ID; DR -> DR;
Далее, в соответствии с заданием вставлены три пустых колонки слева и
пустая первая строка для названий колонок, в первой колонке вставлены
номера строк (1, 2, 3, .) чтобы можно было восстановить порядок строк после
неудачной их сортировки, во второй колонке вставлены название бактерии
(Candidatus Pelagibacter ubique), в третей колонке вставлены ID записи о
белке при помощи формулы «=ЕСЛИ((ЛЕВСИМВ(C2;2)="ID");E2;D1)»
Затем при помощи опции Excel автофильтр (Данные -> Фильтр -> Автофильтр)
были выбраны строчки, содержащие поле ID и удалены. (Изначальный вариант
таблицы до удаления строк, содержащий формулы можно посмотреть на листе
wgetz, окончательный вариант - на листе proteom_GO).

Таким образом, в таблице получилось 2855 записей, то есть, в среднем на
одну UniProt запись пришлось 2.67 записи GO, то есть примерно 3, что
ожидаемо, поскольку логично, что каждому идентификатору UniProt как минимум
должны присваиваться 3 идентификатора GO: C, F, P, минимально необходимые
для того, чтобы в полной мере описать местонахождение белка в клетке,
процесс, в котором он участвует и его непосредственную роль в этом
процессе.
Однако, стоит отметить, что многим идентификаторам UniProt соответствует
всего 1 идентификатор GO.
Самое большое число записей GO приходится на запись UniProt Q4FL07_PELUB_7,
их 8:

| |5737 | C |cytoplasm |
|Q4FL07_PELUB_7 | | | |
| |8777 | F |acetylornithine deacetylase |
|Q4FL07_PELUB_7 | | |activity |
| |50897 | F |cobalt ion binding |
|Q4FL07_PELUB_7 | | | |
| |8237 | F |metallopeptidase activity |
|Q4FL07_PELUB_7 | | | |
| |46983 | F |protein dimerization activity |
|Q4FL07_PELUB_7 | | | |
| |8270 | F |zinc ion binding |
|Q4FL07_PELUB_7 | | | |
| |6526 | P |arginine biosynthetic process |
|Q4FL07_PELUB_7 | | | |
| |6508 | P |proteolysis |
|Q4FL07_PELUB_7 | | | |

Это цитоплазматический белок, участвующий в процессе биосинтеза аргинина и
протеолиза, имеющий ацетилорнитин деацетилазную, металлопептидазную и
димеризационную активности, а также способный связывать ионы кобальта и
цинка.
Можно сделать вывод о том, что данный белок довольно хорошо изучен,
поскольку в идеале, на каждый идентификатор UniProt должно приходиться
множество идентификаторов GO, потому что белкам свойственна
«многофункциональность».

Особенно меня заинтересовал белок с UniProt ID=KAD_PELUB_7, поскольку
изучаемый мною уже 2 года белок из E.coli называется KAD_ECOLI, а,
следовательно, выполняет сходную функцию, для белка из Candidatus
Pelagibacter ubique представлено:

| KAD_PELUB_7 |4017 | F |adenylate kinase activity |
| KAD_PELUB_7 |5524 | F |ATP binding |
| KAD_PELUB_7 |9165 | P |nucleotide biosynthetic process |

То есть этот белок участвует в процессе биосинтеза нуклеотидов: связывается
с ATP и проявляет аденалят киназную активность.
А для белка KAD_ECOLI приведено:

| KAD_ECOLI_16| | F | protein binding |
| |5515 | | |

Данные для KAD_ECOLI получены аналогично.
Заметно, что для белка KAD_PELUB_7 описано 3 функции, причём две из них -
молекулярные функции, а одна - биологический процесс, в котором данный
белок участвует, а для белка KAD_ECOLI представлена только 1 функция,
являющаяся биологическим процессом, что, в принципе, является более общей
характеристикой. Странно то, что не указывается для KAD_ECOLI аденалят
киназной активности, в то время как его аннотация в UniProt: Adenylate
kinase (EC 2.7.4.3) (ATP-AMP transphosphorylase) (AK).

Статистика:
. P=Biological process terms (биологический процесс) 969
. F=Molecular function terms (молекулярная функция) 1509
. C=Cellular component terms (компонент клетки) 369
Таким образом, наиболее представленными терминами в геноме Candidatus
Pelagibacter ubique являются термины, связанные с молекулярной функцией.
Далее приведены наиболее часто встречающиеся из них:

|GO_ID |Go_name |Встретилась (раз) |
|5524 |ATP binding |125 |
|5215 |transporter activity |40 |
|16491 |oxidoreductase activity |38 |
|3677 |DNA binding |37 |
|5488 |binding |36 |
|19843 |rRNA binding |26 |
|16740 |transferase activity |24 |
|5506 |iron ion binding |23 |
|16887 |ATPase activity |22 |
|16787 |hydrolase activity |21 |
|3824 |catalytic activity |20 |

Также, очень распространена функция связывания ионов металлов: цинка,
магния; сахаров, NADH и т.п.
Функция связывания с ATP присутствует у такого большого количества белков
Candidatus Pelagibacter ubique потому, что все энергозатратные процессы
клетки (а их огромное количество) подразумевают связывание с ATP.
Разнообразие белков, обладающих транспортной активностью так же понятно,
как и, например, разнообразие ДНК-связывающих белков (они могут выполнять,
как регулирующую, так и защитную или репарационную роли, участвовать в
транскрипции), странным кажется только то, что очень много разных белков,
способных связываться с ионами железа, но, возможно, это связано с
условиями жизни и особенностями питания бактерии.

Наиболее часто среди биологических процессов встречаются:

|GO_ID |Go_name |Встретилась (раз) |
|8152 |metabolic process |82 |
|6118 |electron transport |59 |
|6810 |transport |57 |
|6412 |translation |56 |
|6508 |proteolysis |24 |
|6355 |regulation of transcription, DNA-dependent |23 |
|9058 |biosynthetic process |23 |

То есть процессами, протекающими в клетках Candidatus Pelagibacter ubique с
участием наибольшего числа разнообразных белков, являются метаболические
процессы, транспорт электронов и клеточный транспорт, трансляция.
Среди компонентов клетки:

|GO_ID |Go_name |Встретилась (раз) |
|16021 |integral to membrane |129 |
|5737 |cytoplasm |61 |
|16020 |membrane |48 |
|5622 |intracellular |17 |
|5886 |plasma membrane |15 |
|9276 |1-2nm peptidoglycan-based cell wall |11 |
|30288 |outer membrane-bounded periplasmic space |10 |

То есть наиболее распространены в протеоме интегральные мембранные белки.
Основной особенностью таких белков является то, что они как бы погружены в
мембрану клетки. Это происходит за счёт сродства одной части белка к
гидрофобным хвостам липидной молекулы и сродства другой его части к
гидрофильным головкам, поэтому любое перемещение относительно мембраны
клеток является энергетически невыгодным. Наличие такого большого числа
интегральных мембранных белков можно объяснить тем, что Candidatus
Pelagibacter ubique - одноклеточный организм, а, следовательно, бактерия
должна активно контактировать с внешней средой, поэтому, в качестве
сигнальной система, она нуждается в большом числе разнообразных
интегральных мембранных белков.
Достаточно разнообразен состав и цитоплазматических, и мембранных, и
межклеточных белков.
Более подробную статистику можно увидеть на листе pvTable Excel-книги.

1-5. (*)Имеют ли бактерии какое-либо отношение к апоптозу эукариот? Если
да, то пользуясь БД GO, найдите пример бактериального белка - фактора
апоптоза и объясните какое именно отношение он имеет к апоптозу.

Часть 1.
По запросу «apoptosis» было обнаружено 79 ссылок. Среди них подходящие:
positive regulation by organism of apoptosis in other organism during
symbiotic interaction ; GO:0052501
positive regulation by symbiont of host apoptosis ; GO:0052151
induction by symbiont of host apoptosis ; GO:0052030
induction by virus of host apoptosis ; GO:0019051
По этим идентификаторам GO был произведён поиск в SRS, но, к сожалению,
ничего найти не удалось, даже при поиске AllText.
В последнем случае был найден белок вируса, вызывающего анемию у кур (62
результата), соответствующий идентификатору GO:0019051.То есть вирусы могут
иметь отношение к апоптозу у эукариот.
induction of apoptosis ; GO:0006917
Не встречается у бактерий. В соответствии с GO, это процесс, который
целенаправленно активирует все ступени, необходимые для клеточной смерти в
результате апоптоза. Поскольку в SRS нет данных о наличии таких белков у
бактерий, найдём ортологов такого белка, например, человека при помощи
программ пакета BLAST в организме бактерии. Рассмотрим следующий белок
человека: DAP1_HUMANего AC=P51397, так как в его описании говорится: «Death-
associated protein 1 (DAP-1)» и среди ключевых слов встречается
«apoptosis», то есть его можно считать фактором апоптоза.
Его аминокислотная последовательность:
>uniprot|P51397|DAP1_HUMAN Death-associated protein 1 (DAP-1).
MSSPPEGKLETKAGHPPAVKAGGMRIVQKHPHTGDTKEEKDKDDQEWESPSPPKPTVFIS
GVIARGDKDFPPAAAQVAHQKPHASMDKHPSPRTQHIQQPRK

Программа protein BLAST ничего не нашла (ограничение по таксону -
Bacteria).

Рассмотрим тогда белок мыши BAD_MOUSE, его AC=Q61337, его аминокислотная
последовательность:
>uniprot|Q61337|BAD_MOUSE Bcl2 antagonist of cell death (BAD) (Bcl-2-
binding component 6) (Bcl- xL/Bcl-2-associated death promoter)....
MGTPKQPSLAPAHALGLRKSDPGIRSLGSDAGGRRWRPAAQSMFQIPEFEPSEQEDASAT
DRGLGPSLTEDQPGPYLAPGLLGSNIHQQGRAATNSHHGGAGAMETRSRHSSYPAGTEEDEGMEEELSPFRGRSRS
APPNLWAAQRYGRELRRMSDEFEGSFKGLPRPKSAGTATQMRQSAGWTRIIQSWWDRNLGKGGSTPSQ

Программа protein BLAST выдала результаты с лучшим e-value 1.3.

Рассмотрим белок BAX_BOVIN из организма быка, его AC=O02703, его
аминокислотная последовательность:
>uniprot|O02703|BAX_BOVIN Apoptosis regulator BAX.
MDGSGEQPRGGGPTSSEQIMKTGALLLQGFIQDRAGRMGGETPELGLEQVPQDASTKKLSECLKRIGDELDSNMEL
QRMIAAVDTDSPREVFFRVAAEMFSDGNFNWGRVVALFYFASKLVLKALCTKVPELIRTIMGWTLDFLRERLLGWI
QDQGGWDGLLSYFGTPTWQTVTIFVAGVLTASLTIWKKMG

Лучшая находка программы protein BLAST имеет e-value 9e-10. Соответствующее
выравнивание:
Score = 65.5 bits (158), Expect = 9e-10, Method: Compositional matrix
adjust.
Identities = 46/173 (26%), Positives = 80/173 (46%), Gaps = 17/173 (9%)

Query 6 EQPRGGGPTSSEQIMKTGALLLQG---FIQDRAGRMG--GETPELGLEQVPQDASTKKLS
60
E+ R P +E M+T + + + D G G + L +V A+ K+
Sbjct 35 EENRTEAPEGTESEMETPSAINGNPSWHLADSPAVNGATGHSSSLDAREVIPMAAVKQ--
92

Query 61 ECLKRIGDELDSNMELQRMIAAVDTD------SPREVFFRVAAEMFSDGNFNWGRVVALF
114
L+ GDE + + +R + + + + + F +V E+F DG NWGR+VA F
Sbjct 93 -ALREAGDEFE--LRYRRAFSDLTSQLHITPGTAYQSFEQVVNELFRDG-VNWGRIVAFF
148

Query 115 YFASKLVLKALCTKVPELIRTIMGWTLDFLRERLLGWIQDQGGWDGLLSYFGT 167
F L ++++ ++ L+ I W +L + L WIQ+ GGWD + +G
Sbjct 149 SFGGALCVESVDKEMQVLVSRIAAWMATYLNDHLEPWIQENGGWDTFVELYGN 201

Однако данное выравнивание имеет небольшой процент идентичности.
Выравнивание, полученное программой needle:

# Length: 246
# Identity: 52/246 (21.1%)
# Similarity: 82/246 (33.3%)
# Gaps: 79/246 (32.1%)
# Score: 152.5

BAX_BOVIN 1 -----------------------------MDGSGEQPRGGGPTSSEQIMK
21
.....|:.|...|..:|..|:
1 msmamsqsnrelvvdflsyklsqkgyswsqfsdveenrteapegteseme
50

BAX_BOVIN 22 TGALLLQG----FIQDRAGRMG--GETPELGLEQVPQDASTKKLSECLKR
65
|.: .:.| .:.|.....| |.:..|...:|...|:.| :.|:.
51 tps-aingnpswhladspavngatghsssldarevipmaavk---qalre
96

BAX_BOVIN 66 IGDELDSNMELQRMIAAVDTDSPREV--------FFRVAAEMFSDGNFNW
107
.||| .||:...|..|..|...: |.:|..|:|.|| .||
97 agde----felryrrafsdltsqlhitpgtayqsfeqvvnelfrdg-vnw
141

BAX_BOVIN 108 GRVVALFYFASKLVLKALCTKVPELIRTIMGWTLDFLRERLLGWIQDQGG
157
||:||.|.|...|.::::..::..|:..|..|...:|.:.|..|||:.||
142 grivaffsfggalcvesvdkemqvlvsriaawmatylndhlepwiqengg
191

BAX_BOVIN 158 WDGLLSYFGTPTWQTVTIFVAGVLTASLTIWKKMG----------- 192
||..:..:|. :.....:.|
192 wdtfvelygn----------------naaaesrkgqerlehhhhhh 221

Глобальное выравнивание в данном случае несколько хуже. В любом случае, при
таких показателях идентичности, делать предположения о наличии гомологии
нельзя, даже хотя бы потому, что лучшая находка имеет следующее описание:
«An Inhibitor Of Programmed Cell Death».

Тогда рассмотрим белок человека с описанием Death-associated protein kinase
1 (EC 2.7.11.1) (DAP kinase 1). Его ID=DAPK1_HUMAN, AC=P53355.
Аминокислотная последовательность:
>uniprot|P53355|DAPK1_HUMAN Death-associated protein kinase 1 (EC 2.7.11.1)
(DAP kinase 1)....
MTVFRQENVDDYYDTGEELGSGQFAVVKKCREKSTGLQYAAKFIKKRRTKSSRRGVSRED
IEREVSILKEIQHPNVITLHEVYENKTDVILILELVAGGELFDFLAEKESLTEEEATEFL
KQILNGVYYLHSLQIAHFDLKPENIMLLDRNVPKPRIKIIDFGLAHKIDFGNEFKNIFGT
PEFVAPEIVNYEPLGLEADMWSIGVITYILLSGASPFLGDTKQETLANVSAVNYEFEDEY
FSNTSALAKDFIRRLLVKDPKKRMTIQDSLQHPWIKPKDTQQALSRKASAVNMEKFKKFA
ARKKWKQSVRLISLCQRLSRSFLSRSNMSVARSDDTLDEEDSFVMKAIIHAINDDNVPGL
QHLLGSLSNYDVNQPNKHGTPPLLIAAGCGNIQILQLLIKRGSRIDVQDKGGSNAVYWAA
RHGHVDTLKFLSENKCPLDVKDKSGEMALHVAARYGHADVAQVQVLCSFGSNPNIQDKEE
ETPLHCAAWHGYYSVAKALCEAGCNVNIKNREGETPLLTASARGYHDIVECLAEHGADLN
ACDKDGHIALHLAVRRCQMEVIKTLLSQGCFVDYQDRHGNTPLHVACKDGNMPIVVALCE
ANCNLDISNKYGRTPLHLAANNGILDVVRYLCLMGASVEALTTDGKTAEDLARSEQHEHV
AGLLARLRKDTHRGLFIQQLRPTQNLQPRIKLKLFGHSGSGKTTLVESLKCGLLRSFFRR
RRPRLSSTNSSRFPPSPLASKPTVSVSINNLYPGCENVSVRSRSMMFEPGLTKGMLEVFV
APTHHPHCSADDQSTKAIDIQNAYLNGVGDFSVWEFSGNPVYFCCYDYFAANDPTSIHVV
VFSLEEPYEIQLNQVIFWLSFLKSLVPVEEPIAFGGKLKNPLQVVLVATHADIMNVPRPA
GGEFGYDKDTSLLKEIRNRFGNDLHISNKLFVLDAGASGSKDMKVLRNHLQEIRSQIVSV
CPPMTHLCEKIISTLPSWRKLNGPNQLMSLQQFVYDVQDQLNPLASEEDLRRIAQQLHST
GEINIMQSETVQDVLLLDPRWLCTNVLGKLLSVETPRALHHYRGRYTVEDIQRLVPDSDV
EELLQILDAMDICARDLSSGTMVDVPALIKTDNLHRSWADEEDEVMVYGGVRIVPVEHLT
PFPCGIFHKVQVNLCRWIHQQSTEGDADIRLWVNGCKLANRGAELLVLLVNHGQGIEVQV
RGLETEKIKCCLLLDSVCSTIENVMATTLPGLLTVKHYLSPQQLREHHEPVMIYQPRDFF
RAQTLKETSLTNTMGGYKESFSSIMCFGCHDVYSQASLGMDIHASDLNLLTRRKLSRLLD
PPDPLGKDWCLLAMNLGLPDLVAKYNTNNGAPKDFLPSPLHALLREWTTYPESTVGTLMS
KLRELGRRDAADFLLKASSVFKINLDGNGQEAYASSCNSGTSYNSISSVVSR

Программа protein BLAST выдала 218(!) находок, все - с хорошим e-value.
Выбрали одну из лучших находок по параметру Identities и не гипотетическую:
AAW23170 ankyrin domain protein [Wolbachia pipientis]. На сайте SRS была
найдена информация об этом белке:
ID=Q49S18_WOLPI, это фрагмент белка с AC=Q49S18 Ankyrin domain protein, его
домен в Pfam - PF00023. Этот домен совпадает с одним из доменов выбранного
белка DAPK1_HUMAN из организма человека (всего их три: PF00023, PF00069,
PF00531). На базе данных Pfam выяснено, что домен PF00531(Death domain)
обычно связывают с апоптозом, а про PF00023 такой информации нет. При
поиске по SRS (запрос PF00531) обнаружилось 535 записей в UniProt, но среди
них не было белков бактерий. Остальные находки программы BLAST ссылаются на
белки, содержащие PF00023(Ankyrin repeat) домен, поэтому тоже не подходят.
Итак, не было найдено подходящих белков.

Часть 2.
Был произведён поиск на сайте SRS: в строке AllText- apoptosis, Taxpnomy -
bacteria, по запросу найдено 44 записи. Был выбран белок с ID=OMP38_ACIBA и
AC=Q6RYW5 из организма Acinetobacter baumannii (Bacteria; Proteobacteria;
Gammaproteobacteria; Pseudomonadales; Moraxellaceae; Acinetobacter). Это
предшественник белка внешней мембраны omp38 (он же ompA).Этот белок
индуцирует апопотоз в клетках гортанного эпителия человека: он проникает в
клетку и локализуется в митохондриях, что приводит к высвобождению, что
приводит к высвобоздению таких проапоптотических молекул, как цитохром с и
AIF (апоптоз-индуцирующий фактор). Его аминокислотная последовательность:

>uniprot|Q6RYW5|OMP38_ACIBA Outer membrane protein omp38 precursor (Outer
membrane protein ompA) (Outer membrane protein ompAb)....
MKLSRIALATMLVAAPLAAANAGVTVTPLLLGYTFQDSQHNNGGKDGNLTNGPELQDDLF
VGAALGIELTPWLGFEAEYNQVKGDVDGASAGAEYKQKQINGNFYVTSDLITKNYDSKIK
PYVLLGAGHYKYDFDGVNRGTRGTSEEGTLGNAGVGAFWRLNDALSLRTEARATYNADEE
FWNYTALAGLNVVLGGHLKPAAPVVEVAPVEPTPVAPQPQELTEDLNMELRVFFDTNKSN
IKDQYKPEIAKVAEKLSEYPNATARIEGHTDNTGPRKLNERLSLARANSVKSALVNEYNV
DASRLSTQGFAWDQPIADNKTKEGRAMNRRVFATITGSRTVVVQPGQEAAAPAAAQ

Данный белок содержит домен OmpA с 233 по 329 а.а., этот домен встречается
в C-терминальных участках многих белков внешней мембраны грам-отрицательных
бактерий.




Протокол ко второму занятию студентки второго курса Рудневой Василисы.

2-1. Объяснить, что значит данный код фермента. В отчете привести данный
код и расшифровку каждого его пункта - на английском и на русском языках.
Заданный мне код фермента:

|Фамилия |Имя |user |Genus |Species |EC_number |
|Руднева |Василиса |vasili|Candidatus|Pelagibacte|4.1.1.22 |
| | |sa | |r | |

Воспользовалась сервисом INTERNATIONAL UNION OF BIOCHEMISTRY AND MOLECULAR
BIOLOGY (IUBMB)
Перешла по ссылке Enzyme Nomenclature(Номенклатура Ферментов). Там
выяснила, что если фермент имеет в EC номере первую цифру 4, то это значит,
что данный фермент относится к лиазам. Далее, в разделе, посвящённом
лиазам, перешла по ссылке Introduction. Там выяснила, что лиазы - это
ферменты, расщепляющие C-C, С-O, С-N и другие связи не при помощи гидролиза
или оксидации: молекула уничтожается, в результате чего возникает либо
новая двойная связь, либо новое ароматическое кольцо. Систематическое
название формируется в соответствии с субстратом лиазы. Тривиальные
названия образуются с использованием таких терминов, как декарбоксилаза,
альдолаза и т.п. Так, «дегидратазами» называются лиазы, уничтожающие воду.
В случаях, если более важна обратная реакция, может использоваться термин
«синтаза».
Вторая цифра в EC - 1 означает, что это лиаза углерод-углеродной связи.
Этот подкласс содержит декарбоксилазы(EC 4.1.1),альдегид-лиазы(EC 4.1.2), и
оксо-кислотные-лиазы(EC 4.1.3).
В данном случае, мы имеем дело с гистидин-декарбоксилазой (см. здесь).

Итак:
|Номер в EC |Английский |Русский |
|EC 4 |Lyase |Лиаза |
|EC 4.1 |Carbon-Carbon Lyase |Лиаза углерод-углеродной связи |
|EC 4.1.1 |Decarboxylase |Декарбоксилаза |
|EC 4.1.1.22 |Histidine Decarboxylase |Гистидин-декарбоксилаза |

EC 4.1.1.22
Accepted name: histidine decarboxylase
Reaction: L-histidine = histamine + CO2
Other name(s): L-histidine decarboxylase
Systematic name: L-histidine carboxy-lyase
Comments: A pyridoxal-phosphate protein (in animal tissues). The bacterial
enzyme has a pyruvoyl residue as prosthetic group.
Links to other databases: BRENDA, EXPASY, KEGG, ERGO, PDB, CAS registry
number: 9024-61-7
References:
1. Epps, H.M.R. Studies on bacterial amino-acid decarboxylases. 4. l(-)-
Histidine decarboxylase from Cl. welchii type A. Biochem. J. 39 (1945) 42-
46.
2. Riley, W.O. and Snell, E.E. Histidine decarboxylase of Lactobacillus
30a. IV. The presence of covalently bound pyruvate as the prosthetic group.
Biochemistry 7 (1968) 3520-3528. [PMID: 5681461]
3. Rosenthaler, J., Guirard, B.M., Chang, G.W. and Snell, E.E. Purification
and properties of histidine decarboxylase from Lactobacillus 30a. Proc.
Natl. Acad. Sci. USA 54 (1965) 152-158. [PMID: 5216347]
(*) Ознакомимся с дополнительной информацией о ферменте.
Из Большой Советской Энциклопедии.
Декарбоксилирование гистидина ведёт к образованию биологически активного
амина - гистамина; этот процесс катализирует гистидин-декарбоксилаза -
фермент, относящийся к классу лиаз. Фермент действует только на L-изомер
(природную форму) гистидина. Реакция обратимо тормозится ингибиторами
дыхания - цианидом, гидроксиламином, семикарбазидом.


А. А. Болдырев, Е. В. Петушкова.
На сайте PDB.
Изображение активного центра гистидин-декарбоксилазы(см. здесь).

Гистидин-декарбоксилаза бактерии Lactobacillus участвует в производстве
клеткой гистамина, необходимого для оптимизации клеточного роста.

Общий вид структуры: [pic]
(Из Lactobacillus)


На базе данных BRENDA.
Эта база данных предоставляет самую разнообразную информацию о белках, в
соответствии с выполняемой ими функцией(EC): информация об организмах,
тканях, локализации в клетках, ссылки на статьи в PubMed,
последовательности белков и их 3D структура, молекулярная масса, лиганды,
филогенетические деревья организмов, информация о реакциях, оптимальных pH
и температуре, субстратах, продуктах, ингибиторах и т.п.
По данным базы данных BRENDA, данный фермент встречается в следующих
организмах:
Erwinia sp., Homo sapiens ,Lactobacillus sp., Morganella morganii, Mus
musculus, Photobacterium damselae, Photobacterium phosphoreum, Proteus
vulgaris, Raoultella planticola, Rattus norvegicus
Рассмотрим на примере мыши (Mus musculus).

| |
|[pic] |
|Taxonomy () |
| |
|[pic] |
|[pic] |
|cellular organisms |
| |
|[pic][pic] |
|[pic] |
|Eukaryota (superkingdom) |
| |
|[pic][pic][pic] |
|[pic] |
|Fungi/Metazoa group |
| |
|[pic][pic][pic][pic] |
|[pic] |
|Metazoa (kingdom) |
| |
|[pic][pic][pic][pic][pic] |
|[pic] |
|Eumetazoa |
| |
|[pic][pic][pic][pic][pic][pic] |
|[pic] |
|Bilateria |
| |
|[pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Coelomata |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Deuterostomia |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Chordata (phylum) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Craniata (subphylum) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Vertebrata |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c] |
|[pic] |
|Gnathostomata (superclass) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic] |
|[pic] |
|Teleostomi |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic] |
|[pic] |
|Euteleostomi |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic] |
|[pic] |
|Sarcopterygii |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic] |
|[pic] |
|Tetrapoda |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic] |
|[pic] |
|Amniota |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Mammalia (class) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Theria |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Eutheria |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Euarchontoglires (superorder) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Glires |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic] |
|[pic] |
|Rodentia (order) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][|
|pic] |
|[pic] |
|Sciurognathi (suborder) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][|
|pic][pic] |
|[pic] |
|Muroidea |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][|
|pic][pic][pic] |
|[pic] |
|Muridae (family) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][|
|pic][pic][pic][pic] |
|[pic] |
|Murinae (subfamily) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][|
|pic][pic][pic][pic][pic] |
|[pic] |
|Mus (genus) |
| |
|[pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pi|
|c][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][pic][|
|pic][pic][pic][pic][pic][pic] |
|[pic] |
|Mus musculus (species |
| |


(Дерево приведено на сайте BRENDA.)
Список приведённой по этому поводу литературы:
. Expression of 74-kDa histidine decarboxylase protein in a macrophage-
like cell line RAW 264.7 and inhibition by dexamethasone.

Hirasawa N, Murakami A, Ohuchi K. (651193)
. Elevation of histidine decarboxylase activity in the stomach of mice
by ulcerogenic drugs.

Ayada K, Oguri S, Yamaguchi K, Kumagai K, Endo Y. (651196)
. Induction of the activity of the histamine-forming enzyme, histidine
decarboxylase, in mice by IL-18 and by IL-18 plus IL-12.

Yamaguchi K, Motegi K, Kurimoto M, Endo Y. (651498)
. Expression of L-histidine decarboxylase in mouse male germ cells.

Safina F, Tanaka S, Inagaki M, Tsuboi K, Sugimoto Y, Ichikawa A.
(652237)
Схема соответствующей реакции:

| |=| |+| |
|[pic] | |[pic] | |[pic] |
|L-His | |Histamine | |CO2 |


Происходит при оптимальном pH=6.2, при этом pH может варьировать от 6 до
7.6 (при pH=6.0 около 50% от максимальной активности, при pH=7.6 около 40%
максимальной активности).
Данных об оптимальной температуре для мыши не приводится.
Гистидин-декарбоксилаза содержится в слизистой желудка, в тканях
почек,лимфатических узлах, молочной железе, мастоцитах, нейтрофильных
лейкоцитах.
Обычно локализована в акросомах.
Название соответствующего белка - DCHS_MOUSE, AC=P23738 (последовательность
- в файле 4_1_1_22__P23738__BRENDA_sequence.FASTA ).
Ингибиторы - Shoyuflavones(выделены из соевого соуса). Соответствующая
статья - 4156.(Novel histamine measurement by HPLC analysis used to assay
histidine decarboxylase inhibitory activity of shoyuflavones from soy
sauce.

Kinoshita E, Saito M.)





Структура ингибитора:
[pic]
Также, здесь приводится много разной полезной информации о данном белке.

На базе данных KEGG.
(Kyoto Encyclopedia of Genes and Genomes)
По данным KEGG, реакция, в которой принимает участие изучаемый фермент(L-
histidine = histamine + CO2) относится к метаболическому пути,
называющемуся «Гистидиновый метаболизм» (соответствующая схема приведена в
файле Histidine metabolism.bmp). Код этого пути в KEGG - map00340.
«Гистидиновый метаболизм» включается в «метаболизм аминокислот», который, в
свою очередь, включается в «метаболизм» - в соответствии с KEGG. Участок
пути, в котором принимает участие гистидиновая декарбоксилаза отмечен на
схеме красным овалом.
Условные обозначения:
[pic]
[pic]
Если выбрать в KEGG организм - Mus Musculus, то схема примет вид:
[pic]
Где зелёным цветом выделены метаболические пути, специфические для
организма мыши. Как и прежде, интересующий фермент и ссответствующая
реакция выделены красным овалом. Перейдя по ссылке на соответствующем
зелёном прямоугольнике 4.1.1.22, получаем страничку в KEGG с краткой
информацией о данном белке у мыши, включающей его ортологов, ссылки на
другие базы данных, ссылку на схему метаболического пути уже именно для
мыши(mmu00340), мотивы, аминокислотную и нуклеотидную последовательности.
В заключение, несколько слов о базе данных KEGG.
Эта база данных состоит из 4х основных частей: PATHWAY (взаимодействия
молекул и сети реакций, имеющие место при метаболизме, разнообразные
процессы в клетках, заболевания человека - карты(maps) были «нарисованы»
вручную по данным из литературы),BRITE (проверенные данные о различных
аспектах биологических систем - получены из опубликованных
материалов),GENES (информация об ортологах, каталоги полных и незавершённых
геномов с аннотациями, консенсусные каталоги генов, карты геномов и
информация об организмах, информация о сходстве последовательностей и
консервативных позициях),LYGAND (химические соединения, лекарства,
одобренные в С.Ш.А. и Японии, полисахариды, химические реакции, химические
структуры, номенклатура ферментов из ExplorEnz).

С сайта ERGO.
(Integrated Genomics)

Краткая информация о данном источнике информации.
Это курируемая база данных геномных ДНК и связанных с ними данных о
сходстве, функциях, метаболических путях, функциональных моделях, кластерах
и многом другом.
На этом сайте не даётся никакой новой информации по интересующему ферменту,
приводится только «локальная копия» данных из базы данных KEGG.


Вопрос: гомологичны ли белки из одного или разных организмов, обладающие
данной ферментативной активностью?

2-2. Определить гомологичны ли ферменты с одинаковым кодом из 3-х
эволюционно далеких организмов: кишечной палочки Escherichia coli K-12,
археи Methanococcus jannaschii и человека.

Как известно из предыдущего задания(база данных BRENDA), изучаемый фермент
не встречается в организмах Escherichia coli K-12 и Methanococcus
jannaschii. Поэтому рассмотрим следующие организмы: Homo sapiens,
Photobacterium phosphoreum и Mus musculus.
Итак, результаты поиска для Homo sapiens:
Найден 1 белок, его AC=P19113, его ID=DCHS_HUMAN. Его аминокислотная
последовательность:

SEQUENCE 662 AA; 74141 MW; D7611CFAAD60F469 CRC64;
MMEPEEYRER GREMVDYICQ YLSTVRERRV TPDVQPGYLR AQLPESAPED PDSWDSIFGD
IERIIMPGVV HWQSPHMHAY YPALTSWPSL LGDMLADAIN CLGFTWASSP ACTELEMNVM
DWLAKMLGLP EHFLHHHPSS QGGGVLQSTV SESTLIALLA ARKNKILEMK TSEPDADESC
LNARLVAYAS DQAHSSVEKA GLISLVKMKF LPVDDNFSLR GEALQKAIEE DKQRGLVPVF
VCATLGTTGV CAFDCLSELG PICAREGLWL HIDAAYAGTA FLCPEFRGFL KGIEYADSFT
FNPSKWMMVH FDCTGFWVKD KYKLQQTFSV NPIYLRHANS GVATDFMHWQ IPLSRRFRSV
KLWFVIRSFG VKNLQAHVRH GTEMAKYFES LVRNDPSFEI PAKRHLGLVV FRLKGPNCLT
ENVLKEIAKA GRLFLIPATI QDKLIIRFTV TSQFTTRDDI LRDWNLIRDA ATLILSQHCT
SQPSPRVGNL ISQIRGARAW ACGTSLQSVS GAGDDPVQAR KIIKQPQRVG AGPMKRENGL
HLETLLDPVD DCFSEEAPDA TKHKLSSFLF SYLSVQTKKK TVRSLSCNSV PVSAQKPLPT
EASVKNGGSS RVRIFSRFPE DMMMLKKSAF KKLIKFYSVP SFPECSSQCG LQLPCCPLQA
MV
//

В формате FASTA: DCHS_HUMAN.FASTA.
Его домен Pfam=PF00282.
Данные, приведённые про этот домен на сайте Pfam:

Gene Ontology

|Biological |carboxylic acid metabolic process |
|process |(GO:0019752) |
|Molecular |carboxy-lyase activity (GO:0016831) |
|function | |
|Molecular |pyridoxal phosphate binding |
|function |(GO:0030170) |

Дерево:
[pic]
для Photobacterium phosphoreum:
Найден 1 белок, его AC=Q846V2, ID=Q846V2_PHOPO. Его аминокислотная
последовательность:

SEQUENCE 380 AA; 42642 MW; F30912D6C0BEDAA8 CRC64;
MTLSIENQNK LDEFWAYCVK NQYFNIGYPE SADFDYTILE RFMRFSINNC GDWAEYCNYL
LNSFDFEKEV MEYFADLFKI PFEDSWGYVT NGGTESNMFG CYLGRELFPD GTLYYSKDTH
YSVAKIVKLL RIKSQLVESL PNGEIDYDDL IAKIKQDDEK HPIIFANIGT TVRGAIDDIS
KIQAMIGELG IKREDYYIHA DAALSGMILP FVDEPQGFNF ADGIDSIGVS GHKMIGSPIP
CGIVVAKKRN VDAISVEIDY ISAHDKTITG SRNGHTPLMM WCAVKSHTHE DFKRRINRSL
DLAQHAVQRL QSAGINAWCN KNSITVVFPC PSEAVWKKHC LATSGGQAHL ITTAHHLDAS
KVDALIDDVI KDANGETIAA
//

В формате FASTA: Q846V2_PHOPO.FASTA.
Домен тот же.

для Mus musculus:
Найден 1 белок, его AC=P23738, ID= DCHS_MOUSE. Его аминокислотная
последовательность:

SEQUENCE 662 AA; 74018 MW; 6B2139DE37BADB9E CRC64;
MMEPCEYREY REYYRARGKE MVDYISQYLS TVRERQVTPN VQPGYLRAQL PASAPEEPDS
WDSIFGDIER VIMPGVVHWQ SPHMHAYYPA LTSWPSLLGD MLADAINCLG FTWASSPACT
ELEMNIMDWL AKMLGLPEYF LHHHPSSRGG GVLQSTVSES TLIALLAARK NKILAMTACE
PDANESSLNA RLVAYTSDQA HSSVEKAGLI SLVKIRFLPV DDNFSLRGEA LQKAIEEDKQ
QGLVPVFVCA TLGTTGVCAF DRLSELGPIC ASEGLWLHVD AAYAGTAFLC PELRGFLEGI
EYADSFTFNP SKWMMVHFDC TGFWVKDKYK LQQTFSVNPI YLRHANSGAA TDFMHWQIPL
SRRFRSIKLW FVIRSFGVKN LQAHVRHGTE MAKYFESLVR SDPSFEIPAK RHLGLVVFRL
KGPNCLTESV LKEIAKAGQL FLIPATIQDK LIIRFTVTSQ FTTKEDILRD WHLIQEAANL
VLSQHCTSQP SPRAKNVIPP PPGTRGLSLE SVSEGGDDPA QARKIIKQPG ASLARREGGS
DLETMPDPFD DCFSEEAPNT TKHKLSSFLF SYLSVQNRRK TTRSLSCNSV PMSAQKSLPA
DASLKNGGSF RARIFSGFPE QMMMMKKGAF KKLIKFYSVP SFPECSSQCA RQLPCCPLEA
MV
//

В формате FASTA: DCHS_MOUSE.FASTA.
Домен тот же.

Сравнение доменной архитектуры в соответствии с Pfam:
| | |DCHS_HUMAN (Homo |Q846V2_PHOPO |DCHS_MOUSE (Mus |
| | |sapiens, |(Photobacterium |musculus, AC= P23738) |
| | |AC=P19113) |phosphoreum, AC= | |
| | | |Q846V2) | |
| |Идентификатор|Положение в |Положение в |Положение в |
| |, название |последовательност|последовательности |последовательности |
| |домена Pfam |и | | |
| Доме|PF00282 | 36 - 414 | 22 - 331 | 43 - 421 |
|н | | | | |

Были произведены попарные выравнивания при помощи программы needle со
стандартными настройками(соответствующие файлы лежат в директории). В
результате обнаружилось, что белки мыши и человека схожи на 91.2%, а
фотобактерии и человека - на 23.4%, мыши и фотобактерии - на 24.5%. Что, в
принципе не удивительно. Проценты совпадения для выравнивания белков:
мыши - человека - 85.8%, мыши - фотобактерии - 13.6%, человека -
фотобактерии - 13.9%.
При помощи инструмента SeqretP были вырезаны домены из последовательностей
белков. Соответствующие последовательности доменов лежат в директории и
называются соответственно: DOM_XXXXX.FASTA, где XXXXX-название организма.
Провели выравнивания, так же при помощи программы needle. Результаты лежат
в директории и называются XXXXX_YYYYY_DOM.needle, где XXXXX- название
первого организма, YYYYY- название второго организма.
Получилось, что домены мыши и человека схожи на 97.1%, а идентичны - на
93.7%. В то время как домены мыши и фотобактерии схожи на 33.1% и идентичны
на 18.4%, а человека и фотобактерии - схожи на 31.1% и идентичны на 17.9%.
То есть, выравнивание доменов показало лучшие результаты, нежели
выравнивания самих последовательностей белков, что и ожидаемо. Однако, если
говорить о гомологии, то предполагать гомологичными на основании этих
данных можно назвать только домены человека и мыши.
Итак, делаем предположение о гомологичности доменов в организмах человека и
мыши и о гомологичности исследуемых белков в целом человека и мыши. В
случае пар человек-фотобактерия и мышь-фотобактерия, предпологать
гомологичность ни у белков, ни у соответствующих доменов нельзя.
Рассмотрим консервативные позиции в изучаемом домене для этих трёх
организмов. При помощи программы ClustalW было получено выравнивание:

[pic]

Красным цветом раскрашены позиции, консервативные во всех трёх доменах,
серым - только в двух из трёх. Как видно, не так уж много позиций в ходе
эволюции сохранили свою консервативность, однако, то, что часто
консервативные во всех трёх доменах позиции идут блоками, наводит на мысли
«структурной консервативности» этих участков доменов.
Если разрешить раскраску не только идентичных, но и схожих позиций, то
будет следующая картина:
(Красным цветом обозначены не только идентичные, но и схожие позиции)
[pic]
Как видно, красного цвета стало больше=). Теперь следует проверить догадку
на 3D-структурах.

На сайте http://www.ebi.ac.uk/thornton-srv/databases/enzymes/ был проведён
поиск по EC 4.1.1.22, но были найдены PDB-файлы структур белков, полученных
из одного организма: Lactobacillus sp.. Bacteria. Strain: 30a. В данном
контексте не имеет смысла изучать эти PDB структуры, поскольку они
представляют собой одну и ту же 3D-структуру при взаимодействии с другими
молекулами. К тому же эта структура(1hq6)уже была представлена выше.
Поэтому найдём 3D-структуры, имеющие один EC номер, но взятые из разных
организмов, причём, по возможности, далёких эволюционно.

Например EC 3.4.21.5 Thrombin. Для него имеется 248 PDB-структур. В
соответствии с базой данных KEGG, для него приводится несколько синонимов:
thrombin;

fibrinogenase;

thrombase;

thrombofort;

topical;

thrombin-C;

tropostasin;

activated blood-coagulation factor II;

blood-coagulation factor IIa;

factor IIa;

E thrombin;

beta-thrombin;

gamma-thrombin
Также, в соответствии с той же базой данных, узнаём, что тромбин относится
к классу гидролаз, взаимодействующими с пептидными связями и является
сериновой пептидазой. Тромбин образуется из протромбина. Тромбин
избирательно разрушает Arg-Gly связь в фибриногене - формируется фибрин и
происходит высвобождение фибринопептидов A и B. Тромбин более изберателен,
нежели трипсин или плазмин. Относится к семейству пептидаз S1.
Ингибиторы тромбина:
Benzamidine [CPD:C01784];

D-Phe-Pro-Arg-CH2Cl [CPD:C02828];

Nalpha-(2-naphthyl-sulfonyl-glycyl)-D-p-amidinopheyl-alanylpiperadin

e [CPD:C04863];

Argatroban [CPD:C04931]
Участвует сразу в трёх метаболических путях: Нейроактивное лиганд-
рецепторное взаимодействие(map04080), комплементарный и коагуляционный
каскады(map04610), а также в регуляции актинового цитоскелета(map04810).
Были рассмотрены 3D-структуры тромбина быка (1tbq_1.pdb) и человека
(1a46.pdb).
Структура тромбина быка содержит 4 цепи:
[pic]
См файл 1tbq_1.gif

Структура тромбина человека содержит 5 цепей.
[pic]
См файл 1a46.gif

Обе структуры представляют собой комплексы с ингибиторами, визуально
различаются.
Попытки совместить обе структуры не увенчались успехом (пыталась совместить
по красной спирали):
[pic]
Файл together.gif.
Структура тромбина человека раскрашена золотистым цветом.
-----------------------
Микрофотография клеток SAR11. Для
срав????????????????????????????????????????????????????????????????????????
????????????????????????????????????????????????????????????????????????????
????? 0,5 микрона (фото с сайта oregonstate.edu)