Средствами поисковой системы
SRS в БД
Swiss-Prot были найдены последовательности заданной выборки. Полученный список был отредактирован удалением белковых фрагментов (последовательностей короче 90 а.о.) и белков из разных подвидов одного вида.
Файл с аминокислотными последовательностями выборки лежит
здесь. Список организмов находится
здесь.
Множественное выравнивание и филогенетическое дерево белков было построено с помощью инструмента ClustalX. Визуализация проводилась в GeneMaster.
Ортологами называются белки, возникшие из общего предка в процессе видообразования. Также, обычно, они имеют схожие функции. Как следствие, потенциальными ортологами можно считать близкорасположенные на филогенетическом дереве белки из родственных организмов.
Используя это правило можно определить
6 пар явных
ортологов: это группы
C,
D,
F,
H,
J и
M.
Еще в
4-х случаях (
A,
B,
K,
L) мы можем проследить ортологию одного белка какому-либо из двух других (например, в группе
A, белок
Q4JDG2_9CHON может быть ортологичен как
Q4JDG4_BATEA, так и
HBA_BATEA), при этом сделать какие-либо выводы насчет ортологичной пары можно только по схожести-различию функций. К сожалению, функции белков изучаемого семейства не отличаются особым разнообразием, что не позволяет использовать этот метод.
Группа
G аналогична вышеописанным, за исключением того, что в ней возможны 5 вариантов попарной ортологии.
Паралогами называются белки, возникшие в ходе дупликации какого-либо гена. Как следствие, паралоги по определению принадлежат одному виду и, как правило, имеют разные функции.
Таким образом к паралогам можно отнести группы E и I, белки одного организма из групп A, B, K и L.
В группе G можно предположить наличие двух пар паралогов, однако возможен и иной вариант: белки HBD_LOXAF, HBD_ELEMA и HBB_LOXAF, HBB_ELEMA являются соответствующими парами ортологов, в этом случае паралогия в данной групппе отсутствует.