UGENE Forum
https://forum.ugene.net/forum/YaBB.pl
General Category >> Forum in Russian language ([ch1056][ch1091][ch1089][ch1089][ch1082][ch1086][ch1103][ch1079][ch1099][ch1095][ch1085][ch1099][ch1081] [ch1092][ch1086][ch1088][ch1091][ch1084]) >> HMMER-профиль и поиск ортрлогов
https://forum.ugene.net/forum/YaBB.pl?num=1375456906

Message started by Natasha on Aug 2nd, 2013 at 10:21pm

Title: HMMER-профиль и поиск ортрлогов
Post by Natasha on Aug 2nd, 2013 at 10:21pm
Здравствуйте! Не поможете разобраться?
Если у меня есть одиночная белковая последовательность, не выравнивание, как мне проще получить ее HMMER-профиль? phmmer вроде подходит, и профиль использует, и с одиночной последовательностью работает,
но как в явном виде профиль из него вытребовать?
Очень много программ в составе HMMER3, я в них уже путаюсь,
а воз и ныне там. Я хочу обойти выравнивание - это возможно?
По PFAM номеру можно получить профиль или все же нельзя?
Хотя, если в белке несколько доменов, PFam номеров тоже несколько.Как с этим быть?
А с профилем потом искать ортологи вроде проще, если правильно задать базу данных и выбрать нужную программу - какую правильно выбрать и как задать правильно
базу данных, в каком формате и какую?
Подскажите последовательность действий,
я ее так и не вывела сама из manuala.
СПАСИБО!

Title: Re: HMMER-профиль и поиск ортрлогов
Post by German Grekhov on Aug 9th, 2013 at 10:36am
Здравствуйте. Извините за долгий ответ.

Чтобы получить HMMER-профиль из одной белковой последовательности, первым делом нужно превратить (экспортировать) эту последовательность в выравнивание. Посмотрите, пожалуйста, первую приложенную картинку.
1) Найдите вашу последовательность в проекте и правой кнопкой мыши вызовите ее контекстное меню.
2) Перейдите по пунктам Import/Export -> Export sequences  as alignment.

В результате вы увидите диалог экспортирования последовательности (рисунок 2), в котором нужно задать путь до нового файла, в который будет сохранено выравнивание. После нажатия кнопки Export новое выравнивание автоматически откроется в UGENE.

В редакторе множественных выравниваний (рисунок 3) правой кнопкой мыши вызовите контекстное меню и перейдите по пунктам Advanced -> Build HMMER3 profile (или HMMER2).

В полученном диалоге (рисунок 4) вы можете выбрать путь до нового файла с HMMER-профилем, а также настроить множество параметров построения, которые находятся во вкладках диалога.

Если возникнут дальнейшие вопросы, пожалуйста, задавайте их. Теперь постараемся ответить как можно быстрее.

1_010.png (112 KB | )
2_009.png (14 KB | )
3_003.png (82 KB | )

Title: Re: HMMER-профиль и поиск ортрлогов
Post by German Grekhov on Aug 9th, 2013 at 10:37am
Рисунок 4
4.png (23 KB | )

Title: Re: HMMER-профиль и поиск ортрлогов
Post by Natasha on Oct 10th, 2013 at 6:29pm
Здравствуйте!
Я и не надеялась, что кто-нибудь откликнется, сложный это вопрос.
СПАСИБО Вам ОГРОМНОЕ, не знает никто обо всем об этом...
Вы объясняете, как себя вести на UGENE-сайте в Windows. А в Linuxe не проще, хотя там я и сломалась - ничего не получалось.  А batch-метод для многих сразу никак нельзя запустить? Много у меня одиночных белков, сотни... Где бы то ни было запустить?

Вопросов у меня много, а кроме Вас, никто не знает.

Цель у меня следующая.
Как с одиночным бактериальным белком получить
через phmmer, hmmbuild и hmmsearch список
ортогогичных белков для данного белка.

Как зажать phmmer в такие опции, чтобы белки им выдавались только бактериальные? Надо ли для профиля выбирать белки из разных таксонов, а то я задала псевдомонадный, так мне
все остальные псевдомонадные и выдали. Я пыталась через psi-blast,
hmmer не работал - но результат мне не понравился... Linux с defaultными параметрами для phmmerа несколько часов мне
в SWISS_PROTe что-то искал, но толку было очень мало.

Для профиля Вы все объяснили, надеюсь, получится.
Это все нужно гонять внутри UGENE, или скачмвать hmmer3.1  для Windows, как лучше?

А можно как-то ограничивать диапазон expected value для полученных последовательностей в phmmer, или это ухудшит профиль наоборот?

Какой программой лучше всего делать изначальное выравнивание для hmmbuild? Muscle годится? A UGENE им разрешает делать? CLUSTALX довольно древняя, хотя есть новые версии, наверное.
Стокгольмский формат выравниваний можно как-то обойти?
Сейчас появился hmmer3.1b, он, кажется, к форматам выравнивания более толерантен.

В принципе, профиль можно по выравниванию строить
через hmmbuild, но не по одиночной последовательности,
так что phmmer-прогонов не избежать.

А искать собственно ортологи с профилем нужно через hmmsearch,
как я понимаю? А там ограничивать вывод как-то нужно или наоборот? Я хочу разные таксоны, чем больше, тем лучше.
Но только бактериальные белки нужны, архейные еще туда-сюда, но
не эукариотические точно.

Подскажите, что можно сделать, начав с бактериального белка и кончив большим списком БАКТЕРИАЛЬНЫХ же ортологов всех таксонов. СПАСИБО ОГРОМНОЕ!

Title: Re: HMMER-профиль и поиск ортрлогов
Post by Natasha on Oct 14th, 2013 at 12:33am
Здравствуйте!
Я повторила все те действия, которые были мне предложены, но выравнивания из одиночной
последовательности я почему-то не получила. А должна была?
phmmer тоже хочет выравнивание на входе, вот это грустно.
Я ожидала, что он будет искать в базе данных ортологи для исходного
выравнивания, на основе которого построит профиль и с его помощью можно
будет искать еще какие-то ортологи во всех таксонах. А он все-таки просит
исходно выравнивание. Как это обойти? И мне нужны только бактериальные ортологи,
а как его зажать в такие опции, непонятно.
Посоветуйте, пожалуйста, что тут можно сделать? Или выравнивать через Бласты
всякие-разные?
СПАСИБО ОГРОМНОЕ!
Наташа

Title: Re: HMMER-профиль и поиск ортрлогов
Post by Yuriy Vaskin on Oct 14th, 2013 at 3:34pm
Здравствуйте!

Хочу дополнить про запуск HMM-поиска в batch-режиме (для многих последовательностей). Когда вы настроите параметры HMM в ручном режиме, Ольга объясняла, как это сделать. Можно использовать наш Дизайнер Вычислительных Схем и pipeline для этой задачи, который я для вас сделал (вложено). В наш Дизайнер встроен только HMM 2, но он тоже подходит для поиска белковых ортологов.
Нужно использовать последнюю версию UGENE 1.12.3. Скачать можно тут (http://ugene.unipro.ru/download.html).
Просто откройте вложенную схему с помощью UGENE. Нажимая на элементы схемы можно настроить их параметры (справа):
1.      Sequence Database. Тут нужно указать входной Dataset – файл или файлы с последовательностями вашей «базы». Как уже было сказано, базой является либо один файл multi-fasta, либо можно добавить несколько файлов c последовательностями.
2.      Target Sequence. В качестве входного Dataset нужно указать целевую последовательность, для которой вы хотите найти ортологи. Кстати, можно указать несколько последовательностей для работы в batch-режиме.
3.      Write sequence. Нужно указать Output File. Файл, в который сохранится ваша целевая последовательность со всеми ортологами (в виде аннотаций).
4.      Write annotation. Нужно тоже указать Output file. Туда запишутся только найденные аннотации, без последовательности, в удобной табличной форме.
Можно также настроить параметры HMM-элементов. После настройки схему нужно запустить (Run scheme) и открыть получившиеся файлы.

Если у вас есть вопросы, пожалуйста, пишите.



https://forum.ugene.net/forum/YaBB.pl?action=downloadfile;file=hmm.uwl (4 KB | )

UGENE Forum » Powered by YaBB 2.5 AE!
YaBB Forum Software © 2000-2010. All Rights Reserved.