Welcome, Guest. Please Login or Register
UGENE Bulletin Board
  Welcome to our forum.
  HomeHelpSearchLoginRegister  
 
 
Page Index Toggle Pages: 1
HMMER-профиль и поиск ортрлогов (Read 8092 times)
Aug 2nd, 2013 at 10:21pm

Natasha   Offline
YaBB Newbies

Posts: 4
*
 
Здравствуйте! Не поможете разобраться?
Если у меня есть одиночная белковая последовательность, не выравнивание, как мне проще получить ее HMMER-профиль? phmmer вроде подходит, и профиль использует, и с одиночной последовательностью работает,
но как в явном виде профиль из него вытребовать?
Очень много программ в составе HMMER3, я в них уже путаюсь,
а воз и ныне там. Я хочу обойти выравнивание - это возможно?
По PFAM номеру можно получить профиль или все же нельзя?
Хотя, если в белке несколько доменов, PFam номеров тоже несколько.Как с этим быть?
А с профилем потом искать ортологи вроде проще, если правильно задать базу данных и выбрать нужную программу - какую правильно выбрать и как задать правильно
базу данных, в каком формате и какую?
Подскажите последовательность действий,
я ее так и не вывела сама из manuala.
СПАСИБО!
 
IP Logged
 
Reply #1 - Aug 9th, 2013 at 10:36am

German   Offline
Full Member

Posts: 118
***
 
Здравствуйте. Извините за долгий ответ.

Чтобы получить HMMER-профиль из одной белковой последовательности, первым делом нужно превратить (экспортировать) эту последовательность в выравнивание. Посмотрите, пожалуйста, первую приложенную картинку.
1) Найдите вашу последовательность в проекте и правой кнопкой мыши вызовите ее контекстное меню.
2) Перейдите по пунктам Import/Export -> Export sequences  as alignment.

В результате вы увидите диалог экспортирования последовательности (рисунок 2), в котором нужно задать путь до нового файла, в который будет сохранено выравнивание. После нажатия кнопки Export новое выравнивание автоматически откроется в UGENE.

В редакторе множественных выравниваний (рисунок 3) правой кнопкой мыши вызовите контекстное меню и перейдите по пунктам Advanced -> Build HMMER3 profile (или HMMER2).

В полученном диалоге (рисунок 4) вы можете выбрать путь до нового файла с HMMER-профилем, а также настроить множество параметров построения, которые находятся во вкладках диалога.

Если возникнут дальнейшие вопросы, пожалуйста, задавайте их. Теперь постараемся ответить как можно быстрее.
 

1_010.png (112 KB | )
1_010.png
2_009.png (14 KB | )
2_009.png
3_003.png (82 KB | )
3_003.png
IP Logged
 
Reply #2 - Aug 9th, 2013 at 10:37am

German   Offline
Full Member

Posts: 118
***
 
Рисунок 4
 

4.png (23 KB | )
4.png
IP Logged
 
Reply #3 - Oct 10th, 2013 at 6:29pm

Natasha   Offline
YaBB Newbies

Posts: 4
*
 
Здравствуйте!
Я и не надеялась, что кто-нибудь откликнется, сложный это вопрос.
СПАСИБО Вам ОГРОМНОЕ, не знает никто обо всем об этом...
Вы объясняете, как себя вести на UGENE-сайте в Windows. А в Linuxe не проще, хотя там я и сломалась - ничего не получалось.  А batch-метод для многих сразу никак нельзя запустить? Много у меня одиночных белков, сотни... Где бы то ни было запустить?

Вопросов у меня много, а кроме Вас, никто не знает.

Цель у меня следующая.
Как с одиночным бактериальным белком получить
через phmmer, hmmbuild и hmmsearch список
ортогогичных белков для данного белка.

Как зажать phmmer в такие опции, чтобы белки им выдавались только бактериальные? Надо ли для профиля выбирать белки из разных таксонов, а то я задала псевдомонадный, так мне
все остальные псевдомонадные и выдали. Я пыталась через psi-blast,
hmmer не работал - но результат мне не понравился... Linux с defaultными параметрами для phmmerа несколько часов мне
в SWISS_PROTe что-то искал, но толку было очень мало.

Для профиля Вы все объяснили, надеюсь, получится.
Это все нужно гонять внутри UGENE, или скачмвать hmmer3.1  для Windows, как лучше?

А можно как-то ограничивать диапазон expected value для полученных последовательностей в phmmer, или это ухудшит профиль наоборот?

Какой программой лучше всего делать изначальное выравнивание для hmmbuild? Muscle годится? A UGENE им разрешает делать? CLUSTALX довольно древняя, хотя есть новые версии, наверное.
Стокгольмский формат выравниваний можно как-то обойти?
Сейчас появился hmmer3.1b, он, кажется, к форматам выравнивания более толерантен.

В принципе, профиль можно по выравниванию строить
через hmmbuild, но не по одиночной последовательности,
так что phmmer-прогонов не избежать.

А искать собственно ортологи с профилем нужно через hmmsearch,
как я понимаю? А там ограничивать вывод как-то нужно или наоборот? Я хочу разные таксоны, чем больше, тем лучше.
Но только бактериальные белки нужны, архейные еще туда-сюда, но
не эукариотические точно.

Подскажите, что можно сделать, начав с бактериального белка и кончив большим списком БАКТЕРИАЛЬНЫХ же ортологов всех таксонов. СПАСИБО ОГРОМНОЕ!
 
IP Logged
 
Reply #4 - Oct 14th, 2013 at 12:33am

Natasha   Offline
YaBB Newbies

Posts: 4
*
 
Здравствуйте!
Я повторила все те действия, которые были мне предложены, но выравнивания из одиночной
последовательности я почему-то не получила. А должна была?
phmmer тоже хочет выравнивание на входе, вот это грустно.
Я ожидала, что он будет искать в базе данных ортологи для исходного
выравнивания, на основе которого построит профиль и с его помощью можно
будет искать еще какие-то ортологи во всех таксонах. А он все-таки просит
исходно выравнивание. Как это обойти? И мне нужны только бактериальные ортологи,
а как его зажать в такие опции, непонятно.
Посоветуйте, пожалуйста, что тут можно сделать? Или выравнивать через Бласты
всякие-разные?
СПАСИБО ОГРОМНОЕ!
Наташа
 
IP Logged
 
Reply #5 - Oct 14th, 2013 at 3:34pm

Yuriy Vaskin   Offline
Global Moderator

Gender: male
Posts: 138
*****
 
Здравствуйте!

Хочу дополнить про запуск HMM-поиска в batch-режиме (для многих последовательностей). Когда вы настроите параметры HMM в ручном режиме, Ольга объясняла, как это сделать. Можно использовать наш Дизайнер Вычислительных Схем и pipeline для этой задачи, который я для вас сделал (вложено). В наш Дизайнер встроен только HMM 2, но он тоже подходит для поиска белковых ортологов.
Нужно использовать последнюю версию UGENE 1.12.3. Скачать можно тут (http://ugene.unipro.ru/download.html).
Просто откройте вложенную схему с помощью UGENE. Нажимая на элементы схемы можно настроить их параметры (справа):
1.      Sequence Database. Тут нужно указать входной Dataset – файл или файлы с последовательностями вашей «базы». Как уже было сказано, базой является либо один файл multi-fasta, либо можно добавить несколько файлов c последовательностями.
2.      Target Sequence. В качестве входного Dataset нужно указать целевую последовательность, для которой вы хотите найти ортологи. Кстати, можно указать несколько последовательностей для работы в batch-режиме.
3.      Write sequence. Нужно указать Output File. Файл, в который сохранится ваша целевая последовательность со всеми ортологами (в виде аннотаций).
4.      Write annotation. Нужно тоже указать Output file. Туда запишутся только найденные аннотации, без последовательности, в удобной табличной форме.
Можно также настроить параметры HMM-элементов. После настройки схему нужно запустить (Run scheme) и открыть получившиеся файлы.

Если у вас есть вопросы, пожалуйста, пишите.


 

hmm.uwl (4 KB | )
IP Logged
 
Page Index Toggle Pages: 1