UGENE Forum
https://forum.ugene.net/forum/YaBB.pl
General Category >> Forum in Russian language ([ch1056][ch1091][ch1089][ch1089][ch1082][ch1086][ch1103][ch1079][ch1099][ch1095][ch1085][ch1099][ch1081] [ch1092][ch1086][ch1088][ch1091][ch1084]) >> Поиск повторов
https://forum.ugene.net/forum/YaBB.pl?num=1552131286

Message started by Ivan V. Savelyev on Mar 9th, 2019 at 6:34pm

Title: Поиск повторов
Post by Ivan V. Savelyev on Mar 9th, 2019 at 6:34pm
Нужно уметь искать повторы в рамках последовательностей. Для этого использую функцию repeat finder
Пока не понял как выделять сами повторы. То есть сиквенсы повторов. Как определять среди них уникальные ?
Программа показывает повторы попарно. Хочется понять сколько из них уникальных итд.
Вероятно можно собрать все рипиты в один файл ( аннотации и сиквенсы) и потом уже их сортировать

Подскажите как ? Спасибо

Хочется сделать workflow.

Title: Re: Поиск повторов
Post by Olga Golosova on Mar 11th, 2019 at 1:56pm
Здравствуйте, Иван!

Чтобы получить последовательности повторов можно, например, собрать такую схему:
"Read Sequence" > "Find Repeats" > "Get Sequences by Annotations" > "Write Sequence".

При этом в элементе "Read Sequence" надо задать последовательност(-ь/-и), в котор(-ой/-ых) Вы ищете повторы.

Не совсем понятно, какой в точности результат Вы ожидаете в плане сортировки этих последовательностей. Как вариант, вместо "Write Sequence" можно дополнить схему такими элементами:
"Join Sequences into Alignment" > "Write Alignment".

Можно также при необходимости выровнять последовательности.

Затем открыть полученный результат в редакторе множественных выравниваний и воспользоваться кнопкой "Switch on/off collapsing". Одинаковые последовательности схлопнутся.
get_repeat_sequences.png (229 KB | 414 )
switch_on_collapsing.png (124 KB | 365 )

Title: Re: Поиск повторов
Post by Ivan V. Savelyev on Mar 11th, 2019 at 9:04pm
Здравствуйте.

Огромное спасибо за ответ. Во многом помог.
Но есть вопросы.

Я сделал воркфлоу. Проверил его на файлах. Мне кажется что отгружаемых последовательностей повторов меньше чем его находит функция файнд рипит просто в программе.
Еще не очень понял разницу между disjoint repeat, unique repeat, no filter. Вижу что больше результатов по нофильтр. Но как получить все все все рипиты через воркфлоу пока не понял. Речь идет про Joint sequences into alignment, как сделать чтобы туда собрались все найденные рипиты ?

Спасибо

Title: Re: Поиск повторов
Post by Olga Golosova on Mar 12th, 2019 at 5:25pm

Quote:
Мне кажется что отгружаемых последовательностей повторов меньше чем его находит функция файнд рипит просто в программе.

Попробуйте проставить в элементе "Find Repeats" параметру "Apply 'Max distance' attribute" значение "False". В той схеме, которую Вы прислали по почте, Вы проставили параметру "Max distance" значение "0" (= "Any"), но такой путь, к сожалению, не работает. Я завела задачу, чтобы значение "Any" для этого параметра задать было нельзя.


Quote:
Еще не очень понял разницу между disjoint repeat, unique repeat, no filter.

"no filter" - искать все, "unique" - непересекающиеся (разные пары), "disjoint" - повторы в паре также должны быть разделены. См., например, результат для последовательности "AAAAACCCCCAAAAA" с длинной искомых повторов "4".


repeat_types.png (99 KB | 394 )

UGENE Forum » Powered by YaBB 2.5 AE!
YaBB Forum Software © 2000-2010. All Rights Reserved.