UGENE Forum
https://forum.ugene.net/forum/YaBB.pl
General Category >> Forum in Russian language ([ch1056][ch1091][ch1089][ch1089][ch1082][ch1086][ch1103][ch1079][ch1099][ch1095][ch1085][ch1099][ch1081] [ch1092][ch1086][ch1088][ch1091][ch1084]) >> Поиск по паттерну - длина имени аннотации?
https://forum.ugene.net/forum/YaBB.pl?num=1405426422

Message started by Ilya Flyamer on Jul 15th, 2014 at 7:13pm

Title: Поиск по паттерну - длина имени аннотации?
Post by Ilya Flyamer on Jul 15th, 2014 at 7:13pm
Я тут воспользовался поиском по последовательности на основе fasta-файла с последовательностями, которые я хочу найти. И поставил галочку Use pattern name. И оказалось, что последнюю букву в почти всех случаях юджин обрезал, а она была важная - F или R (прямой праймер или обратный). И только в случае немного более короткого имени она сохранилась. Похоже, что имя аннотации не может быть длиннее 15 букв - это так задумано?

А еще это имя сохраняется как квалификатор ugene_name, а группа - как ugene_group, так что в других программах эти аннотации выглядят как просто misc_feature, как которые они и записываются.

Title: Re: Поиск по паттерну - длина имени аннотации?
Post by Olga Golosova on Jul 16th, 2014 at 1:27pm
Действительно, сейчас есть такое ограничение, завела улучшение, чтобы это исправить: UGENE-3221


Quote:
А еще это имя сохраняется как квалификатор ugene_name, а группа - как ugene_group, так что в других программах эти аннотации выглядят как просто misc_feature, как которые они и записываются.

Вот тут не могли бы поподробней?

Если имя аннотации есть среди стандартных имен, то аннотация сохраняется с ним. Стандартные имена можно посмотреть, например, в диалоге создания аннотации (см. картинку).

Группа же аннотации задается на панели опций.
names.jpg (104 KB | )

Title: Re: Поиск по паттерну - длина имени аннотации?
Post by Ilya Flyamer on Jul 16th, 2014 at 2:09pm
ОК, я вписывал не стандартное имя группы... Но все равно, имя тоже записывается не как name или label, а как ugene_name. И вообще, я посмотрел еще на файл, в с которым сейчас работал - оказывается, если я создаю аннотацию с нестандартным названием (например, sequencing_primers), то что, юджин записывает это как misc_feature с квалификатором ugene_name? А в генбанковских файлах нельзя просто произвольные имена делать? А то потом отправишь такой файл кому-нибудь с другой программой, и там все не так будет...
А с группами как? Их же нет стандартных, создаю группу sequencing_primers, а все аннотации в группе сохраняюся как misc_feature с квалификатором ugene_group="sequencing primers".

Может стоит просто в туториале каком-нибудь это подробно описать? Или я не видел просто?

Title: Re: Поиск по паттерну - длина имени аннотации?
Post by Olga Golosova on Jul 16th, 2014 at 3:21pm

Quote:
ОК, я вписывал не стандартное имя группы... Но все равно, имя тоже записывается не как name или label, а как ugene_name.

У меня не повторяется такое поведение. Вот, к примеру, такой файл сохранился:

Code:
LOCUS       Annotations                                             16-JUL-2014
UNIMARK     Annotations
FEATURES             Location/Qualifiers
     repeat_region   21..46
                     /mismatches=0
                     /ugene_group="misc_feature"
     repeat_region   5264..5289
                     /mismatches=0
                     /ugene_group="misc_feature"
//



Quote:
А в генбанковских файлах нельзя просто произвольные имена делать?

Есть стандартные "feature key" (см. ссылку).


Quote:
А с группами как?

По идее, стоило бы выбирать у групп значение "<auto>", тогда папки создавались бы такие же, как имена аннотаций. Но сейчас там, к сожалению, баг (UGENE-3223)
Вообще, для групп действуют те же самые правила. Создайте, к примеру, группу misc_features или CDS или т.п.


Quote:
Может стоит просто в туториале каком-нибудь это подробно описать? Или я не видел просто?

Да, опишем подробней (UGENE-3222)

Title: Re: Поиск по паттерну - длина имени аннотации?
Post by Ilya Flyamer on Jul 17th, 2014 at 2:30pm

Code:
misc_feature    1492..1512
                     /mismatches=0
                     /ugene_name="Cas9_px330_263_"
                     /ugene_group="sequencing_primers"


Вот так выглядит в файле одна из созданных при поиске аннотаций. В других программах отображается как аннотация без какого бы то ни было названия, только при более подробном рассмотрении можно найти ugene_name или ugene_group

Title: Re: Поиск по паттерну - длина имени аннотации?
Post by Olga Golosova on Jul 17th, 2014 at 3:04pm
Это потому что в формате GenBank нет таких  features key ("Cas9_px330_263_" или "sequencing_primers").

Title: Re: Поиск по паттерну - длина имени аннотации?
Post by Ilya Flyamer on Jul 17th, 2014 at 3:14pm
Эх, ясно... Странно, что есть такое ограничение в формате. Но почему имя тогда записывается как ugene_name, а не как label, к примеру, что более принято?

Title: Re: Поиск по паттерну - длина имени аннотации?
Post by Olga Golosova on Jul 17th, 2014 at 4:21pm
Где принято?  :)

Вот, кстати, как по той ссылки, которую я выше приводила:

Code:
Feature Key           misc_feature


Definition            region of biological interest which cannot be described
                      by any other feature key; a new or rare feature;

Optional qualifiers   /allele="text"
                      /citation=[number]
                      /db_xref="<database>:<identifier>"
                      /experiment="[CATEGORY:]text"
                      /function="text"
                      /gene="text"
                      /gene_synonym="text"
                      /inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
                      /locus_tag="text" (single token)
                      /map="text"
                      /note="text"
                      /number=unquoted text (single token)
                      /old_locus_tag="text" (single token)
                      /phenotype="text"
                      /product="text"
                      /pseudo
                      /pseudogene="TYPE"
                      /standard_name="text"

Comment               this key should not be used when the need is merely to
                      mark a region in order to comment on it or to use it in
                      another feature's location

Title: Re: Поиск по паттерну - длина имени аннотации?
Post by Ilya Flyamer on Jul 17th, 2014 at 5:57pm
Не знаю, где принято - это встречается в разных файлах, которые ко мне попадают :) Сложно как-то в этом разобраться оказывается...

UGENE Forum » Powered by YaBB 2.5 AE!
YaBB Forum Software © 2000-2010. All Rights Reserved.