Welcome, Guest. Please Login or Register
UGENE Bulletin Board
  Welcome to our forum.
  HomeHelpSearchLoginRegister  
 
 
Pages: 1 2 
Некоторые файлы в формате генбанка не открываются. (Read 18337 times)
Jun 20th, 2014 at 9:52pm

Ilya Flyamer   Offline
Full Member

Gender: male
Posts: 126
***
 
Здравствуйте!

Как неожиданно выяснилось, ugene не может открыть некоторые файлы в формате генбанка. К сожалению, я не могу проверить их ни в какой другой программе, но CLC Sequence Viewer их нормально открывает, да и на первый взгляд в текстовом редакторе они выглядят нормально, а другие файлы в юджине открываются "на ура".

При загрузке файла Smc3...gbk выдает следующую ошибку:

[Информация][18:52] Старт задачи {Загрузка документа: Smc3 LOCUS 19 45436 bp DNA HTG 4.gbk}
[Ошибки][18:52] Задача {Загрузка документа: Smc3 LOCUS 19 45436 bp DNA HTG 4.gbk} завершена с ошибкой: Данные повреждены: запись SOURCE

При загрузке файла Smc1b...gbk такую:
[Информация][18:53] Старт задачи {Загрузка документа: Smc1b LOCUS 15 67267 bp DNA HTG 4.gbk}
[Ошибки][18:53] Задача {Загрузка документа: Smc1b LOCUS 15 67267 bp DNA HTG 4.gbk} завершена с ошибкой: Can't parse location on COMPLEMENT

Мне эти файлы прислали, у отправителя с ними все в порядке (в какой-то другой программе).

Ubuntu 14.04, Ugene 1.13.3
« Last Edit: Jun 21st, 2014 at 2:59am by Ilya Flyamer »  
IP Logged
 
Reply #1 - Jun 24th, 2014 at 8:35pm

Olga Golosova   Offline
YaBB Administrator

Posts: 338
*****
 
Проверили оба файла на версии 1.13.3.

Файл Smc1b_LOCUS_15_67267_bp_DNA_HTG_4.gbk у нас нормально открывается в UGENE. Вы точно правильный файл прикрепили?  Smiley

При открытии файла Smc3_LOCUS_19_45436_bp_DNA_HTG_4.gbk действительно происходит ошибка - UGENE "жалуется" на "SOURCE".

Причина здесь в том, что перед подпунктом "ORIGIN" отсутствуют два пробела. Вот, к примеру, описание GenBank record: http://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html#OrganismB. Здесь, как и в большинстве других GenBank файлах виден отступ перед "ORIGIN".

То есть стандарт скорее утверждает, что файл ошибочен, хотя строго это и не прописывается (http://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html). Поэтому прежде чем добавлять такую правку в UGENE хотелось бы уточнить, откуда был получен файл. Не дадите ссылку на вебе (что-то не получается найти по accession id)?
 
IP Logged
 
Reply #2 - Jun 25th, 2014 at 12:40am

Ilya Flyamer   Offline
Full Member

Gender: male
Posts: 126
***
 
Да, файл точно правильный, я его скачал отсюда и попробовал открыть.

Вот так должно быть правильно?
Code:
SOURCE      house mouse
  ORGANISM  Mus musculus 


Тогда ругается так:
Code:
[Информация][21:41] Старт задачи {Загрузка документа: Smc3 LOCUS 19 45436 bp DNA HTG 4.gbk}
[Ошибки][21:41] Задача {Загрузка документа: Smc3 LOCUS 19 45436 bp DNA HTG 4.gbk} завершена с ошибкой: Can't parse location on JOIN 



Файлы взяты не из веба, мне их прислали. Создали в какой-то другой программе, к сожалению, не знаю, в какой.
 
IP Logged
 
Reply #3 - Jun 25th, 2014 at 11:57am

Olga Golosova   Offline
YaBB Administrator

Posts: 338
*****
 
Да, требуется добавить два пробела перед ORGANISM. При этом в UGENE файл успешно открывается (у нас). Прикрепляю поправленный файл, попробуйте его открыть, пожалуйста.
 
IP Logged
 
Reply #4 - Jun 25th, 2014 at 1:48pm

Ilya Flyamer   Offline
Full Member

Gender: male
Posts: 126
***
 
Да, я пробовал сделать это сам, такая же ошибка:
Code:
[Ошибки][10:50] Задача {Loading documents} завершена с ошибкой: Подзадача {Opening view for document: Smc3_LOCUS_19_45436_bp_DNA_HTG_4_with_spaces.gbk} завершена с ошибкой: Подзадача {Загрузка документа: Smc3_LOCUS_19_45436_bp_DNA_HTG_4_with_spaces.gbk} завершена с ошибкой: Can't parse location on JOIN 

 
IP Logged
 
Reply #5 - Jun 25th, 2014 at 2:05pm

Olga Golosova   Offline
YaBB Administrator

Posts: 338
*****
 
Странно, у нас все открывается. Вы 1.13.3 версию используете, да?
 
IP Logged
 
Reply #6 - Jun 25th, 2014 at 2:13pm

Ilya Flyamer   Offline
Full Member

Gender: male
Posts: 126
***
 
...
 
IP Logged
 
Reply #7 - Jun 25th, 2014 at 2:36pm

Olga Golosova   Offline
YaBB Administrator

Posts: 338
*****
 
Илья, мы проверили еще раз, баг у нас на 1.13.3 не вопроизводится, однако он воспроизвелся на trunk'е (то есть на разрабатываемой сейчас версии программы), что, конечно, странно, так как у вас ошибка именно на релизе.
Попробуем разобраться в чем там дело. Спасибо, что сообщили!
 
IP Logged
 
Reply #8 - Jun 25th, 2014 at 2:51pm

Ilya Flyamer   Offline
Full Member

Gender: male
Posts: 126
***
 
Я, кстати, что-то не помню, откуда у меня эта версия. Я ее запускаю не из терминала из папки с бинарниками, а по-нормальному, как обычное приложение. Но в репозитории для убунты, вроде, нет версии 1.13.3 (там только 1.9.8). Может, это могло бы помочь разобраться...
 
IP Logged
 
Reply #9 - Jun 25th, 2014 at 3:46pm

Olga Golosova   Offline
YaBB Administrator

Posts: 338
*****
 
Вот здесь подробно описано, как можно свежую версию UGENE поставить на Ubuntu: https://ugene.unipro.ru/wiki/display/UUOUM/Installing+UGENE+on+Ubuntu

А вот ссылка на заведенный баг про файл (на всякий случай Smiley): https://ugene.unipro.ru/tracker/browse/UGENE-3117
 
IP Logged
 
Reply #10 - Jun 25th, 2014 at 3:54pm

Ilya Flyamer   Offline
Full Member

Gender: male
Posts: 126
***
 
А, я смотрел не тот репозиторий, все ясно, спасибо! Так я и ставил.

Спасибо за заведение бага!
 
IP Logged
 
Reply #11 - Jul 25th, 2014 at 1:11am

Ilya Flyamer   Offline
Full Member

Gender: male
Posts: 126
***
 
Чтобы не создавать новую тему. Да и, может, это связанные вещи... Нкоторые генбанковские файлы открываются неправильно. Пример можно скачать отсюда (Send-File-GenBank-Create file): http://www.ncbi.nlm.nih.gov/nuccore/NC_000080.6?report=genbank&from=55617993&to=...

При загрузке в юджин координаты некоторых экзонов (частей CDS) каким-то образом определяются неправильно:
...

В обеих CDS какие-то экзоны имеют огромную правую координату (566250 в верхней и 56250 в нижней). Если посмотреть в текст файла, видно, что при этом два экзона пропали, по крайней в верхней CDS.
 
IP Logged
 
Reply #12 - Jul 25th, 2014 at 6:07pm

Olga Golosova   Offline
YaBB Administrator

Posts: 338
*****
 
Спасибо за сообщение о баге, уже починили его, то есть будет поправлено в версии 1.14.
 
IP Logged
 
Reply #13 - Jul 25th, 2014 at 8:25pm

Ilya Flyamer   Offline
Full Member

Gender: male
Posts: 126
***
 
Ясно, спасибо! Когда релиз намечается? Стоит ли ставить ее еще до релиза?
 
IP Logged
 
Reply #14 - Jul 25th, 2014 at 8:32pm

Olga Golosova   Offline
YaBB Administrator

Posts: 338
*****
 
Скоро Smiley
Если интересны детали, то все фичи, которые собирались добавить в релиз, мы добавили. Все известные критические баги починили. Так что начинаем собирать пакеты для всех систем и еще раз тестировать их. Если новых критических багов не найдем, то в начале/середине следующей недели выпустим.
 
IP Logged
 
Pages: 1 2