LINUX.ORG.RU

дайте совет по парсингу биологических баз данных.

 , ,


1

2

Категорически вас приветствую!

Намечается мне писать скрипты и иже с ними для получения разнообразных данных из различных биологических баз данных (например uniprot.org). Так-как я ленивый и не люблю изобретать велосипеды с квадратными колёсами, решил спросить может кто-нибудь располагает таковыми скриптами или поделится толикой опыта в парсинге вебстраниц.

//возможно тему нужно в development, но я не уверен.

★★★

так что надо то?

заходишь так

  url = 'http://www.uniprot.org/' + 'uniprot' + '/' + uniProtID + '.fasta'
Sonsee
()

Так оно rdf само отдает, грузи-мапь в karma со своей онтологией их и будет счастье.

PS Блин чтоб мне кто так данные отдавал :(

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Ребята извините что так долго не было, - заработался.

psv1967 Я потыкал karm'у, но если честно я в ней не разобрался. При условии что я смотрел именну то програмное обеспечение о котором ты говорил. Это эно:https://github.com/InformationIntegrationGroup/Web-Karma/wiki/Installation ?

Eсли нет, то дай нужную ссылку пожалуйста.

В итоге мне пришлось «велосипедить» с помощью biopython.

hope13 ★★★
() автор топика
Ответ на: комментарий от hope13

Да именно она.

На её сайте http://www.isi.edu/integration/karma/ куча роликов демонстрационных + в вики лежит пошаговый туториал со всеми файлами для ролика со случаем импорта данных в онтологию музейных ценностей (текст статьи на самом сайте). Rdf источник Карма может просто читать как локальный файл.

И Карма прямо «из коробки» умеет трансформировать данные именно с помощью твоего питона :)

Но если данные действительно «грязные», то предварительно можно их пропустить через Рефайн http://openrefine.org/ (там тоже есть ролики с примерами содержание которых я могу конечно пересказать :), и питон как вариант для трасформации данных)

Посмотри материалы по обеим средствам очистки-интеграции данных и спрашивай что непонятно.

PS Про онтологии читать руководство «про питцы» от Protege.

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Спасибо за совет. Я основные ролики посмотрел, но видимо если я всё правильно понял, то karma в данном случае мне не нужна. В моём, данном, случае, связь в данных сначала нужно «придумать» и обосновать :). А вот о openrefine я мечтал давно.

Про онтологии обязательно почитаю.

Ещё раз спасибо.

hope13 ★★★
() автор топика
Ответ на: комментарий от hope13

По онтологиям есть перевод книги --- Рассел С. и Норвиг П. Искусственный интеллект .

С неё (вернее глав касающихся онтологий и возможностей логических выводов в них) начать будет наиболее удобно.

psv1967 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.