Программно-информационная система для обеспечения аналитической поддержки исследований в области нанобиотехнологий (ИАС ПИОН)
Наименование проекта: «Создание программно-информационной системы для информационно-аналитической поддержки исследований в области нанобиоиндустрии».
Государственный контракт: № 16.647.11.2014 от «23» мая 2011 г.
Федеральная целевая программа: Развитие инфраструктуры наноиндустрии в Российской Федерации на 2008 - 2011 годы"
Государственный заказчик: Министерство образования и науки Российской Федерации
Исполнитель: Общество с ограниченной ответственностью «Инновационно-технические решения».
Целью работы является создание программно-информационной системы для информационно-аналитической поддержки коллективной работы сообществ исследователей и разработчиков в наноиндустрии (на примере нанобиоиндустрии) с целью повышения эффективности проведения научно-исследовательских и опытно-конструкторских работ, направленных на создание конкурентоспособных продуктов, их ускоренное промышленное освоение и коммерциализацию.
В процессе выполнения работ по проекту был выполнен анализ существующих на настоящий момент времени технологических решений и научных материалов в области извлечения знаний, классификации документов, поиска информации и формированию баз знаний. На основе данного анализа были определены алгоритмы и технические решения, наиболее оптимальные для целей и задач проекта. Основным отличием предложенного подхода от имеющихся аналогов является комплексный механизм классификации и извлечения знаний из текстовых документов на основе экспертных знаний и онтологии предметной области, дополняющих друг друга при недостаточной или неопределенной информации.
При реализации базы знаний предметной области были разработаны предметные словари по наноматериалам, их свойствам, технологиям и областям применения. Выполнены работы по определению связей терминов данных словарей с терминами онтологии предметной области и классификатором УДК.
При реализации прототипа информационной системы были использованы следующие технические решения: программная платформа Java, СУБД PostgreSQL, веб-сервер Apache Tomcat, библиотека высокоскоростного полнотекстового поиска Apache Lucene.
По завершению выполнения работ по проекту были получены следующие результаты:
- Разработана методология интеллектуального поиска документов в сети Интернет, содержащих релевантную информацию о наноматериалах, использующих различные иерархические словари в области нанобиоиндустрии;
- Разработана методология автоматизированного извлечения знаний о наноматериалах и их свойствах из релевантных текстов, ориентированных на высокопроизводительные вычисления для массированной обработки больших объемов данных;
- Разработана методология классификации текстовых документов, описывающих наноматериалы на естественном языке, основанная на семантическом содержании текстов;
- Разработана методология интерактивного анализа текстов с целью автоматизации работы эксперта при заполнении базы знаний, обеспечивающих выявление названий и свойств наноматериалов, связанных с ними технологий и областей применения;
- Разработана методология интерактивного формирования и выполнения запросов к базе знаний, на основе семантической классификации текстов;
- Разработана методология формирования описаний результатов запросов к базе знаний в виде ассоциативных семантических сетей;
- Разработана база знаний, содержащая информацию по наноматериалам, а также связанными с ними технологиями и областями применений;
- Разработан прототип информационной системы для обеспечения аналитической поддержки проведения исследований в области нанобиотехнологий, состоящей из следующих программных модулей:
- Клиентский модуль (PionReseacher) – обеспечивает механизм написания запросов к базе знаний и отображения результатов выполнение данных запросов (рис.1 и рис.2);
- Экспертный модуль (PionMgmtConsole) – обеспечивает механизмы управления терминами онтологии предметной области и их связями, справочниками предметной области, загрузкой документов из различных информационных источников, проведение анализа текстов и их классификацию (рис.3, 4, 5);
- Сервисный модуль (PionWebService) – обеспечивает прикладной программный интерфейс доступа к сервисам базы знаний.
Доступ к прототипу информационной системы для обеспечения аналитической поддержки проведения исследований в области нанобиотехнологий по следующей ссылке http://176.9.9.122:8080/web/main.html

Рис.1 Диалоговое окно с результатами поиска информации в базе знаний

Рис.2 Диалоговое окно построения семантической сети связи документа
с наноматериалами, их свойствами, технологиями и областями применения

Рис.3 Диалоговое окно управления онтологией предметной области

Рис.4 Диалоговое окно управления документами базы знаний

Рис.5 Диалоговое окно поиска документов в сети Интернет.
Общество с ограниченной ответственностью
«Инновационно-технические решения»
| Версия для печати Дата обновления: 18:02 22.11.2011 | Обсудить на открытом форуме Обсудить на форуме участников ННС |
