ИНТЕРНЕТ И СПЕЦИАЛИЗИРОВАННЫЕ СИСТЕМЫ ПОИСКА
Атаева Ольга Муратовна, Шиолашвили Лали Николаевна
Центр научных и образовательных телекоммуникаций ВНЦ РАН и Правительства РСО-А, г. Владикавказ
Целью этого проекта является внедрение в Web таких технологий, которые позволят существенно повысить уровень интеграции информации, обеспечить развитую машинную обработку данных, дадут возможность выдавать более адекватные ответы на поисковые запросы и т.д.
обсудить на форуме
написать автору
Всемирная сеть Интернет сегодня привлекает пристальное внимание пользователей компьютеров, работающих в самых разнообразных областях и имеющих различные профессиональные или личные интересы.
Глобальная сеть Интернет предоставляет доступ к огромным массивам информации, но зачастую слабо структурированным. На помощь пользователю приходят системы поиска по ключевым словам и тематические каталоги ресурсов Интернет. Поскольку ни одна из поисковых систем не индексирует все содержимое Интернет, пользователи вынуждены обращаться к различным поисковым системам. Другой методикой поиска можно предположить использование специализированных систем, которые дают достаточно релевантные ответы, предоставляют информацию в более удобной форме для восприятия. Специализированные системы содержат в своем банке данных и предоставляют поиск по строго определенным предметным областям
В настоящее время в мире существует достаточно большое число таких систем, которые содержат сведения, подготовленные профессиональными производителями информации, и услуги которых предоставляются пользователям компьютерных сетей профессиональными продавцами информации.
Одной из реализаций специализированных систем является разработка Вычислительного центра РАН Интегрированная система информационных ресурсов (ИСИР). Распределенная система ИСИР РАН ориентируется на объединение организаций, каждая из которых поддерживает коллекцию ресурсов представляющих общий интерес (например, научные публикации, сведения о сотрудниках и т.д.). Для хранения коллекции организации используют репозитории, представляемые некими «локальными» системами. Репозитории, в общем случае, используют различные модели представления данных способы доступа к ним и т.д.
Помимо разработки новых хранилищ, ИСИР-технологии могут быть применены к унаследованной базе данных, таким образом открывая к ней доступ ведущим Интернет-технологиям и интегрируя ее в Semantic Web. Semantic Web – это расширение Интернет, в котором информации придается определенная семантика, позволяя людям и машинам работать вместе. Данный подход в ИСИР реализуется через использование технологии RDFS как фундамента для описания объектных схем за простую объектную модель, удобство расширения новыми примитивами и адаптированность к Интернет, а следовательно и к обмену RDF и XML данными.
ИСИР сопоставляет модель данных хранилища и модель данных Semantic Web через прослойку представления объектов языка Java, таким образом открывая Semantic Web доступ к хранимой информации. Когда мы находимся на web-уровне, мы исходим из принципов глобализации и децентрализации Semantic Web и используем RDFS для отражения объектной схемы интересующей нас предметной области. В случае ограничения конкретными репозиториями применяется замкнутая объектная схема, соответствующую традиционной объектной парадигме, которая может быть выражена в терминах ODL, UML, или расширенного RDFS ИСИР. Этой схеме соответствует набор java-классов, отражающих предметную область. И наконец, Репозиторный Сервис ИСИР позволяет организовать отображение объектов этих классов в данные конкретного используемого хранилища, в соответствии со специфицированным механизмом отображения объектной модели данных в модель данных хранилища
Все описываемые приемы и технологии ИСИР применимы также для совместного поиска в других специализированных системах, выходящие за рамки наукоемкой информации.