В связи с быстрым развитием интернет-технологий возникла необходимость применения средств искусственного интеллекта для поиска и обработки интернет-ресурсов. Применение интеллектуальных MAC для решения задач сбора, поиска и анализа информации в глобальных сетях дает следующие существенные преимущества перед традиционными средствами обработки информации:
- обеспечение доступа пользователя к сетевым протоколам в сети Интернет;
- параллельное решение нескольких задач;
- выполнение поиска информации после отключения пользователя от сети;
- увеличение скорости и точности поиска, а также уменьшене загрузки сети за счет поиска информации непосредственно на сервере;
- создание собственных баз информационных ресурсов, постоянно обновляемых и расширяемых;
- реализация возможности сотрудничества между агентами, которая позволяет использовать накопленный опыт;
- возможность автоматически корректировать и уточнять запросы, используя контекст и применяя модели пользователей.
В табл.7.2 приведены отличительные особенности известных в России коммерческих мультиагентных систем Autonomy и WebCompass, предназначенных для интеллектуального поиска и обработки информации в сети Интернет.
Недостатком современных систем интеллектуального поиска и обработки информации является их слабая способность к обучению. Поэтому основные усилия по совершенствованию интеллектуальных систем информационного поиска в сети Интернет направлены на развитие моделей представления знаний, механизмов вывода новых знаний, моделей рассуждения и способов обучения агентов.
Таблица 7.2 Анализ систем интеллектуального поиска и обработки информации
Характеристика | Autonomy | WebCompass |
Категория пользователей, на которую ориентирована система | Конечные пользователи | «Продвинутые» пользователи |
Подход к описанию предметной области | Технология нейронных сетей и специальные методы распознавания образов и обработки сигналов | Иерархии понятий, связанных отношениями типа IS-A, PART-OF, HAS-PART, IS-A KIND OF и т.
д. |
Средства спецификации запросов | Естественный язык | «Прямое» использование сформированного пользователем описания предметной области |
Методы поиска релевантной информации | Нечеткая логика | Поиск по списку ключевых слов одновременно на 35 машинах поиска |
Режим обучения поисковых агентов | Есть | Нет |
Рис. 7.5. Архитектура системы MARRI
Одним из успешных исследовательских проектов, выполненных в этом направлении, стал проект системы MARRI, которая была разработана для поиска Web-страниц, релевантных запросам в определенной предметной области. Для решения поставленной задачи система использует знания, представленные в виде онтологии, под которой в данном случае понимается упорядоченное множество понятий предметной области. Архитектура системы MARRI показана на рис. 7.5.
Система MARRI включает следующие типы агентов:
- интерфейсный агент (агент пользователя) обеспечивает интеллектуальное взаимодействие с пользователем. Он поддерживает процесс формулирования запросов и представляет результаты поиска в виде списка URL или Web-страниц.
Агенты-брокеры двух типов:
- брокер типа URL предназначен для формирования списков интернет-адресов, поставляемых браузером;
- брокер типа HTML выполняет функции запоминания полученных Web-страниц и их распределения между агента ми обработки текста;
- агент сети (интернет-агент) обеспечивает считывание и анализ заданной страницы URL или Web-страницы (URL — автономная Java-программа с собственным сетевым адресом).
- агент обработки текста сначала преобразует HTML-текст к представлению, с которым работают морфологический и синтаксический анализаторы, а затем проводит семантический анализ Web-страниц для проверки их релевантности запросу на основе соответствующей онтологии. Результат обработки текста представляется в виде синтаксического дерева, которое должно соответствовать какому-нибудь фрагменту используемой онтологии.
Каждый из перечисленных типов агентов наделен специальными знаниями, которые используются для повышения эффективности поиска информации. Агенты способны взаимодействовать друг с другом; обмениваться информацией, контактировать с Web-браузерами, анализаторами естественного языка и онтологическими базами данных.
Отличительной чертой системы MARRI является представление агентов автономными Java-программами, каждая из которых имеет собственный сетевой адрес (URL). Это обеспечивает мобильность агентов, но противоречит политике безопасности, не допускающей запуск подобных программ, если они не сертифицированы на данном сервере.