Процессы извлечения знаний рассматривают в трех основных аспектах: психологическом, лингвистическом и гносеологическом (рис. 1.1).
Психологический аспект. Это самый важный из всех аспектов, так как извлечение знаний происходит в процессе общения когнитологов с экспертами, где психология играет доминирующую роль.
Процесс извлечения знаний для интеллектуальных систем необходимо организовать не как однонаправленный процесс передачи сообщений от эксперта аналитику, а как совместный поиск истины.
В процессе разговорного общения много информации теряется, поэтому важной проблемой является увеличение информативное™ общения аналитика и эксперта за счет использования методик, выработанных в психологии (рис. 1.1).
Рис 1.1 Аспекты извлечения знаний
Модель общения включает участников общения, средства общения и предмет общения (знания). В соответствии с этими компонентами выделяются три слоя психологических проблем: контактный, процедурный, когнитивный.
Степень информативности общения аналитика и эксперта на уровне контактного слоя зависит в основном от пола, возраста, темперамента личности и мотивации участников общения. Установлено, что хорошие результаты дают гетерогенные пары (мужчина/женщина) и соотношение возрастов:
Рис. 1.2. Потери информации при разговорном общении
Желательно, чтобы участники процесса общения обладали такими качествами, как доброжелательность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, собранность, настойчивость, общительность и находчивость.
В рамках контактного слоя наиболее предпочтительными из четырех классических типов темперамента являются сангвиники и холерики.
Параметры процедурного слоя обеспечивают эффективность извлечения знаний.
Под когнитивным стилем человека понимается специфическая совокупность критериев, используемых им в процессе познания мира для решения различных задач. Когнитивный стиль — 160161это система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности, обеспечивающей достижение желаемых результатов. Для повышения эффективности извлечения знаний целесообразно подбирать экспертов и аналитиков, обладающих вполне определенными характеристиками когнитивного стиля. Наиболее важными из них являются следующие: поленезависимость (независимость от шумового поля), импульсивность — рефлексивность, жесткость — гибкость, когнитивная эквивалентность.
Желательно, чтобы и аналитики, и эксперты обладали следующими когнитивными характеристиками:
Для эффективного построения ИИС инженер по знаниям должен владеть специальными неформальными методами и математическим аппаратом, позволяющими ему воссоздавать полученные от эксперта знания с помощью различных моделей, например, таких, как продукционная или фреймовая. Не навязывая эксперту какой-либо модели, аналитик должен подобрать средства представления знаний, имеющие максимально высокую семантическую репрезентативность.
Лингвистический аспект. Актуальность исследования этого аспекта определяется тем, что язык является основным средством общения в процессе извлечения знаний. В области лингвистических проблем наиболее важными являются понятия: общий код, понятийная структура, словарь пользователя.Общим кодом называют специальный промежуточный язык общения между экспертом и инженером по знаниям. Этот язык включает совокупность общенаучных и специальных понятий из профессиональной литературы, элементов базового языка, неологизмов и т.п. (рис. 1.3). Общий код позволяет преодолеть языковой барьер в процессе общения когнитологов с экспертами. Выработка общего кода для партнеров осуществляется в соответствии с информационными потоками, представленными на рис. 1.3.
Рис 1.3. Структура формирования общего кода
В дальнейшем общий код преобразуется в понятийную структуру, или семантическую сеть, которая связывает понятия, хранящиеся в памяти человека. Выявление отношений между элементами знаний, представленных понятиями, является одной из самых сложных проблем в процессах извлечения знаний. Хорошо известно, что естественные знания человека представляют собой связанные структуры, а не разрозненные фрагменты. Однако до настоящего времени при разработке БЗ учитывается весьма ограниченный набор связей между понятиями, в то время как в действительности существует большое разнообразие таких отношений. Д. А. Поспелов выделяет более 200 базовых видов отношений между понятиями. Такое многообразие делает невозможным однозначное определение набора признаков, описывающих конкретное понятие, и, как следствие, однозначную классификацию понятий. Очевидно, сложность данной проблемы является главной причиной того, что на сегодняшний день отсутствуют надежные методики формирования понятийных структур.
Тем не менее построение той или иной иерархии понятий входит в задачи концептуального анализа структуры знаний любой предметной области. В последнее время в ИИ стал широко употребляться термин онтология, имеющий многозначную интерпретацию, в частности приводятся следующие его определения.
Разработка словаря пользователя необходима в связи с тем, что конечный пользователь не обязан владеть профессиональным языком предметной области, который использовался при построении БЗ. Интерфейс пользователя создается, как правило, путем доработки словаря общего кода.
Гносеологический аспект. Он объединяет методологические проблемы получения нового научного знания, так как процесс познания часто сопровождается появлением новых понятий и теорий. В процессе разработки БЗ эксперты довольно часто впервые формулируют некоторые закономерности на основе накопленного эмпирического опыта. Последовательность факт—> обобщенный факт—>эмпирический закон—>теоретический закон называется гносеологической цепочкой. Теория — это не только система обобщения накопленных знаний, но и способ получения нового знания.
Основными критериями качества новых знаний являются внутренняя согласованность, системность, объективность, историзм.
В процессе извлечения знаний аналитиков прежде всего интересуют эмпирические знания экспертов, представляющие собой результаты наблюдений, которые могут оказаться несогласованными. Внутренняя согласованность эмпирических знаний характеризуется понятиями модальности, противоречивости, неполноты. Под модальностью знания понимается возможность его существования в различных категориях. Противоречивость является естественным свойством эмпирических знаний и не всегда может и должна быть устранена. Напротив, противоречивость может служить отправной точкой в рассуждениях экспертов. Неполнота знаний связана с невозможностью исчерпывающего описания любой предметной области.
Системность знаний основана на определении места новых знаний в многоуровневой иерархической организации. При этом необходимо найти ответы на вопросы: какие понятия детализируют или обобщают новые знания и в каких отношениях они состоят с известными фактами и закономерностями?
Объективность знаний определить практически невозможно. Процессы накопления, описания, представления, обработки, интерпретации и оценивания качества знаний выполняются конкретными людьми, поэтому их результаты имеют субъективный характер. Объективность некоторых закономерностей часто связывают с широтой области их применимости. Границы этой области можно установить экспериментальным или теоретическим путем, но далеко не всегда. В качестве косвенных свидетельств объективности иногда допускают совпадение представлений различных экспертов и подтверждение выдвинутых гипотез известными фактами.
Историзм знаний связан с развитием и изменением представлений о предметной области с течением времени.
Процесс познания можно представить следующими этапами:
На начальных этапах инженер по знаниям, исследуя структуру умозаключений эксперта, может использовать разные теории и подходы для построения формальной модели знаний предметной области. Наиболее известными и часто применяемыми приемами являются математическая логика, теория ассоциаций и гештальт-психология.
Математическая логика формирует критерии, которые гарантируют точность, значимость и непротиворечивость общих понятий, рассуждений и выводов. Применяя логический подход, когнитолог выполняет следующие операции: определение понятий, выявление сходства и различия, анализ, абстрагирование, обобщение, классификацию, образование суждений, составление силлогизмов и т.д. Проблема применения логического подхода к представлению знаний заключается в том, что человек не всегда мыслит категориями строгой классической логики, а естественная система знаний не является полной, допускает противоречия и многозначные оценки истинности.
В теории ассоциаций мышление представляется в виде цепочки идей, связанных общими понятиями. Здесь применяются следующие приемы:
Гештальт-психология ориентирует аналитика на выделение целостного образа или структуры знаний {гештальта) как основы для понимания процессов и явлений окружающего мира. Понятие гештальта во многом согласуется с понятием фрейма. Применение данной теории ориентирует эксперта на формирование модели знаний в соответствии с критериями простоты, связности и гармонии.
Идеализированная модель знаний предметной области строится на основе установленных логических связей между понятиями. Модель формализуется с помощью категориального аппарата, формально-знаковых средств математики и логики. Для адекватного отображения в модели реальной картины мира инженеру по знаниям необходимо владеть такими приемами, как идеализация, абстрагирование, огрубление. Критерием качества построенной модели является способность ИИС делать прогнозы и объяснять множество явлений из заданной предметной области. Инженер по знаниям должен стремиться, чтобы результирующая модель знаний была достаточно полной, связной и непротиворечивой.
Если основа оригинала (карты пли плана) прозрачна, то копию можно снять при помощи стола со…
Определение координат точки. Пусть точка А (рис. 32) находится в квадрате, абсциссы и ординаты вершин…
Рельефом местности называется совокупность неровностей физической поверхности земли. В зависимости от характера рельефа местность делят…
Для обозначения на планах и картах различных предметов местности, применяются специально разработанные условные знаки. Для обличения…
В инженерной геодезии чаще всего пользуются топографическими картами. Их составляют в масштабах 1:10000, 1:25000, 1:50000…