Многообразие задач, ситуаций и источников знаний обусловило появление большого количества методов извлечения, приобретения и формирования знаний. Одна из возможных классификаций методов извлечения знаний приведена на рис.1.1, на первом уровне которой выделены два больших класса. Первый класс образуют коммуникативные методы, которые ориентированы на непосредственный контакт инженера по знаниям с экспертом (источником знаний), второй класс — текстологические методы, основанные на приобретении знаний из документов и специальной литературы.
Рис. 1.1. Классификация методов извлечения знаний
Коммуникативные методы. Они разделяются на пассивные и активные. В пассивных методах ведущую роль играет эксперт, в активных — инженер по знаниям. При решении конкретных задач, как правило, используются как пассивные, так и активные методы. Активные методы делятся на индивидуальные и групповые. В групповых методах знания получают от множества экспертов, в индивидуальных — от единственного эксперта. Индивидуальные методы получили более широкое применение на практике по сравнению с групповыми.
Пассивные коммуникативные методы включают наблюдение, анализ протоколов «мыслей вслух», процедуры извлечения знаний из лекций.
Метод наблюдения является одним из наиболее применяемых на начальных этапах разработки экспертных систем. Его суть заключается в фиксировании всех действий эксперта, его реплик и объяснений. При этом аналитик не вмешивается в работу эксперта, а только наблюдает за процессом решения реальных задач либо за решением проблем, имитирующих реальные задачи. Наблюдения за процессом решения реальных задач позволяют инженеру по знаниям глубже понять предметную область. Однако эксперт в этом случае испытывает большое психологическое напряжение, понимая, что осуществляет не только свою профессиональную деятельность, но и демонстрирует ее инженеру по знаниям.
Метод анализа протоколов «мыслей вслух» отличается от метода наблюдения тем, что эксперт не только комментирует свои действия, но и объясняет цепочку своих рассуждений, приводящих к решению. Основной проблемой, возникающей при использовании этого метода, является принципиальная сложность для любого человека словесного описания собственных мыслей и действий. Повысить полноту и качество извлекаемых знаний можно за счет многократного уточняющего протоколирования рассуждений эксперта.
Метод извлечения знаний из лекций предполагает, что эксперт передает свой опыт инженеру по знаниям в форме лекций. При этом инженер по знаниям может заранее сформулировать темы лекций. Если этого не удается сделать, то когнитолог конспектирует лекции и задает вопросы. Качество информации, предоставленной экспертом в ходе лекции, определяется четкостью сформулированной темы, а также способностями лектора в структурировании и изложении своих знаний и рассуждений.
Сравнительные характеристики пассивных методов извлечения знаний приведены в табл. 1.2.
Одна из возможных классификаций людей по психологическим характеристикам делит всех на три типа:
- мыслитель (познавательный тип);
- собеседник (эмоционально-коммуникативный тип);
- практик (практический тип).
Мыслители ориентированы на интеллектуальную работу, учебу, теоретические обобщения и обладают свойствами поленезависимости и рефлексивности. Собеседники — общительные, открытые люди, готовые к сотрудничеству. Практики предпочитают действия разговорам, хорошо реализуют замыслы других.
Таблица 1.2
Сравнительные характеристики пассивных методов извлечения знаний
Показатели | Наблюдения | «Мысли вслух» | Лекции |
Достоинства | Отсутствие вли- | Свобода само- | Свобода само- |
яния аналитика | выражения для | выражения для | |
и его субъектив- | эксперта | эксперта | |
ной позиции | Вербализация | Структуриро- | |
Максимальное | рассуждений | ванное изложе- | |
приближение | Отсутствие вли- | ние | |
аналитика к | яния аналитика | Высокая кон- | |
предметной об- | и его субъектив- | центрация | |
ласти | ной позиции | Отсутствие вли- | |
яния аналитика | |||
и его субъектив- | |||
ной позиции | |||
Недостатки | Отсутствие об- | Отсутствие об- | «Зашумлен- |
ратной связи | ратной связи | ность» деталями | |
Фрагментар- | Возможность | Слабая обратная | |
ность получен- | ухода «в сторо- | связь | |
ных коммента- | ну» в рассужде- | Недостаток хо- | |
риев | ниях эксперта | роших лекторов | |
среди экспер- | |||
тов-практиков | |||
Требования к | Собеседник или мыслитель (спо- | Мыслитель | |
эксперту (типы | собность к вербализации мыслей, | (лекторские | |
и основные ка- | аналитический склад ума, откры- | способности) | |
чества) | тость, рефлексивность) | ||
Требования к | Мыслитель (на- | Мыслитель или | Мыслитель (по- |
аналитику (типы | блюдательность, | собеседник (по- | ленезависи- |
и основные ка- | поленезависи- | ленезависи- | мость, способ- |
чества) | мость) | мость, способ- | ность к обще- |
ность к обще- | нию) | ||
нию) | |||
Характеристика | Слабо- и среднеструктурированные, | Слабоструктури — | |
предметной об- | слабо- и среднедокументированные | рованные, сла- | |
ласти | бодокументиро- | ||
ванные |
Предметные области отличаются уровнем документированное™ и структурированности.
- хорошо структурированными (с четкой аксиоматизацией, широким применением математического аппарата, устоявшейся терминологией);
- среднеструктурированными (с определившейся терминологией, развивающейся теорией, явными взаимосвязями между явлениями);
- слабоструктурированными (с размытыми определениями, богатым эмпирическим материалом, скрытыми взаимосвязями).
Рис. 1.3. Классификация предметных областей по уровню документированности:
Активные индивидуальные методы включают методы анкетирования, интервьюирования, свободного диалога и игры с экспертом. Сравнительный анализ методов данной группы приведен в табл. 1.4.
Таблица 1.4
Сравнение активных индивидуальных методов
Показатели | Анкетирование | Интервьюирование | Свободный диалог |
Достоинства | Возможность стандартизированного опроса нескольких экспертов Не требует особенного напряжения от аналитика во время процедуры анкетирования | Наличие обратной связи (возможность уточнения контекста и разрешения противоречий) | Гибкость Обратная связь Возможность изменения сценария и формы сеанса |
Недостатки | Требует умения и опыта составления анкет Отсутствие контекста и обратной связи. Вопросы анкеты могут быть неправильно поняты экспертом | Требует значительного времени на подготовку вопросов интервью | Требует от аналитика высочайшего напряжения Отсутствие формальных методик проведения Трудность протоколирования результатов |
Требования к эксперту | Практик и мыслитель | Собеседник и мыслитель | |
Требования к аналитику | Мыслитель (педантизм в составлении анкет, внимательность) | Собеседник (журналистские навыки, умение слушать) | Собеседник (наблюдательность, умение слушать, обаяние) |
Характеристика предметной области | Слабоструктурированные, слабо- и среднедокументи-рованные |
Преимуществом методов анкетирования является то, что анкета или вопросник составляются инженером по знаниям заранее и используются для опроса экспертов. Составление анкеты следует проводить с учетом рекомендаций, выработанных в социологии и психологии. Основными требованиями к анкетам являются следующие:
- Анкета не должна быть монотонной и однообразной, чтобы не вызывать скуку или усталость. Для этого необходимо разнообразить тематику и форму задания вопросов, включить вопросы-шутки и применить стиль игры.
- Анкета должна быть приспособлена к языку эксперта.
- Следует учитывать, что вопросы влияют друг на друга, поэтому важно расположить их в правильной последовательности.
- В анкете должно содержаться оптимальное число избыточных вопросов, часть которых предназначена для контроля правильности ответов, а другая часть — для снятия напряжения.
Метод интервьюирования отличается от метода анкетирования тем, что позволяет аналитику опускать ряд вопросов в зависимости от ситуации, вставлять новые вопросы в анкету, изменять темы и разнообразить ситуацию общения. Важную роль в методе интервьюирования играют вопросы, классификация которых показана на рис. 1.5.
Рис. 1.5. Классификация вопросов при интервьюировании
Открытый вопрос называет тему или предмет, оставляя эксперту полную свободу в отношении формы и содержания ответа. Закрытый вопрос предлагает эксперту выбрать ответ из предложенного набора.
Личный вопрос непосредственно касается личного опыта эксперта. Безличный вопрос направлен на выявление наиболее распространенных закономерностей предметной области.
Прямой вопрос непосредственно указывает на интересующий предмет или тему (используется при «зажатости» эксперта). Косвенный вопрос исподволь затрагивает рассматриваемую проблему.
Вербальный вопрос — традиционный устный вопрос. Вопрос с использованием наглядного материала позволяет разнообразить интервью и снять усталость эксперта (используются фотографии, рисунки, карточки).
Основной вопрос направлен на выявление знаний. Зондирующий вопрос направляет рассуждения эксперта в нужную сторону. Контрольный вопрос проверяет достоверность и объективность информации, полученной в интервью ранее.
Нейтральный вопрос подчеркивает беспристрастность инженера по знаниям к предмету исследования. Наводящий вопрос ориентирует эксперта принять во внимание позицию инженера по знаниям.
Дополнительно в интервью рекомендуется включать следующие вопросы: контактные (снимающие психологический барьер между аналитиком и экспертом), буферные (разграничивающие отдельные темы интервью), оживляющие память экспертов (реконструирующие отдельные случаи из практики), «провоцирующие» (способствующие получению неподготовленных ответов).
При использовании метода интервьюирования следует иметь в виду, что его эффективность во многом определяется языком вопросов (понятностью, лаконичностью, терминологией); порядком вопросов (логическая последовательность); уместностью вопросов (этичностью и вежливостью).
Прежде чем готовить вопросы, аналитик должен овладеть ключевым набором знаний исследуемой предметной области, поскольку любой вопрос имеет смысл только в контексте.
Метод свободного диалога позволяет извлекать знания в форме беседы с экспертом, поэтому здесь не предусматривается использование жесткого вопросника или плана. В то же время подготовка к свободному диалогу должна проводиться по специальной методике, в которую входит общая, специальная, конкретная и психологическая подготовка. Общая подготовка направлена на повышение научной эрудиции, овладение общей культурой, знакомство с системной методологией. Специальная подготовка сводится к овладению теорией и навыками интервьюирования. Конкретная подготовка предполагает изучение предметной области, подготовку ситуации общения, знакомство с экспертом, тестирование эксперта. Психологическая подготовка включает знакомство с теорией общения и с когнитивной психологией.
Игры с экспертом существенно отличаются от приведенных выше индивидуальных активных методов извлечения знаний и рассматриваются в классе групповых активных методов, где особое место принадлежит ролевым и экспертным методам.
Активные групповые методы включают «мозговой штурм», дискуссии за круглым столом и ролевые игры. Групповые методы позволяют творчески интегрировать знания множества экспертов. Сравнительный анализ методов приведен в табл. 1.6.
Метод «мозгового штурма» — один из наиболее известных и широко применяемых методов генерирования новых идей путем творческого сотрудничества группы специалистов. Являясь в некотором смысле единым мозгом, группа пытается штурмом преодолеть трудности, мешающие разрешить рассматриваемую проблему. В процессе такого штурма участники выдвигают и развивают собственные идеи, стимулируя появление новых и комбинируя их. Для обеспечения максимального эффекта «мозговой штурм» должен подчиняться определенным правилам и основываться на строгом разделении во времени процесса выдвижения идей и процесса их обсуждения и оценки. На первой стадии штурма запрещается осуждать выдвинутые идеи и предложения (считается, что критические замечания уводят к частностям, прерывают творческий процесс, мешают выдвижению идей). Роль аналитика состоит в том, чтобы активизировать творческое мышление участников заседания и обеспечить выдвижение возможно большего числа идей.
Таблица 1.6 Сравнение активных групповых методов извлечения знаний
Показатели | «Мозговой штурм» | Дискуссия за круглым столом |
Достоинства | Позволяет выявлять глубинные пласты знаний (на уровне бессознательного) Активизирует экспертов Позволяет получать новые знания | Позволяет получать более объективные фрагменты знаний Оживляет процедуру извлечения знаний Позволяет участникам обмениваться знаниями |
Недостатки | Возможен только для новых интересных исследовательских проблем Не всегда эффективен (довольно низкий процент продуктивных идей) | Требует больших организационных затрат Отличается сложностью проведения |
Требования к эксперту | Мыслитель (способность к творчеству) | Собеседник или мыслитель (искусство полемики) |
Требования к аналитику | Собеседник или мыслитель (быстрая реакция и чувство юмора) | Собеседник (дипломатические способности) |
Характеристика предметной области | Слабоструктурированные и слабодокумен-тированные с наличием перспективных «белых пятен» | Слабоструктурированные и слабодокумен-тированные с наличием спорных проблем |
После выдвижения идей выполняются тщательное их обсуждение, оценка и отбор лучших. На стадии обсуждения участники «мозгового штурма» должны сконцентрироваться на положительных сторонах идей, найти в них рациональные зерна и предложить направления их развития. Выдвигаемые в процессе обсуждения дополнительные идеи могут базироваться на идеях других участников или, наоборот, служить для них фундаментом, катализатором. Значительный эффект дает комбинирование идей при одновременном выявлении преимуществ и недостатков синтезируемых при этом вариантов.
Метод «мозгового штурма» эффективен при решении не слишком сложных задач общего организационного характера, когда проблема хорошо знакома всем участникам заседания и по рассматриваемому вопросу имеется достаточная информация. Существует ряд модификаций этого метода.
Индивидуальный «мозговой штурм» проводится по тем же правилам, что и коллективный, но выполняется одним экспертом, который одновременно генерирует идеи, дает им объективную оценку и критикует их.
Массовый «мозговой штурм» проводится в массовой аудитории (до нескольких десятков человек). Отбор идей проводится на промежуточных этапах. Эксперты группируются по 6 — 8 человек, при этом важно, чтобы непосредственное отношение к задаче имел лишь руководитель группы, а остальные были лишь знакомы с нею (иначе амбиции могут сыграть негативную роль). Штурм проводится в два этапа. На первом этапе оперативные группы осуществляют прямой коллективный «мозговой штурм».
При этом желательно, чтобы каждая группа работала над задачей, наиболее близкой по тематике к профилю вошедших в нее специалистов. На втором этапе руководители каждой группы в течение нескольких минут оценивают выдвинутые идеи, отбирают из них наиболее интересные и сообщают их на «пленарном заседании».
Двойной «мозговой штурм» органически соединяет в себе процессы генерирования идей и их доброжелательной позитивной критики.
Обратный «мозговой штурм» отличается от прямого тем, что в нем больше внимания уделяется критике высказанных идей.
Метод дискуссии за круглым столом предполагает равноправное обсуждение экспертами поставленной проблемы. Отличительной особенностью метода дискуссии является коллективное рассмотрение предметной области с разных точек зрения и исследование спорных гипотез.
Экспертные игры предназначены для извлечения знаний и базируются на деловых, диагностических и компьютерных играх (табл. 1.7).
По числу участников игры подразделяют на индивидуальные (игры с экспертом) и групповые (ролевые игры в группе). По применению специального оборудования — игры с тренажерами и игры без реквизита. Особый класс представляют собой компьютерные игры.
В играх с экспертом инженер по знаниям берет на себя чью-нибудь роль в моделируемой ситуации. Ролевые игры в группе предусматривают участие в игре нескольких специалистов. Участники игры наделяются определенными ролями, а собственно игра проводится по составленному когнитологом сценарию. В целях повышения эффективности ролевых игр в них необходимо вводить элементы состязательности.
Игры с применением тренажеров позволяют зафиксировать трудно уловимые знания, которые возникают в реальных ситуациях и могут быть потеряны при выходе из них.
Компьютерные экспертные игры в настоящее время используются в основном в целях обучения. Они полезны для «разминки» экспертов перед сеансом извлечения знаний.
Таблица 1.7
Сравнительные характеристики экспертных | игр | ||
Экспертные игры | |||
Показатели | |||
индивидуальные | групповые | компьютерные | |
Достоинства | Дают возмож- | Реалистично | Вызывают инте- |
ность сравни- | воссоздают ат- | рес у эксперта | |
тельно быстро | мосферу кон- | Привлекают ди- | |
получить каче- | кретной задачи | зайном и дина- | |
ственную карти- | Раскрепощают | микой | |
ну принятия ре- | экспертов | ||
шения | Групповые заня- | ||
Позволяют вы- | тия более объек- | ||
яснить, какую | тивны | ||
информацию и | Выявляют логи- | ||
как использует | ку и аргумента- | ||
эксперт | цию экспертов | ||
Недостатки | Отсутствие ме- | Требуют от ана- | Сложность и |
тодик и стан- | литика знания | высокая стои- | |
дартного набора | основ игротех- | мость создания | |
игр | ники | специализиро- | |
Высокие про- | Сложность со- | ванных игр в | |
фессиональные | здания игр для | конкретной | |
требования к | конкретных | предметной об- | |
аналитику | предметных об- | ласти | |
ластей | |||
Требования к | Собеседник или практик (раско- | Практик (без | |
эксперту | ванность и актерское мастерство) | психологическо- | |
го барьера к | |||
ЭВМ) | |||
Требования к | Собеседник (ре- | Собеседник | Мыслитель |
аналитику | жиссерские спо- | (способность к | (контакт с про- |
собности, уме- | ведению конфе- | граммистом) | |
ние создавать | ранса, режис- | ||
сценарии, ак- | серские способ- | ||
терское мастер- | ности, актерское | ||
ство) | мастерство) | ||
Характеристика | Средне-и слабоструктурированные и | слабодокументи- | |
предметной | рованные | ||
области |
Текстологические методы включают методы извлечения знаний, основанные на изучении текстов учебников, специальной литературы и документов. Текстология — это наука, целью которой является практическое прочтение текстов, изучение и интерпретация литературных источников, а также рассмотрение семиотических, психолингвистических и других аспектов извлечения знаний из текстов. Схема извлечения знаний из специальных текстов приведена на рис. 4.10, где— смысл, заложенный автором и основанный на его собственной модели мира; — смысл, который постигает инженер по знаниям;— интерпретация текста, изложенного словесно; Т— словесное изложение знаний; V — результат вербализации.
Рис. 1.8. Схема извлечения знаний из текста
Научный текст Т, который формируется автором на основе модели М1 включает в себя пять компонентов, пофуженных в языковую среду— первичный материал наблюдений;— система научных понятий;— субъективный взгляд автора;— дополнительная информация, не касающаяся научного знания (общие места);— заимствования. На процесс понимания (интерпретации)и на модель М2 влияют следующие компоненты:— экстракт компонентов, почерпнутый из текста— предварительные знания аналитика о предметной области; е — общенаучная эрудиция инженера по знаниям;— личный опыт аналитика.
Автор книги, являющийся в данном случае экспертом, на основании собственной модели мирапишет книгу, представляя свои знания в виде текста (см. рис. 1.8). Затем инженер по знаниям на основании своей модели знанийи информации, почерпнутой из текста Т, интерпретирует знания эксперта. Схема процесса извлечения знаний из текста показывает, что смысл М1, заложенный автором книги, отличается от смысла М2, который постигает читатель (инженер по знаниям). Эти различия определяются тем, насколько развиты факторыу конкретного аналитика (читателя).
Немецкий философ и языковед В. фон Гумбольдт так охарактеризовал сложную и трудно формализуемую процедуру взаимного понимания людей: «Люди понимают друг друга не потому, что передают собеседнику знаки предметов, и даже не потому, что взаимно настраивают друг друга на точное и полное воспроизведение идентичного понятия, а потому, что взаимно затрагивают друг в друге одно и то же звено цепи чувственных представлений и зачатков внутренних понятий, прикасаются к одним и тем же клавишам инструмента своего духа, благодаря чему у каждого вспыхивают в сознании соответствующие, но не тождественные смыслы».
Особую сложность представляет извлечение знаний из специальной литературы и методик, поскольку в них очень высока степень концентрации специальных знаний.
Простейший алгоритм извлечения знаний из текстов включает следующие шаги.
- Составить «базовый» список литературы для ознакомления с предметной областью.
- Выбрать текст для извлечения знаний.
- Беглое знакомство с текстом. Провести консультации со специалистами для определения значений незнакомых слов.
- Сформировать первую гипотезу о макроструктуре текста.
- Внимательно прочитать текст и выписать ключевые слова и выражения, определив тем самым «смысловые вехи».
- Определить связи между ключевыми словами, разработать макроструктуры текста в форме фафа или реферата.
- Сформировать новое представление знаний на основании макроструктуры текста.