Реферат - Модели представления знаний - файл n1.doc

Реферат - Модели представления знаний
Скачать все файлы (345.5 kb.)

Доступные файлы (1):
n1.doc346kb.01.02.2014 19:09скачать

n1.doc

  1   2


Аннотация


В данной работе предполагается рассмотреть модели представления знаний.

В целом, анализ литературы по данной теме свидетельствует о том, что модели представления знаний – это одно из важнейших направлений исследований в области искусственного интеллекта. Почему одно из важнейших? Да потому, что без знаний искусственный интеллект не может существовать в принципе. Действительно, представьте себе человека, который абсолютно ничего не знает. Например, он не знает даже таких элементарных вещей как:

Объектом исследования в данной работе выступают эмпирические и теоретические модели представления знаний.

В работе использовались такие методы исследования как метод анализа литературы по анализу данных, сравнительный подход, обработка информации по периодическим изданиям.

Работа состоит из 3 глав, содержит 7 рисунков.


Содержание:

Введение………………………………………………………………………..4

Глава 1. Представление знаний. Модели представления знаний…………..5

    1. Данные, информация и знания..……………………………………….5

    2. Классификация знаний……………………….…………………….…..6

    3. Особенности представления знаний внутри ИС………………….…..7

    4. Нейронные сети, генетические алгоритмы……………………………8

Глава 2. Эмпирические модели представления знаний.………….………..10

    1. Продукционные модели………...………………………………...…...10

    2. Сетевые модели………………..……………………………………….15

    3. Фреймовые модели……………..………………………………...……18

    4. Ленемы………………………………………………………………….21

Глава 3. Теоретические модели……………………………………….……...22

    1. Логические модели……………………………………………………..22

    2. Формальные модели……………………………………………………29

    3. Комбинаторные модели………………………………………………..29

    4. Алгебраические модели………………………………………………..31

Заключение…………………………………………………………………….32

Список использованной литературы…………………………………………33


Введение

В повседневной жизни, порой не замечая этого, человек постоянно обрабатывает информацию: получает ее, запоминает, вспоминает, делает выводы, анализирует, вносит поправки в свои суждения, строит на основе полученных знаний и предположений свое поведение. Поэтому логично предположить, что, задавшись целью создать искусственный интеллект равный по мощности (или даже превосходящий) человеческому, захочется наделить этот новый разум аналогичными способностями (как минимум) к восприятию окружающей среды, речи, анализу ситуации, построению выводов, предположений, обладанию характером, памятью. Некоторые из этих пунктов весьма и весьма спорны, однако, все во многом зависит от того, какими

именно чертами мы хотим наделить искусственный интеллект. Так, например, имитация характера и настроения совсем не обязательна и может даже мешать достижению поставленных целей и объективной оценке, в то время как для прохождения теста Тьюринга она может быть необходима.

Объектом изучения данной работы являются модели представления знаний.

Предмет изучения – рассмотрение методики моделей представления знаний.

Целью данной работы является изучение эмпирических и теоретических моделей знаний.

Задачи:

  1. рассмотреть понятие «представление знаний»;

  2. рассмотреть теорию моделей представления знаний;

  3. проанализировать возможности моделей представления знаний;

  4. изучить особенности моделей представления знаний;

  5. рассмотреть основные модели представления знаний.



ГЛАВА 1. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ. МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
1.1. Данные, информация и знания

Прежде, чем рассуждать о представлении знаний в доступном и понятном машине виде, требуется определиться с терминологией. Это в достаточной степени проблематично, так как такие термины, как информация, данные и знания не имеют четкого определения, а то множество определений, что были созданы человечеством, иногда не просто частично пересекаются, а даже противоречат одно другому. Перечислим некоторые из них, которые более точно описывают нашу предметную область.

Данные — факты и идеи, представленные в некотором, четко формализованном виде, в котором их можно использовать для передачи в информационном процессе;

— сведения, представленные в определенной знаковой системе и на определенном материальном носителе для обеспечения возможностей хранения, передачи, приема и обработки.

Информация — данные, определенным образом организованные, имеющие для своего получателя смысл, значение и ценность, необходимые ему для принятия решений, а также реализации других функций;

— это данные, сопровождающиеся смысловой нагрузкой, помещенные в некоторый контекст; данные, как-либо оцениваемые получателем информации. При этом то, что для одних является данными, для других может оказаться информацией.

Знания — проверенная информация и/или та информация, которой доверяют, результаты принятия решений, поведения, обобщенные в виде теорем и законов, совокупности взглядов;

— зафиксированная и проверенная практикой информация, которая может многократно использоваться людьми для решения тех или иных задач.

Таким образом, мы получаем следующие закономерности:



Рис. 1 Диаграмма закономерностей

При этом на данной диаграмме при движении слева направо уменьшается формализованность представления. И стоящая перед нами задача — представление знаний, самой неформальной сущности.
1.2. Классификация знаний



Рис. 2 Схема классификации знаний

Можно найти и другие критерии для классификации знаний, но уже этого достаточно, чтобы показать разнородность человеческих знаний. Так, эмпирическое знание может быть одновременно и процедурным и личностным.

Логично предположить, что для описания той или иной категории лучше подходят определенные средства, в то время как другие значительно понижают эффективность хранения и/или использования. Остановимся на общих моментах, абстрагировавшись от вида категории знаний.

1.3. Особенности представления знаний внутри ИС

Представление знаний в памяти ЭВМ или на внешних носителях должно иметь особенности, отличающие знания от данных, например, такие как:

∙ внутренняя интерпретируемость;

∙ структурированность;

∙ связность;

∙ семантическая метрика;

∙ активность;

∙ конвертируемость.

Сперва следует отдельно указать, что обрабатываемой единицей для знаний является факт, а не запись данных. Факт — это некоторая запись, наделенная семантикой. Теперь рассмотрим каждый вышеобозначенный пункт в отдельности.

Внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в которых это имя упомянуто. Роль имени может выполнять набор аттрибутов. Смысл такого расширения данных — идентифицировать данные и их назначение должна уметь не только посторонняя программа, которая обладает информацией о том, как правильно расшифровать эти данные, но и сама система.

Структурированность. Информационные единицы должны обладать гибкой структурой. Для них может выполняться рекурсия — вложимость одних информационных единиц в другие. Иначе говоря, должна существовать возможность произвольного установления между отдельными информационными единицами отношений типа часть—целое, род—вид или элемент—класс.

Связность. Между информационными единицами должна быть предусмотрена возможность установления связей различного типа. Семантика отношений может носить декларативный или процедурный характер. Например, две и более информационные единицы могут быть связаны отношением одновременно, две информационные единицы — отношением причина—следствие или быть рядом.

Семантическая метрика. На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее их ситуационную близость, т.е. силу ассоциативной связи. Отношение релевантности при работе с информационными единицами позволяет находить знания, близкие к уже найденным, но не имеющие с ними прямой связи. Этот пункт считается критичным для моделирования человеческих воспоминаний, построения ассоциаций, моделирования процесса генерации идей.

Активность. Данные обычно пассивны и используются командами в случае необходимости. Для ИС выполнение программ должно наоборот инициироваться текущим состоянием системы.

Конвертируемость. Содержание знаний не должно зависить от его записи. Поэтому форма представления, уровень детализации и степень неопределенности информации о предметной области может трансформироваться в процессе перехода к очередному этапу решения интеллектуальной задачи. Это свойство, в отличие от предыдущих, отражает динамичность знаний и связано с обучением системы.
1.4. Нейронные сети, генетические алгоритмы

Эти модели нельзя строго отнести к эмпирическому или теоретическому подходам. Их относят, как было сказано ранее, к бионическому направлению. Оно основывается на предположении о том, что если в искусственной системе воспроизвести структуры и процессы человеческого мозга, то и результаты решения задач такой системой будут подобны результатам, получаемым человеком. Так, в нейронных сетях моделируются персептроны и их поведение, призванные скопировать дейтельность мозга, а генетические алгоритмы несут в себе принципы естественного отбора и эволюции (за счет внесения изменений через мутации и смешение наследственностей).

Особенностью моделей этого типа является широкое использование эвристик, что в каждом случае требует доказательства правильности получаемых решений.

Глава 2. ЭМПИРИЧЕСКИЕ МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
В настоящее время разработано множество моделей представления знаний. Имея обобщенное название, они различаются по идеям, лежащим в их основе, с точки зрения математической обоснованности. Типы моделей показаны на рисунке 3.



Рис 3. Схема моделей представления знаний

2.1. Продукционные модели

Это одна из самых распространенных моделей представления знаний. В ее основе лежит набор правил вида если условие, то действие, описывающих знания. Оперируя этими правилами можно построить прямой или обратный вывод. Прямой вывод — это поиск действия по заданному условию, обратный — поиск возможных условий, которые могли бы привести к указанному действию. Продукционная модель понятна и с ее помощью можно легко записать поведение или даже построение выводов, однако при достаточном количестве правил возникает противоречивость некоторых из них, которая приводит модель в негодность. Также к ее недостаткам можно отнести неясность взаимных отношений правил и сложность оценки базы знаний.

Определение: продукционная модель или модель, основанная на правилах, позволяет представлять знания в виде правил

«Если А, то В».

Сложные продукции:

«Если А1 и А2, то В»

«Если А1 или А2, то В»

«Если не А, то В»

«Если А1 и А2 или А3, то В»

«Если А1 и (А2 или А3), то В»

«Если А, то В1 и В2»

«Если А, то В1 ИЛИ В2»

Связанные продукции:

«Если А, то В»

«Если В, то С»

Продукции (наряду с сетевыми моделями) являются наиболее по­пу­ляр­ными средствами представления знаний в информационных системах. В общем виде под про­дук­цией понимают выражение вида A ® B. Обычное прочтение продукции выглядит так: ЕСЛИ А, ТО B. Импликация может истолковываться в обычном логическом смысле, как знак логи­ческо­го следования B из истинного А. Возможны и другие интер­пре­та­ции про­дукции, например, А описывает некоторое условие, не­об­хо­ди­мое, чтобы можно было совершить действие B.

Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа

«Если (условие), то (действие)».

Под условием понимается некоторое предложение — образец, по ко­то­рому осуществляется поиск в базе знаний, а под действием — действия, выполняемые при успешном исходе поиска (они могут быть про­ме­жу­точ­ными, выступающими далее как условия, и терминальными или целевыми, завершающими работу системы).

При использовании продукционной модели база знаний состоит из набора правил, Программа, управляющая перебором правил, называется машиной вывода. Чаще всего вывод бывает прямой (от данных к поиску цели) или обратный (от цели для ее подтверждения – к данным). Данные — это исходные факты, на основании которых запускается маши­на вывода.

Если в памяти системы хранится некоторый набор продукций, то они об­ра­зуют систему продукций. В системе продукций должны быть заданы спе­ци­альные процедуры управления продукциями, с помощью которых происходит актуализация продукций и выполнение той или иной про­дук­ции из числа ак­ту­а­ли­зированных.

В состав системы продукций входит база правил (продукций), глобальная база данных и система управления. База правил – это область памяти, которая содержит совокупность знаний в форме правил вида ЕСЛИ – ТО.

Приведем несколько примеров.

Правило 1.

ЕСЛИ (намерение — отдых) и

(дорога ухабистая)

ТО   (использовать джип)

Правило 2.

ЕСЛИ (место отдыха — горы)

ТО   (дорога ухабистая)

Глобальная база данных — область памяти, содержащая фак­ти­чес­кие данные (факты). Система управления формирует заключения, ис­поль­зуя базу пра­вил и базу данных. Существуют следующие способы форми­ро­ва­ния за­клю­че­ний — прямые и обратные выводы.

Правила вывода бывает удобно представлять в виде дерева решений. Граф — множество вершин, связанных дугами. Дерево — граф, не содер­жа­щий циклов.

В прямых выводах выбирается один из элементов данных, содержащихся в базе данных, и если при сопоставлении этот элемент согласуется с левой частью правила (посылкой), то из правила выводится соответствующее за­клю­че­ние и помещается в базу данных или исполняется действие, определяемое пра­вилом, и соответствующим образом изменяется содержимое базы данных.

В обратных выводах процесс начинается от поставленной це­ли. Если эта цель согласуется с правой частью правила (заключением), то посылка правила принимается за подцель или гипотезу. Этот процесс повторяется до тех пор, пока не будет получено совпадение подцели с данными.

Пример. Имеется фрагмент базы знаний из двух правил:

 П1: Если (отдых – летом) и (человек – активный)

то   (ехать в горы)

П2: Если (любит – солнце)

то (отдых – летом)

Предположим, в систему поступили данные — (человек­ – активный) и (любит – солнце).

Прямой вывод — исходя из данных, получить ответ.

1-й проход.

Шаг 1. Пробуем П1, не работает (не хватает данных (отдых–летом)).

Шаг 2. Пробуем П2, работает, в базу поступает факт (отдых–летом).

2-й проход.

Шаг 3. Пробуем П1, работает, активируется цель (ехать в горы), которая и выступает как вывод.

Обратный вывод — подтвердить выбранную цель при помощи имеющихся правил и данных.

1-й проход.

Шаг 1. Цель — (ехать в горы): пробуем П1 — данных  (отдых– летом) нет, они становятся новой целью, и ищется правило, где она в правой части.

Шаг 2. Цель (отдых – летом): правило П2 подтверждает цель и активирует ее.

2-й проход.

Шаг 3. Пробуем П1, подтверждается искомая цель.

При большом числе продукций в продукционной модели услож­ня­ет­ся про­верка непротиворечивости системы продукций, то есть множества пра­вил. По­этому число продукций, с которыми работают современные системы искусственного интеллекта, как правило, не превышает тысячи.

Продукционная модель привлекает разработчиков своей нагляд­ностью, высокой модульностью, легкостью внесения дополнений и из­ме­не­ний и простотой механизма логического вывода.

Приведем сильные и слабые стороны систем продукций.

Сильные стороны систем продукций:

Слабые стороны систем продукций:

Представление знаний с помощью продукций иногда называют «плоским», так как в продукционных системах отсутствуют средства для установления иерархий правил. Объем знаний продукционных систем растет линейно, по мере включения в нее новых фрагментов знаний, в то время как в традиционных алгоритмических системах, использующих деревья решений, зависимость между объемом база знаний и количеством знаний является логарифмической.

Имеется большое число программных средств, реализующих про­дукционных подход: OPS5, EXSYS RuleBook, ЭКСПЕРТ, ЭКО, G2 и др.
2.2. Сетевые модели

Данная модель представления знаний была предложена американским психологом Куиллианом.

В основе моделей этого типа лежит конструкция, названная  семантической сетью. Семантический подход к построению систем искусственного интеллекта находит применение в системах понимания естественного языка, в воп­рос­но-ответных системах, в различных предметно-ориентированных сис­те­мах.

Термин семантическая означает смысловая, а сама семантика — это наука, устанавливающая отношения между символами и объектами, которые они обозначают, то есть наука, определяющая смысл знаков.

В самом общем случае семантическая сеть представляет собой ин­фор­­мационную модель предметной области и имеет вид графа, вершины ко­то­рого соответствуют объектам предметной области, а дуги — отно­ше­ни­ям между ними.

Дуги могут быть определены разными методами, зависящими от ви­да представляемых знаний. Обычно дуги, используемые для пред­ставления иерархии, включают дуги типа «множество», «под­мно­жество», «элемент». Семантические сети, применяемые для опи­сания естественных языков, исполь­зуют дуги типа «агент», «объект», «реципиент».

Понятиями обычно выступают абстрактные или конкретные объекты, а отношения — это связи типа: «это» («is»), «имеет частью» («has part»), «принадлежит», «любит». Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

· класс — элемент класса;

· свойство — значение;

· пример элемента класса.

Можно ввести несколько классификаций семантических сетей. Например, по количеству типов отношений:

· однородные (с единственным типом отношений);

· неоднородные (с различными типами отношений).

По типам отношений:

· бинарные (в которых отношения связывают два объекта);

· парные (в которых есть специальные отношения, связывающие более двух понятий).

Наиболее часто в семантических сетях используются следующие отношения:

· связи типа «часть-целое» («класс-подкласс», «элемент-мно­жество» и т.п.);

· функциональные связи (определяемые обычно глаголами «производит», «влияет»...);

· количественные (больше, меньше, равно...);

· пространственные (далеко от, близко от, за, под, над...);

· временные (раньше, позже, в течение...);

· атрибутивные связи (иметь свойство, иметь значение...);

· логические связи (и, или, не) и др.

Пример 1. Предложения «Куин Мэри является океанским лайнером» и «Каждый океанский лайнер является кораблем». Они могут быть представлены через семантическую сеть.



Рис. 4 Пример семантической сети

Пример 2. Понятие «корабль».



Рис.5 Семантическая сеть для понятия «корабль»

Проблема поиска решения в базе знаний типа семантической сети сво­дится к задаче поиска фрагмента сети, соответствующего некоторой подсети, соответствующей поставленному вопросу.

В семантических сетях существует возможность представлять зна­ния более естественным и структурированным образом, чем в других фор­ма­лизмах.

Основным преимуществом является то, что она более других соот­ветст­вует современных представлениям об организации долговременной памяти че­ло­века.

Недостатком этой модели является сложность организации про­це­дуры по­иска вывода на семантической сети.

Для реализации семантических сетей существуют специальные се­те­вые язы­ки (NET, SIMER+MIR и др.). Известны системы, ис­поль­зу­ю­щие семан­ти­ческие сети в качестве языка представления зна­ний— PROSPECTOR, CASNET, TORUS.
2.3. Фреймовые модели

Фреймовая модель основана на концепции Марвина Мински (Marvin Minsky) – профессора Массачусетского технологического института, основателя лаборатории искусственного интеллекта, автора ряда фундаментальных работ. Фреймовая модель представляет собой систематизированную психологическую модель памяти человека и его сознания.

Фрейм (англ. frame – рамка, каркас) – структура данных для представления некоторого концептуального объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах.

Слот (англ. slot – щель, прорезь) может быть терминальным (листом иерархии) или представлять собой фрейм нижнего уровня.

Каждый фрейм, как показано на рисунке ниже, состоит из произвольного числа слотов, причем несколько из них обычно определяются самой системой для выполнения специфических функций, а остальные определяются пользователем.



Рис. 6 Схема фреймовой модели

Пояснение:

Пример фреймовой модели иерархического типа представлен на рисунке ниже:



Рис. 7 Пример фреймовой модели

Фреймы образуют иерархию. Иерархия во фреймовых моделях порождает единую многоуровневую структуру, описывающую либо объект, если слоты описывают только свойства объекта, либо ситуацию или процесс, если отдельные слоты являются именами процедур, присоединенных к фрейму и вызываемых при его актуализации.

Формально фрейм – это тип данных вида:



Фреймы подразделяются на:

Состав фреймов и слотов в каждой конкретной фреймовой модели может быть разный, однако в рамках одной системы целесообразно единое представление для устранения лишнего усложнения.1

Разнотипные объекты или объекты, соответствующие концепции «множественности миров», заключающейся, к примеру, в том, что лошадь – животное бескрылое для одного (реального) мира и одновременно крылатое (Пегас в мифическом мире) для другого, могут описываться отличающимися друг от друга фреймами.

В целом фреймовая модель допускает представление всех свойств декларативных и процедурных знаний. Глубина вложенности слотов во фрейме (число уровней) зависит от предметной области и языка, реализующего модель.
2.4. Ленемы

Ленемы представляют собой смешанный тип модели, являющийся как бы развитием других моделей (фреймы, семантические сети и т.д.).

Ленема предназначена для структурного комплексного описания понятий предметной области. По изобразительным возможностям ленемы более совершенны, чем такие традиционные модели представления знаний, как семантическая сеть, фрейм, система продукций. Однако, для некоторых понятий модель представления знаний на основе ленем может быть неудобной и даже неприемлемой. Например, это такие понятия, в описании которых очень большую роль играет внутренняя динамика.

Модель, созданная на базе ленем, позволяет объединить на пользовательском уровне три существующие в настоящее время парадигмы представления знаний:

1) логическую (продукционная и логическая модели);

2) структурную (семантические сети и фреймы);

3) процедурную.

Для некоторых ситуаций это очень удобно, так как при реализации сложных моделей, включающих знания различных типов, возникает необходимость совмещения в одном языке представления знаний различных концепций.


  1   2
Учебный текст
© perviydoc.ru
При копировании укажите ссылку.
обратиться к администрации