Курсовая работа - Метрични методи на надеждността; дисциплина - Техническа диагностика - файл n1.docx

Курсовая работа - Метрични методи на надеждността; дисциплина - Техническа диагностика
Скачать все файлы (145.6 kb.)

Доступные файлы (1):
n1.docx146kb.10.01.2014 23:23скачать

n1.docx

УНИВЕРСИТЕТ ПО ХРАНИТЕЛНИ ТЕХНОЛОГИИ

Технически Факултет
Катедра: „Автоматика, информационна и управляваща техника”

uft

ЕСЕ


Тема: „Метрични методи. Видове разстояния.

Диагностика по разстояние - до еталона и до множеството.”
Студент: Петър Атанасов Атанасов фак.№27336
Ръководител: гл. ас. д-р инж. Таня Титова
Специалност: „Автоматика, информационна и управляваща техника”
Образователно-квалификационна степен: Магистър
Пловдив

2013


Съдържание



Въведение 3

1.Метрични методи за разпознаване 3

1.1 Видове разстояния. 3

1.2. Обобщена метрика на признаковото пространство 5

2.Диагностика по разстояние в пространството на признаците. 6

2.1 Диагностика по разстояние до еталона. 6

2.2 Алгоритъм на разпознаването по разстояние до еталона 7

Пример. 8

2.3. Диагностика на разстояние до множеството. 10

2.4. Алгоритъм на разпознаване по метода на средното разстояние. 11

2.5. Сравнение с метода по разстояние до еталона. 11

2.6. Метод на минималното разстояние до множеството. 12

3. Метрични методи за синтез на класификатор 12

3.1. Метричен класификатор по метода k-NN (k-Nearest neighbor -k-най-близки съседи) 12

3.2. Метрична клъстеризация. 14

Литература. 15

Въведение

Едни от най-важните диагностични методи са методите за разделяне в пространството на признаците. Тези методи са основанеи на естествената „хипотеза на компактността”, според която, точките, изобразяващи едно и също състояние (или диагноза) се групират в една област на пространството на признаците.

Съществуват линейни методи на разделяне, метод на потенциалните функции, метод на стохастическата апроксимация и метрични методи на разделяне.

1.Метрични методи за разпознаване.

1.1. Видове разстояния.

В повечето от методите за разпознаване се предполага, че обектите, принадлежащи на един клас са по-близо един от друг, отколкото самите класове. Така метричните методи се основават на количествената оценка на тази близост в пространството на признаците.

В пространството на признаците обектът се характеризира с N-мерен вектор:

X= (x1,x2,…,xn) (1).

Координатите в пространството могат да бъдат непрекъснати или дискретни величини. В първия случай xj изразяват непрекъснати величини-диагностични параметри на системата ( например температура, налягане, вибрационно претоварване и други). Във втория случай xj представлява признак kj, имащ няколко диагностични порядъка (количествени или качествени). Съществува и друг трети - хибриден тип, при който част от координатите са непрекъснати, а друга част – дискретни .[4]

Удобно е да се представи обектът като точка в многомерно пространство (връх на вектора х ). Често се използва бинарен код – тогава координатата xj се изразява с двоично число и x1=0, x2=1. Всеки от обектите в пространството на простите признаци се явява една от височините на единичен N-мерен куб. В тримерното пространство обектът х (011) се изобразява като точка на фиг.1:

фиг.1
Пространството на признаците се разполага по страните и върховете на N-мерен куб. Ако точката х (или вектора) се отнасят към обекта (или системата) с диагноза Di , тогава записът е : xDi.

Евклидово разстояние между точките x и a в пространството на признаците се дефинира:

l(x,a)=|x-a|== (2).

Диагностика с помощта на признаци в двоичен код съответстват на изотропно, еднородно пространство на признаците. В чести случаи, диагностичното пространство на признаците се явява анизотропно, т.е. единиците за измерване в различни направления са различни. Координатите xj могат да съответстват на параметри с различна физическа природа (например, x1- температура, x2- налягане и т.н.).

Ако въведем тегловни коефициенти по координати, то квадрата на разстоянието между точки x и a ще бъде:

l2(x,a)= (3).

С помощта на компонентите на тегловния вектор

…,) (4)

може да се определи различната диагностическа ценност на признаците, отдавайки най-голяма тежест на най-значителния признак. В диагностиката е важно относителното тегло, така че условието за нормиране е :

(5)
1.2. Обобщена метрика на признаковото пространство.

Уравнение (3) установява „неравноправието” на отделните координати в признаковото пространство, но не отчита ролята на координатите xj за диагнозите Di.

Област на диагнозите се нарича множеството от точки в пространството на признаците (на обектите), притежаващо състояние (диагноза) Di. Обикновено такива области запълват достатъчно компактно частта на признаковото пространство. Условието за компактност се състои в това, броят на граничните точки да е по-малък от общия брой точки в областта.
Диагностичното значение на признаците е различно за различните диагнози. Разстоянието на точки x до точки ai, принадлежащи на диагнози Di се определят:

(x,)= (6).

Целесъобразно е да приемем, че

?ij=1/?ij ,

където ?ij е средноквадратичното отклонение на признака xj за образци с диагноза Di. Величината ?ij м този случай има ясен физически смисъл: колкото по-малко разсейване има признакът спрямо обекта, толкова е по-голямо неговото диагностично значение. Полагаме

?ij=cij/?ij ,

където cij е безразмерен коефициент, характеризиращ диагностичната ценност на признака. За дискретен параметър (или признак) xj, притежаващ mi дискретни стойности (xj1, xj2 …xjm) може да се приеме формула:

cij=ZDi(xj)= (7).

За непрекъснато разпределени признаци xj вероятността на дискретните стойности се заменя с плътност на вероятностите, а сумирането – с интегриране по областта на стойностите xj. В тези случаи, в които отсъстват статистически сведения, величините cij се приемат въз основа на експертна оценка. В практическите задачи величините ?ij се подбират въз основа на диагностичния опит (т.е. приемат се тези стойности, които обезпечават най-голям брой правилни отговори ).

Условието за нормиране при обобщена метрика е:

(i=1,2,…,n) (8)

или

(i=1,2,…,n) . (9).
2.Диагностика по разстояние в пространството на признаците.

2.1 Диагностика по разстояние до еталона.

Отнасянето на определяният за разпознаване обект към една от n възможни диагнози (състояния) се извършва чрез намиране на най-малко разстояние до еталона. В качеството на еталон се приема типичен обект, притежаващ диагноза Di.(фиг.2)

Най-често избор на еталон се извършва чрез използване на средна стойност на параметрите в областта на диагнозата. Ако са известни Mi обекта с диагноза Di , то за еталон може да се приеме:

, (10)

Където е обект със диагноза Di (обект с верифицирана диагноза). Равенство (10) определя еталона като център на тежестта в областта на диагнозите. Координатите на вектора са равни на средните по стойност координати на векторите, влизащи в обучаваща последователност.

фиг.2
2.2. Алгоритъм на разпознаването по разстояние до еталона.

Нека в пространството на признаците се използва диагностична мярка по разстояние L и е предоставен за диагностициране обект х. За да отнесем обекта х към една от n –те диагнози се определя разстоянието L до еталонните точки . обектът x се отнася към диагноза Di, ако разстоянието между точките х и е минимално, т.е.

Ако Li = min, то xDi (11),

или записано в друга форма,

xDi , ако Li< Lk (k=1,2,….,n;k?i) (12).

В някои случаи горното условие приема строга форма:

LkLi>? , ?>0, (13)

където ? - праг на разпознаването.

Например, ако като диагностична мярка се приеме квадрата на разстоянието

Li=li2 = , то обекта х се отнася към диагноза Di или xDi при условието

li2k2 (k=1,2,…,n; k?i) (14)

Ако се въведе допълнителен праг на разпознаване във вид на област, окръжност около точката на еталона, то условия (11),(12),(14) се явявят само необходими. Допълнително необходимо условие се приема:

xDi, ако │x-ai*│<?i (15)

където ?i – радиус на сфера, за която точката за принадлежност на диагнозата е вътрешна. Това условие се използва за изотропно (еднородно) пространство на признаците.

За неизотропно и нееднородно пространство на признаците ограничението е:

?ij(1)j-aij*ij(2) (16)

където ?ij(1) ?ij(2) – са граници на областите на решенията за диагноза Di и координати xj. условие (16) определя N - мерен паралелепипед, във вътрешността на когото се намира точка x за приетото решение xDi . Тези области за различните диагнози могат да се припокриват.

Надеждността на разпознаването ще бъде толкова по-висока, колкото е по-малко разстоянието Li , сравнено с другите разстояния Ls. Това определя коефициента на разпознаване :

?i= (17)

величината ?i играе роля, сходна с тази на вероятността на диагнозата, поради факта, че

(18)

разпознаването в съответствие с (11) и (12) се смята за надеждно , ако:

?i > ?0, (19)

където ?0 е по-рано избраното ниво на разпознаване.

При диагностика с праг на разпознаването характерен се явява коефициентът на грешка :

?i = Li/Li* (20)

където Li*- диагонал на граничната област с диагноза Di . например , при квадратична мярка за разстояние

Li = ,

Li = .

Колкото е по-голям коефициента на грешката, толкова по-близо до граничната област се разполага обектът за разпознаване.

Пример. Разглеждаме разпознаване в пространството на простите признаци – в случая двоични числа. Нека имаме три диагностични еталона в десет мерно пространство:

а1=(1011100011) , a2=(0100110100) , a3=(1011011111).

За разпознаване е даден обект х=(0100010100). За мярка по разстояние приемаме първоначално разстоянието на първи порядък ?=1, l(?)(x,a)={} (разстояние по Хеминг). Това разстояние е равно на броя несъвпадащи разряди в двоичен код.

l1=l(1)(x,a1)=9

l2=l(1)(x,a2)=1

l3=l(1)(x,a3)=7

коефициентите на разпознаване са:

?1=

?2=

?3=

Обектът следва да се отнесе към диагноза D2 при ниво на разпознаване ?0=0,8. За сравнение на резултата използваме и квадратичната мярка за разстояние, т.е. l12, l22 ,l32. Тогава получаваме :

?1=

?2=

?3=

От цитираният пример ясно се вижда, че използването на квадратична мярка на разстояние рязко подчертава диагнозата с най-малко разстояние. Изборът на мярка на разстояние зависи от особеностите на задачата и се установява в процеса на обучение.
2.3. Диагностика на разстояние до множеството.

В този метод се оценява разстоянието не от една точка - еталон, а разстояние от точка х (обект за разпознаване) до всичките точки на множеството с дадена диагноза. разстояние до множеството се оценява като средно разстояние, но са възможни и други способи на това оценяване. Предполага се, че за всяка диагноза съществуват и група образци (обекти) с установена диагноза.

фиг.3
Нека за диагноза Di групата да съдържа Mi образци. Допускаме, че е избрана диагностична мярка за разстояние и тогава разстоянието от точка х до точка ai(s) на фиг.2 , от множеството на верифицираните образци (при квадратична мярка) е :

-2 (21).

Определяме и средното разстояние от точка х до точките, принадлежащи на диагноза Di , в обучаваща последователност :

(22).

При използване на обобщена диагностична мярка за разстояние :

(23).
2.4. Алгоритъм на разпознаване по метода на средното разстояние.

Процедурата е същата, както при определянето на разстоянието до еталона. Взема се решение xDi , ако

Li< Lk (k=1,2,….,n;k?i). (12)

или еквивалентно на горното, xDi ако Li =min.

Възможно е използването на „праг на разпознаването”, както е указано по-горе и в [6].
2.5. Сравнение с метода по разстояние до еталона.

Разглеждаме метод на минимума на средно разстояние при квадратична диагностична мярка на разстоянието (? = 2). Въвеждаме „среден вектор”- еталон за диагноза Di по обучаваща последователност :

, (10)

Средното разстояние е :

(24).

След преобразуване намираме :

(25).

Първият член на равенство (25) съответства на разстоянието до еталона, вторият дава положителна добавка, и затова средното разстояние винаги е по-голямо от разстоянието до средния елемент. Преобразувайки втория член на равенството (25) получаваме

(26),

Където

(27).

Величината представлява средноквадратично отклонение на признака xj за диагноза Di , определена по обучаваща група. Ако изберем тегловни коефициенти в вида :
(28)

то от равенство (26) намираме

(29).

Приемайки в качеството на нова мярка разстоянието получаваме, че алгоритъмът на разпознаване съвпада с алгоритъма по разстояние до еталона. Този резултат се получава заради избора на квадратична диагностична мярка за разстояние.
2.6. Метод на минималното разстояние до множеството.

Ако в качеството на разстояние до множеството вземем минималното разстояние от средата на всичките точки х до точките, влизащи в групата на диагнозата Di ,то

Di. (30). Алгоритъмът на разпознаване се състои в определяне на разстоянието от точка х (обект за диагностициране), до всички точки, влизащи в областта на възможните диагнози и се „запомня” минималното разстояние. Приема се решение

D i, ако Di (k=1,2,…,n; k?i) (31),

или Li< Lk (k=1,2,….,n ; k ? i) (32).

Така решението се взема на база близост към прецедент, а не на база съвкупност от случаи.
3. Метрични методи за синтез на класификатор.

Използват се в приложни задачи като : разпознаване на образи, обработка на изображения, откриване на закономерности в бази данни се използват метрични методи, използващи въвеждането на определена метрична функция (метрика, разстояние) в пространството на обектите. При разпознаване на образи се използва база данни от прототипи (еталони), представляващи обучаваща извадка, която алгоритъмът използва многократно, директно, без описание на обучаващата извадка. Иначе казано обучението се състои в оптимизация, подбор и съхранение в базата данни на представителни обекти от обучаващата извадка[5].

3.1. Метричен класификатор по метода k-NN (k-Nearest neighbor -k-най-близки съседи).

При спазване на условията от т.1.1 и 1.2 , описани по-горе за произволен обект с неизвестен клас, изчисляваме разстоянието до всеки един обект на обучаващата извадка

l(x,a)=|x-a|=== (33)

и го сортираме в възходящ ред,

, (34)

където е j-тия съсед на от обучаващата извадка с известен клас y j, който получава реда си в зависимост от стойността на разстоянието l.

За дефиниране на обща формулировка на метричен класификатор за обучаваща извадка Xk се използва оценъчна (преброителна) функция:

, (35),

където е тегловна функция, определяща важността на j-тия съсед за класификацията на . Решаващата функция има вида:

(36).

Нека =1 при 1?j?k и =0 при j?k. В този случай получаваме алгоритъма за k-най-близки съседи. Решаващата функция има вида:

. (37).

Работата на алгоритъма се интерпретира като гласуване на k-най близки съседа, съгласно реда за отнасяне на обекта към класа, към който принадлежат самите те. Алгоритъмът отнася обекта към класа, който получава най- много гласове.

При различен подбор на тегловната функция може да се дефинират и различни други типове метрични класификатори като:

  • k-най-близък съсед =1 при j=1;

  • „парзенови” прозорци =;

  • Потенциални функции =.

При синтеза на алгоритъм трябва да се предвиди и случая равнопоставеност на гласовете. При брой класове два, тази равнопоставеност се избягва с избор на нечетно k. Така винаги решението ще бъде в полза на единия или другия клас.

При повече от два класа се използва модификацията „претеглени k- най-близки съседи”, при която :

, . (38).
3.2. Метрична клъстеризация.

Клъстеризацията представлява класификация на образи без учител в компактни групи (клъстери). Задачата за групиране на образи (наблюдения, данни или признакови вектори) присъства в повечето приложения за анализ на данни.

Клъстеризацията включва следните основни етапи:

  • Представяне на образите в признаковото пространство

  • Селекция на признаци

  • Дефиниране на метрика за сходство между образите

  • Групиране в клъстери

Ако е необходимо, се създава абстрактен модел на данните (избор на представителна извадка) и оценка на модела.

Тъй като сходството между образите е в основата за дефиниране на клъстери, то методите, използващи метрика в признаковото пространство са основни при клъстеризацията.

Алгоритъмът k-средни (k-means clustering) реализира този подход в следните стъпки :

  1. Определяне на изходните клъстери k. Дефиниране на начални центрове на клъстерите (k на брой центроиди);

  2. Класификация по минимална дистанция на всеки обект към един от избраните центроиди;

  3. Преизчисляване на позицията на центроидите с използване на вече класифицираните членове на клъстерите;

  4. Повторение на стъпки 2 и 3 до достигане на определен критерий за спиране.

Критерият за спиране може да бъде например минимално отклонение или липса на промяна на геометричната позиция на центроидите, минимален брой обекти с промяна на принадлежността се към даден клъстер, или минимум на средноквадратичната грешка.

, (39),

където са текущите центрове на клъстера.

Алгоритъмът не гарантира намирането на оптимална конфигурация и е чувствителен към началния избор на центроидите. При многократно стартиране на процедурата този ефект намалява.


Литература:

  1. Биргер И.А. Техническая диагностика, Машиностроение , 1978

  2. Каменов В. Надеждност и диагностика на мехатронни системи – лекционни записки, 2010

  3. Острековский В.А. Теория надеждности , Высшая школа, 2003

  4. Сафарбаков А.М., Лукьянов А.В., Пахомов С.В. , Основы технической диагностики, Иркутск 2006

  5. Начев В., Дамянов Ч., Титова Т. Интелигентни системи, УХТ, 2012

  6. Дамянов Ч. Неразрушаващо разпознаване на качеството в системите за автоматично сортиране на хранителни продукти, УХТ, 2006

Учебный текст
© perviydoc.ru
При копировании укажите ссылку.
обратиться к администрации