Metódy štatistického rozpoznávania. Generalizovaná Bayesova formula Douglasa W

Metódy štatistického rozpoznávania. Generalizovaná Bayesova formula Douglasa W

25.01.2024
Psy

METÓDA SEKVENČNEJ ANALÝZY

BAYESOVA METÓDA

Osnova prednášky

Analýza a kontrola domácich úloh

Organizovanie času.

Priebeh prednášky.

Prednáška 9

Predmet. METÓDY ŠTATISTICKÉHO UZNÁVANIA

Cieľ. Uveďte koncept rozpoznávania digitálneho signálu.

1. Vzdelávacie. Vysvetlite proces rozpoznávania digitálneho signálu.

2. Vývojový. Rozvíjať logické myslenie a prírodno - vedecký svetonázor.

3. Vzdelávacie. Pestovať záujem o vedecké úspechy a objavy v telekomunikačnom priemysle.

Interdisciplinárne prepojenia:

· Podporné: informatika, matematika, výpočtová technika a MP, programovacie systémy.

· Poskytnuté: Stáž

Metodická podpora a vybavenie:

1. Metodický rozvoj na vyučovaciu hodinu.

2. Učebné osnovy.

3. Učebné osnovy

4. Pracovný program.

5. Bezpečnostná inštruktáž.

Technické učebné pomôcky: osobný počítač.

Poskytovanie pracovných miest:

· Pracovné zošity

3. Odpovedzte na otázky:

1. Aký je rozdiel medzi digitálnymi signálmi a analógovými signálmi?

2. Aké triedy diagramov sa používajú pri vykonávaní meraní?

3. Uveďte stručný popis každej triedy.

4. Čo sa používa na zostavenie diagramu oka?

5. Vysvetlite podstatu diagramu oka.

· Základy metódy

  • Zovšeobecnený Bayesov vzorec.

· Diagnostická matica.

Rozhodujúce pravidlo

· Základy metódy.

· Všeobecný postup metódy.

· Spojenie hraníc rozhodovania s pravdepodobnosťou chýb prvého a druhého typu.

Hlavnou výhodou metód štatistického rozpoznávania je schopnosť súčasne brať do úvahy znaky rôznej fyzikálnej povahy, pretože sú charakterizované bezrozmernými veličinami - pravdepodobnosťou ich výskytu v rôznych stavoch systému..

Medzi technické diagnostické metódy patrí metóda založená na zovšeobecnenom Bayesovom vzorci ( Bayesova veta (alebo Bayesov vzorec) je jednou z hlavných teorémov teórie pravdepodobnosti, ktorá umožňuje určiť pravdepodobnosť, že udalosť (hypotéza) nastala za prítomnosti iba nepriamych dôkazov (údajov), ktoré môžu byť nepresné. ), má osobitné miesto vďaka svojej jednoduchosti a účinnosti.

Bayesova metóda má nevýhody:veľké množstvo predbežných informácií, „potlačenie“ zriedkavých diagnóz a pod. Avšak v prípadoch, keď objem štatistických údajov umožňuje použiť Bayesovu metódu, je vhodné ju použiť ako jednu z najspoľahlivejších a najúčinnejších metód.


Základy metódy. Metóda je založená na jednoduchom Bayesovom vzorci. Ak existuje diagnóza D i a jednoduchý znak ki , vyskytujúce sa pri tejto diagnóze, potom pravdepodobnosť spoločného výskytu udalostí (prítomnosť stavu Di a znaku ki v objekte )

Z tejto rovnosti vyplýva Bayesov vzorec

(3.2)

Je veľmi dôležité určiť presný význam všetkých veličín zahrnutých v tomto vzorci.

P(Di) - predchádzajúca pravdepodobnosť hypotézy D

P(ki/Di) - pravdepodobnosť hypotézy ki pri výskyte udalosti D (zadná pravdepodobnosť - pravdepodobnosť náhodnej udalosti za predpokladu, že sú známe zadné údaje, t. j. získané po experimente).

P(ki) - celková pravdepodobnosť výskytu udalosti ki

P(Di/ki) - pravdepodobnosť výskytu udalosti Di, ak je hypotéza ki pravdivá

P(D) - pravdepodobnosť diagnózy D, určené štatistickými údajmi (predchádzajúca pravdepodobnosť diagnózy). Takže, ak predtým preskúmané N objekty a W,-objekty mali stav D, teda

P(Di) = Ni/N.(3.3)

P (kj/Di) - pravdepodobnosť výskytu znaku k j; pre objekty so stavom Di. Ak medzi Ni, objekty s diagnózou Di, N ij objavilo sa znamenie k j To

(3.4)

P (kj) - pravdepodobnosť výskytu znaku kj vo všetkých objektoch bez ohľadu na stav (diagnózu) objektu. Nech z celkového počtu N predmety podpísať do ) bol nájdený v Nj predmety teda

(3.5)

V rovnosti (3.2) R ( Di/kj)- pravdepodobnosť diagnózy D po zistení, že predmetný objekt má danú charakteristiku kj (zadná pravdepodobnosť diagnózy ).

Dodnes bolo vyvinuté veľké množstvo metód, ktorých použitie umožňuje rozpoznať typ technického stavu diagnostikovaného objektu. Tento článok pojednáva len o niektorých z nich, najpoužívanejších v diagnostickej praxi.

Bayesova metóda

Diagnostická metóda založená na aplikácii Bayesovho vzorca sa vzťahuje na metódy štatistického rozpoznávania.

Pravdepodobnosť udalosti A, ktorý môže nastať len vtedy, keď nastane jedna z nezlučiteľných udalostí 2? 1? IN 2 ,..., V p, rovná súčtu súčinov pravdepodobností každej z týchto udalostí zodpovedajúcou pravdepodobnosťou udalosti A:

Tento vzorec sa nazýva vzorec celkovej pravdepodobnosti. Dôsledkom vety o násobení a vzorca celkovej pravdepodobnosti je takzvaná teória hypotéz. Predpokladajme, že udalosť A môže nastať iba vtedy, keď nastane jedna z nekompatibilných udalostí IN, AT 2, ..., V p, ale keďže sa vopred nevie, ktoré z nich nastanú, nazývajú sa hypotézami. Pravdepodobnosť výskytu udalosti A sa určí pomocou vzorca celkovej pravdepodobnosti (1.5) a podmienenej pravdepodobnosti R A (B/) podľa vzorca

Nahradením hodnoty R(L), dostaneme

Vzorec (1.6) sa nazýva Bayesov vzorec. Umožňuje prehodnotiť pravdepodobnosti hypotéz po tom, čo sú známe výsledky pokusu, v ktorom k udalosti došlo. A.

Identifikácia veľkosti podmienených pravdepodobností výskytu znaku je kľúčom k použitiu Bayesovho vzorca na diagnostiku stavu. Bayesovský prístup je široko používaný v riadiacej vede, detekcii signálov a teórii rozpoznávania vzorov a lekárskej a technickej diagnostike.

Uvažujme o podstate metódy vo vzťahu k diagnostickej úlohe. Matematická stránka problematiky je podrobne uvedená v práci Ts3]. Počas prevádzky môže byť akýkoľvek objekt v jednom z možných stavov TVj, ...,Nj(v najjednoduchšom prípade - „norma“, „odmietnutie“), ku ktorým sú priradené hypotézy (diagnózy) Z)j,...,Z); . Počas prevádzky zariadenia sa sledujú parametre (znaky). do, ..., kj. Pravdepodobnosť spoločnej prítomnosti stavu Z)- a atribútu v objekte kj určený

Kde Р (Dj)- pravdepodobnosť diagnózy DJ, určené štatistickými údajmi:

Kde P- počet skúmaných objektov;

Nj- počet štátov;

P(kj/Dj) kj pre objekty so stav DJ. Ak medzi P objekty s diagnózou DJ, ukázal znamenie kj, To

P(kr- pravdepodobnosť výskytu znaku kj vo všetkých objektoch bez ohľadu na stav (diagnózu) objektu. Nech z celkového počtu P predmety podpísať kj bol nájdený v rij predmety teda

P(Dj/kj) - pravdepodobnosť diagnózy Z); po tom, čo sa zistí, že predmetný predmet má charakteristiku Do-.

Zovšeobecnený Bayesov vzorec platí pre prípad, keď sa prieskum vykonáva podľa súboru charakteristík TO, vrátane znakov (ku, k p). Každé zo znamení kjrrij hodnosti (, Komu d,

kj2 , ..., kj s, ..., k jm). Výsledkom vyšetrenia sa stáva známym

implementáciu funkcie k.-k. a celý komplex znakov TO. v-

deke znamená špecifický význam vlastnosti. Bayesov vzorec pre množinu funkcií má tvar

Kde P(Dj/A*) - pravdepodobnosť diagnózy?D po zistení výsledkov vyšetrenia na základe súboru znakov TO;

P(Dj)- predbežná pravdepodobnosť diagnózy DJ.

Predpokladá sa, že systém je len v jednom z uvedených stavov, t.j.

Na určenie pravdepodobnosti diagnózy pomocou Bayesovej metódy sa na základe predbežného štatistického materiálu vytvorí diagnostická matica (tabuľka 1.1). Počet riadkov zodpovedá počtu možných diagnóz. Počet stĺpcov sa vypočíta ako súčet súčinov počtu funkcií a zodpovedajúceho počtu číslic plus jedna pre predchádzajúce pravdepodobnosti diagnóz. Táto tabuľka obsahuje pravdepodobnosti kategórií znakov pre rôzne diagnózy. Ak je rozpoznaný

ki sú dvojmiestne (jednoduché znaky „áno - nie“), potom v tabuľke stačí uviesť pravdepodobnosť výskytu znaku R(k-/Dj). Pravdepodobnosť chýbajúcej funkcie I. Pohodlnejšie

použiť jednotnú formu, napríklad za predpokladu, že ide o dvojciferný znak. Malo by sa to objasniť , Kde nie- počet číslic atribútu kj. Súčet pravdepodobností všetkých možných implementácií vlastnosti sa rovná jednej. Rozhodovacie pravidlo je pravidlo, podľa ktorého sa rozhoduje o diagnóze. V Bayesovej metóde objekt s komplexom vlastností ft sa vzťahuje na diagnózu s najvyššou (zadnou) pravdepodobnosťou ft e Dj, Ak P(Dj/lt) >

> P(Dj/ft) (J - 1, 2, ..., n i * j). Toto pravidlo sa zvyčajne spresňuje zavedením prahovej hodnoty pre pravdepodobnosť diagnózy P(Dj/ft) >

>Pj, Kde Pj- vopred zvolená úroveň rozpoznávania pre diagnostiku DJ. V tomto prípade pravdepodobnosť najbližšej konkurenčnej diagnózy nie je vyššia ako 1 - Pj. Zvyčajne akceptované P ( > 0,9. Vzhľadom na to PiD/t?) sa nerozhodne o diagnóze a sú potrebné ďalšie informácie.

Tabuľka 1.1

Diagnostická matica v Bayesovej metóde

Podpísať kj

R(k 12 /

R(k 22 /

R(k p /

Príklad. Dieselová lokomotíva je pod dohľadom. V tomto prípade sa kontrolujú dva znaky: Komu- zvýšenie hodinovej spotreby nafty pri menovitej polohe ovládača vodiča o viac ako 10 % menovitej hodnoty, do 2- zníženie výkonu dieselagregátu nastaveného v nominálnej polohe ovládača vodiča o viac ako 15 % menovitej hodnoty. Predpokladajme, že výskyt týchto znakov je spojený buď so zvýšeným opotrebovaním častí skupiny valec-piest (diagnóza /)], alebo s poruchou palivového zariadenia (diagnóza D 2). Ak je dieselový motor v dobrom stave (diagnostika D 3) podpísať Komu nepozorované, ale znamenie do 2 pozorované v 7 % prípadov. Podľa štatistických údajov sa zistilo, že 60 % motorov s diagnózou Z) 3 je upravených pred plánovanými opravami. D 2- 30 %, s diagnózou Z)j - 10 %. Zistilo sa tiež, že zn Komu j v stave Z)| sa vyskytuje v 10 %, a v stave D 2 - v 40 % prípadov; znamenie do 2 pod stavom Z)| sa vyskytuje v 15 %, a v stave D 2- v 20% prípadov. Prvotné informácie uvádzame vo forme tabuľky. 1.2.

Tabuľka 1.2

Pravdepodobnosti stavov a prejavov symptómov

R(k 2 / A)

Vypočítajme si pravdepodobnosti stavov pre rôzne možnosti implementácie riadených prvkov:

1. Známky Komu A do 2 nájdené, potom:

2. Podpíšte sa Komu zistené, podpísať do 2 neprítomný.

Absencia znamenia k i znamená prítomnosť znaku Komu.(opačná udalosť) a P(k./D.) -- P(k./D.).

3. Podpíšte sa Komu 2 zistené, sign Komu neprítomný:

4. Znamenia /:| A do 2 chýba:

Analýza získaných výsledkov výpočtu nám umožňuje vyvodiť tieto závery:

  • 1. Prítomnosť dvoch znakov k a k 2 s pravdepodobnosť 0,942 označuje stav DJ
  • 2. Prítomnosť znaku Komu s pravdepodobnosťou 0,919 označuje stav D 2(porucha palivového zariadenia).
  • 3. Prítomnosť znamenia do 2 s pravdepodobnosťou 0,394 označuje stav D 2(porucha palivového zariadenia) as pravdepodobnosťou 0,459 o stave Z) 3 (správny stav). Pri takomto pomere pravdepodobnosti je rozhodovanie ťažké, preto sú potrebné ďalšie vyšetrenia.
  • 4. Neprítomnosť oboch znamienok s pravdepodobnosťou 0,717 naznačuje dobrý stav (Z) 3).
Názov parametra Význam
Téma článku: Bayesova metóda
Rubrika (tematická kategória) technológie

Nastavenie úloh technickej diagnostiky

Hlavné smery technickej diagnostiky

Základy technickej diagnostiky

ODDIEL č.5

Definície. Pojem „diagnóza“ pochádza z gréckeho slova „diagnóza“, čo znamená uznanie, odhodlanie.

Počas diagnostického procesu sa stanoví diagnóza, ᴛ.ᴇ. zisťuje sa stav pacienta (lekárska diagnostika) alebo stav technického systému (technická diagnostika).

Technická diagnostika sa zvyčajne nazýva veda o rozpoznávaní stavu technického systému.

Ciele technickej diagnostiky. Stručne sa zamyslime nad hlavným obsahom technickej diagnostiky. Technická diagnostika študuje metódy získavania a vyhodnocovania diagnostických informácií, diagnostické modely a rozhodovacie algoritmy. Účelom technickej diagnostiky je zvýšiť spoľahlivosť a životnosť technických systémov.

Ako je známe, najdôležitejším ukazovateľom spoľahlivosti je absencia porúch počas prevádzky (prevádzky) technického systému. Porucha leteckého motora počas letových podmienok, lodných strojov počas plavby lode alebo elektrární pracujúcich pod zaťažením môže viesť k vážnym následkom.

Technická diagnostika vďaka včasnej detekcii Závad a porúch umožňuje eliminovať takéto poruchy počas procesu údržby, čím sa zvyšuje spoľahlivosť a efektívnosť prevádzky, a tiež umožňuje prevádzkovať kritické technické systémy podľa ich stavu.

V praxi je životnosť takýchto systémov určená „najslabšími“ kópiami produktov. Počas prevádzky založenej na stave je každá vzorka prevádzkovaná do svojich limitných podmienok v súlade s odporúčaniami systému technickej diagnostiky. Prevádzka na základe podmienok môže priniesť výhody zodpovedajúce nákladom 30 % z celkového vozového parku.

Hlavné úlohy technickej diagnostiky. Technická diagnostika rieši široké spektrum problémov, z ktorých mnohé súvisia s problémami iných vedných odborov. Hlavnou úlohou technickej diagnostiky je rozpoznať stav technického systému v podmienkach obmedzených informácií.

Technická diagnostika sa niekedy nazýva diagnostika na mieste, t.j. diagnostika vykonaná bez demontáže produktu. Analýza stavu sa vykonáva v prevádzkových podmienkach, v ktorých je získanie informácií mimoriadne náročné. Často nie je možné z dostupných informácií vyvodiť jednoznačný záver a je potrebné použiť štatistické metódy.

Všeobecná teória rozpoznávania vzorov by sa mala považovať za teoretický základ riešenia hlavného problému technickej diagnostiky. Táto teória, ktorá tvorí dôležitý úsek technickej kybernetiky, sa zaoberá rozpoznávaním obrazov akejkoľvek povahy (geometrické, zvukové a pod.), strojovým rozpoznávaním reči, tlačených a ručne písaných textov atď. Technická diagnostika študuje rozpoznávacie algoritmy aplikované na diagnostické problémy, ktoré možno zvyčajne považovať za klasifikačné problémy.

Rozpoznávacie algoritmy v technickej diagnostike sú čiastočne založené na diagnostických modeloch, ktoré vytvárajú spojenie medzi stavmi technického systému a ich mapovaním v priestore diagnostických signálov. Dôležitou súčasťou problému rozpoznávania sú rozhodovacie pravidlá (rozhodovacie pravidlá).

Riešenie diagnostického problému (klasifikácia produktu ako prevádzkyschopného alebo chybného) je vždy spojené s rizikom falošného poplachu alebo vynechania cieľa. Pre informované rozhodnutie je vhodné použiť metódy teórie štatistického rozhodovania, vyvinuté po prvýkrát v radare.

Riešenie problémov technickej diagnostiky je vždy spojené s predikciou spoľahlivosti na najbližšie obdobie prevádzky (do najbližšej technickej kontroly). Tu musia byť rozhodnutia založené na modeloch porúch študovaných v teórii spoľahlivosti.

Druhou dôležitou oblasťou technickej diagnostiky je teória ovládateľnosti. Kontrolovateľnosť sa zvyčajne nazýva vlastnosť produktu poskytovať spoľahlivé hodnotenie

technický stav a včasné zistenie porúch a porúch. Ovládateľnosť je daná konštrukciou výrobku a prijatým systémom technickej diagnostiky.

Hlavnou úlohou teórie riadiacej kapacity je štúdium prostriedkov a metód na získanie diagnostických informácií. Komplexné technické systémy využívajú automatizované monitorovanie stavu, ktoré zahŕňa spracovanie diagnostických informácií a generovanie riadiacich signálov. Metódy navrhovania automatizovaných riadiacich systémov tvoria jednu z oblastí teórie ovládateľnosti. Napokon, veľmi dôležité úlohy teórie ovládateľnosti sú spojené s vývojom algoritmov na vyhľadávanie chýb, vývojom diagnostických testov a minimalizáciou procesu stanovovania diagnózy.

Vzhľadom na to, že technická diagnostika sa spočiatku vyvíjala len pre rádioelektronické systémy, mnohí autori stotožňujú teóriu technickej diagnostiky s teóriou ovládateľnosti (detekcia a monitorovanie porúch), čo samozrejme obmedzuje rozsah aplikácie technickej diagnostiky.

Štruktúra technickej diagnostiky. Na obr. Obrázok 5.1 znázorňuje štruktúru technickej diagnostiky. Vyznačuje sa dvomi vzájomne sa prelínajúcimi a navzájom prepojenými smermi: teóriou rozpoznávania a teóriou ovládacej schopnosti. Teória rozpoznávania obsahuje časti týkajúce sa konštrukcie rozpoznávacích algoritmov, rozhodovacích pravidiel a diagnostických modelov. Teória ovládateľnosti zahŕňa vývoj nástrojov a metód na získavanie diagnostických informácií, automatizované riadenie a riešenie problémov. Technická diagnostika by sa mala považovať za časť všeobecnej teórie spoľahlivosti.

Ryža. 5.1. Štruktúra technickej diagnostiky

Úvodné poznámky. Nech je potrebné určiť stav drážkového spojenia hriadeľov prevodovky v prevádzkových podmienkach. Pri nadmernom opotrebovaní drážok sa objavujú deformácie a únavové poškodenia. Priama kontrola drážok nie je možná, pretože vyžaduje demontáž prevodovky, t.j. zastavenie prevádzky. Porucha drážkového spojenia môže ovplyvniť vibračné spektrum skrine prevodovky, akustické vibrácie, obsah železa v oleji a ďalšie parametre.

Úlohou technickej diagnostiky je určiť stupeň opotrebenia drážky (hĺbku deštruovanej povrchovej vrstvy) na základe nameraných údajov množstva nepriamych parametrov. Ako už bolo naznačené, jednou z dôležitých vlastností technickej diagnostiky je rozpoznávanie v podmienkach obmedzených informácií, keď je potrebné riadiť sa určitými technikami a pravidlami, aby bolo možné urobiť informované rozhodnutie.

Stav systému je opísaná množinou (množinou) svojich definujúcich parametrov (vlastností). Samozrejme, súbor definujúcich parametrov (vlastností) by mal byť odlišný, predovšetkým v súvislosti so samotnou úlohou rozpoznávania. Napríklad na rozpoznanie stavu spojenia motora postačí určitá skupina parametrov, ktorá sa však musí doplniť, ak sú diagnostikované aj iné časti.

Rozpoznanie stavu systému- priradenie stavu systému do jednej z možných tried (diagnóz). Počet diagnóz (triedy, typické stavy, normy) závisí od charakteristík problému a cieľov štúdie.

Často je potrebné vybrať jednu z dvoch diagnóz (diferenciálna diagnóza alebo dichotómia); napríklad „chybný stav“ a „chybný stav“. V iných prípadoch je mimoriadne dôležité podrobnejšie charakterizovať chybný stav, napríklad zvýšené opotrebovanie drážok, zvýšené vibrácie lopatiek atď. Vo väčšine úloh technickej diagnostiky sa diagnózy (triedy) stanovujú vopred a v týchto podmieňuje rozpoznávacia úloha sa často nazýva klasifikačná úloha.

Keďže technická diagnostika je spojená so spracovaním veľkého množstva informácií, rozhodovanie (rozpoznávanie) sa často vykonáva pomocou elektronických počítačov (počítačov).

Súbor sekvenčných akcií v procese rozpoznávania sa zvyčajne nazýva rozpoznávacím algoritmom. Nevyhnutnou súčasťou procesu uznania je výber parametrov, popisujúci stav systému. Musia byť dostatočne informatívne, aby pri zvolenom počte diagnóz bolo možné uskutočniť proces separácie (rozpoznania).

Matematická formulácia problému. V diagnostických úlohách sa stav systému často opisuje pomocou súboru znakov

K=(k l , k 2 ,..., k j,..., k v), (5.1)

Kde k j- znamenie, ktoré má m j výboje.

Nech je napríklad znamenie k j je trojciferný znak ( m j= 3), charakterizujúce teplotu plynu za turbínou: znížená, normálna, zvýšená. Každá číslica (interval) znamienka k j označené k js, napríklad zvýšená teplota za turbínou k j h. V skutočnosti sledovaný stav zodpovedá určitej realizácii charakteristiky, ktorá je označená horným indexom *. Napríklad pri zvýšených teplotách implementácia vlastnosti k*j = k j h.

Vo všeobecnosti každá inštancia systému zodpovedá nejakej implementácii súboru funkcií:

K* = (k 1 * , k 2 * ,..., k j *,..., kv*). (5.2)

V mnohých rozpoznávacích algoritmoch je vhodné charakterizovať systém parametrami x j, formovanie v- rozmerový vektor alebo bod na v-rozmerný priestor:

X =(X l, X 2 , x j,,xv). (5.3)

Vo väčšine prípadov parametre x j majú kontinuálnu distribúciu. Napríklad nech x j- parameter vyjadrujúci teplotu za turbínou. Predpokladajme, že korešpondencia medzi parametrom x j(°C) a trojmiestny znak k j je toto:

< 450 do j l

450 - 550 do j 2

> 500 do j 3

IN v tomto prípade pomocou znaku k j získa sa diskrétny popis, zatiaľ čo parameter x j poskytuje súvislý popis. Všimnite si, že pri súvislom popise je zvyčajne potrebné oveľa väčšie množstvo predbežných informácií, ale popis je presnejší. Ak sú však známe štatistické zákony rozloženia parametra, potom sa požadované množstvo predbežných informácií zníži.

Z predchádzajúceho je zrejmé, že pri popise systému pomocou vlastností alebo parametrov neexistujú žiadne zásadné rozdiely a v budúcnosti sa budú používať oba typy popisu.

Ako je uvedené, v technickej diagnostike problémy možné stavy systému - diagnózy D i- sú považované za slávne.

Existujú dva základné prístupy k problému rozpoznávania: pravdepodobnostné a deterministické. Formulácia problému pri pravdepodobnostných metódach rozpoznávania je to tak. Existuje systém, ktorý je v jednom z náhodných stavov D i. Je známy súbor znakov (parametrov), z ktorých každý s určitou pravdepodobnosťou charakterizuje stav systému. Je potrebné skonštruovať rozhodovacie pravidlo, pomocou ktorého by sa prezentovaná (diagnostikovaná) množina znakov priradila k jednej z možných podmienok (diagnóz). Odporúča sa tiež posúdiť spoľahlivosť prijatého rozhodnutia a mieru rizika chybného rozhodnutia.

Pri deterministických metódach rozpoznávania je vhodné formulovať problém v geometrickom jazyku. Ak je systém charakterizovaný v-rozmerný vektor X , potom akýkoľvek stav systému je bodom vo v-rozmernom priestore parametrov (vlastností). Predpokladá sa, že diagnóza D zodpovedá určitej oblasti uvažovaného priestoru znakov. Je potrebné nájsť rozhodovacie pravidlo, podľa ktorého bude prezentovaný vektor X * (diagnostikovaný objekt) bude priradený ku konkrétnej oblasti diagnostiky. Úloha teda spočíva v rozdelení priestoru funkcií na diagnostické oblasti.

Pri deterministickom prístupe sa domény diagnóz zvyčajne považujú za ʼʼneprekrývajúce saʼʼ, ᴛ.ᴇ. pravdepodobnosť jednej diagnózy (v oblasti ktorej bod spadá) sa rovná jednej, pravdepodobnosť ostatných sa rovná nule. Podobne sa predpokladá, že každý symptóm je buď prítomný pri danej diagnóze, alebo chýba.

Pravdepodobný a deterministický prístup nemajú zásadné rozdiely. Pravdepodobnostné metódy sú všeobecnejšie, ale často vyžadujú oveľa väčšie množstvo predbežných informácií. Deterministické prístupy stručnejšie popisujú podstatné aspekty procesu rozpoznávania, sú menej závislé od nadbytočných informácií s nízkou hodnotou a sú viac v súlade s logikou ľudského myslenia.

Nasledujúce kapitoly uvádzajú základné rozpoznávacie algoritmy pre úlohy technickej diagnostiky.

Medzi technickými diagnostickými metódami má metóda založená na zovšeobecnenom Bayesovom vzorci osobitné miesto vďaka svojej jednoduchosti a účinnosti.

Samozrejme, Bayesova metóda má nevýhody: veľké množstvo predbežných informácií, „potlačenie“ zriedkavých diagnóz atď.
Uverejnené na ref.rf
Navyše v prípadoch, keď objem štatistických údajov umožňuje použiť Bayesovu metódu, je vhodné ju použiť ako jednu z najspoľahlivejších a najúčinnejších metód.

Základy metódy. Metóda je založená na jednoduchom Bayesovom vzorci. Ak existuje diagnóza D i a jednoduché znamenie k j , vyskytujúce sa pri tejto diagnóze, potom pravdepodobnosť spoločného výskytu udalostí (prítomnosť stavu v objekte D i a podpísať k j)

P (D i k j) = P (D i) P ( k j/D i) = P ( k j)P(Di/ k j). (5.4)

Bayesov vzorec vyplýva z tejto rovnosti (pozri kapitolu 11)

P(D i / k j) = P(D i) P( k i /D i)/P( k j) (5.5)

Je veľmi dôležité určiť presný význam všetkých veličín zahrnutých v tomto vzorci.

P(D i) - pravdepodobnosť diagnózy D i, určené zo štatistických údajov ( predchádzajúca pravdepodobnosť diagnózy). Takže, ak predtým preskúmané N predmety a N i predmety mali podmienku D i, To

P(D i) = N i/N. (5.6)

P(k j/D i) - k j pre objekty so stav D i. V prípade medzi N i objekty s diagnózou D i, r N ij objavilo sa znamenie k j , To

P(k j/D i) = Nij/Ni. (5.7)

P(k j) - pravdepodobnosť výskytu znaku k j vo všetkých objektoch bez ohľadu na stav (diagnózu) objektu. Nech je celkový počet N predmety podpísať k j bol objavený N j predmety teda

P( k j ) = N j/N. (5.8)

Na stanovenie diagnózy špeciálny výpočet P(kj) nevyžaduje sa. Ako bude zrejmé z nasledujúceho , hodnoty P(D i)A P(k j/ D i), známe pre všetky možné stavy, určte hodnotu P(k j).

Rovnosť (3.2) P(D i/k j)- pravdepodobnosť diagnózy D i po tom, čo sa zistí, že predmetný predmet má charakteristiku k j (zadná pravdepodobnosť diagnózy).

Zovšeobecnený Bayesov vzorec. Tento vzorec platí pre prípad, keď sa vyšetrenie vykonáva podľa súboru znakov TO, vrátane znakov k 1 , k 2 , ..., k v. Každé zo znamení k j m j hodnosti ( k j l, k j 2 , ..., k js, ..., ). Výsledkom skúmania je implementácia charakteristiky známa

k j *= k js(5.9)

a celý komplex znakov K*. Index *, ako predtým, znamená špecifický význam (realizáciu) atribútu. Bayesov vzorec pre komplex funkcií má formu

P(D i/TO* )= P(D i)P(TO */D i)/P(TO* )(i= 1, 2, ..., n), (5.10)

Kde P(D i/TO* ) - pravdepodobnosť diagnózy D i potom, čo boli známe výsledky vyšetrenia na súbore znakov TO, P(D i) - predbežná pravdepodobnosť diagnózy D i(podľa doterajších štatistík).

Vzorec (5.10) platí pre ktorúkoľvek z nich n možné stavy (diagnózy) systému. Predpokladá sa, že systém je len v jednom zo špecifikovaných stavov a teda

V praktických problémoch sa často pripúšťa možnosť existencie viacerých štátov A 1 , ..., A r a niektoré z nich sa môžu vyskytovať vo vzájomnej kombinácii. Potom, ako rôzne diagnózy D i mali by sa zvážiť individuálne podmienky D 1 = A 1 , ..., DR= A r a ich kombinácie DR +1 = A 1 ^ A 2, ... atď.

Prejdime k definícii P(TO*/ D i). Ak sa komplex znakov skladá z v znamenia teda

P(TO*/ D i) = P( k 1 */ D i)P(k 2 */k 1* D i)...P(k v*/k l*...k*v- 1 D i), (5.12)

Kde k j* = k js- kategória znaku odhaleného v dôsledku vyšetrenia. Pre diagnosticky nezávislé znaky

P(TO*/ D i) = P(k 1 */ D i) P(k 2 */ D i)... P(kv*/ D i). (5.13)

Vo väčšine praktických problémov, najmä pri veľkom množstve znakov, je možné akceptovať podmienku nezávislosti znakov aj pri existencii významných korelácií medzi nimi.

Pravdepodobnosť výskytu komplexu znakov TO*

P(TO *)= P(D s)P(TO */D s). (5.14)

Zovšeobecnený Bayesov vzorec by mal byť napísaný takto :

P(D i/K* ) (5.15)

Kde P(TO*/ D i)je určená rovnosťou (5.12) alebo (5.13). Zo vzťahov (5.15) vyplýva

P(D i/TO *)=l , (5.16)

čo by, samozrejme, malo byť, keďže jedna z diagnóz sa nevyhnutne realizuje a realizácia dvoch diagnóz súčasne je nemožná.

Treba si uvedomiť, že menovateľ Bayesovho vzorca je rovnaký pre všetky diagnózy. To nám umožňuje najskôr určiť pravdepodobnosti spoločného výskytu i-tá diagnóza a daná implementácia komplexu znakov

P(D iTO *) = P(D i)P(TO */D i) (5.17)

a potom zadná pravdepodobnosť diagnózy

P(D i/TO *) = P(D i TO *)/P(D s TO *). (5.18)

Všimnite si, že niekedy je vhodné použiť predbežný logaritmus vzorca (5.15), pretože výraz (5.13) obsahuje produkty malých množstiev.

Ak implementácia určitého súboru funkcií TO * je určujúci na diagnostiku dp, potom sa tento komplex nevyskytuje pri iných diagnózach:

Potom na základe rovnosti (5.15)

(5.19)

Avšak deterministická logika diagnózy je špeciálnym prípadom pravdepodobnostnej logiky. Bayesov vzorec možno použiť aj v prípade, keď niektoré vlastnosti majú diskrétne rozdelenie a druhá časť má spojité rozdelenie. Stojí za to povedať, že na nepretržitú distribúciu sa používajú hustoty distribúcie. Okrem toho vo výpočtovom pláne je špecifikovaný rozdiel v charakteristikách nevýznamný, ak sa definícia spojitej krivky vykonáva pomocou súboru diskrétnych hodnôt.

Diagnostická matica. Pre stanovenie pravdepodobnosti diagnóz pomocou Bayesovej metódy je mimoriadne dôležité vytvorenie diagnostickej matice (tab. 5.1), ktorá sa tvorí na základe predbežného štatistického materiálu. Táto tabuľka obsahuje pravdepodobnosti kategórií znakov pre rôzne diagnózy.

Tabuľka 5.1

Diagnostická matica v Bayesovej metóde

Diagnóza D i Znak k j P(Di)
k 1 k 2 k 3
P(k 11 /D i) P(k 12 /D i) P(k 13 /D i) P(k 21 /D i) P(k 22 /D i) P(k 23 /D i) P(k 24 /D i) P(k 31 /D i) P(k 32 /D i)
D 1 0,8 0,2 0,1 0,1 0,6 0,2 0,2 0,8 0,3
D 2 0,1 0,7 0,2 0,3 0,7 0,1 0,9 0,1

Ak sú znaky dvojmiestne (jednoduché znaky „áno - nie“), stačí v tabuľke uviesť pravdepodobnosť výskytu znaku P (ki/Di). Pravdepodobnosť chýbajúcej funkcie R( /D,-) = 1 - P (ki/Di).

V tomto prípade je vhodnejšie použiť jednotnú formu, za predpokladu, že napríklad pre dvojciferný atribút R (k j/D i)= R(k i 1 /D i); R( /D,) = P (k i 2 /D i).

Poznač si to P(k js/Di)= 1, kde T, - počet číslic atribútu k j. Súčet pravdepodobností všetkých možných implementácií atribútu sa rovná jednej.

Diagnostická matica zahŕňa apriórne pravdepodobnosti diagnóz. Proces učenia v Bayesovej metóde pozostáva z vytvorenia diagnostickej matrice. Počas diagnostického procesu je dôležité zabezpečiť možnosť objasnenia tabuľky. Na tento účel by sa do pamäte počítača nemali ukladať iba hodnoty P(k js/Di), ale aj tieto množstvá: N- celkový počet objektov použitých na zostavenie diagnostickej matice; N i- počet objektov s diagnózou D i; N ij- počet objektov s diagnózou D i, skúmané na základe k j. Ak príde nový objekt s diagnózou , potom sa predchádzajúce apriórne pravdepodobnosti diagnóz upravia takto:

(5.20)

Ďalej sú zavedené opravy pravdepodobnosti vlastností. Nechajte nový objekt s diagnózou zistený výboj r znamenie k j. V tomto prípade sa pre ďalšiu diagnostiku akceptujú nové hodnoty pravdepodobnostných intervalov charakteristiky k j pri diagnóze :

(5.21)

Podmienené pravdepodobnosti príznakov pre iné diagnózy nevyžadujú úpravu.

Príklad. Poďme vysvetliť Bayesovu metódu. Pri pozorovaní motora s plynovou turbínou nechajte skontrolovať dva znaky: k 1 - zvýšenie teploty plynu za turbínou o viac ako 50 °C a k 2- zvýšenie času na dosiahnutie maximálnej rýchlosti o viac ako 5 s. Predpokladajme, že u tohto typu motora je výskyt týchto príznakov spojený buď s poruchou regulátora paliva (stav D 1 ,), alebo so zväčšením radiálnej vôle v turbíne (stav D 2).

Keď je motor v normálnom stave (stav D 3) podpísať k 1 sa nepozoruje, ale znamenie k 2 sa pozoruje v 5% prípadov. Na základe štatistických údajov je známe, že 80% motorov má životnosť v normálnom stave, 5% motorov má stav D 1 a 15% - stav D2. Je tiež známe, že znamenie k 1 sa vyskytuje v stave D 1 v 20%, a v prípade podmienky D 2 v 40 % prípadov; znamenie k 2 v stave D 1 sa vyskytuje v 30%, a v stave D 2- v 50% prípadov. Zhrňme si tieto údaje do diagnostickej tabuľky (tabuľka 5.2).

Najprv nájdime pravdepodobnosti stavov motora pri detekcii oboch znakov k 1 a k 2 . Aby sme to dosiahli, keďže znamienka sú nezávislé, použijeme vzorec (5.15).

Pravdepodobnosť stavu

Podobne dostaneme P(D2/k1k2)= 0,91; P (D 3 /k 1 k 2)= 0.

Stanovme pravdepodobnosť stavu motora, ak vyšetrenie ukázalo, že nedochádza k zvýšeniu teploty (sign k 1 2 sú odlišné od nuly, pretože posudzované charakteristiky nie sú pre nich určujúce. Z vykonaných výpočtov možno zistiť, že ak existujú znaky k 1 A k 2 v motore s pravdepodobnosťou 0,91 je podmienka D1,ᴛ.ᴇ. zvýšenie radiálnej vôle. Pri absencii oboch znakov je najpravdepodobnejší stav normálny (pravdepodobnosť 0,92). Pri absencii znamenia k 1 a prítomnosť znamenia k 2 pravdepodobnosti stavu D 2 A D 3 približne rovnaké (0,46 a 0,41) a na objasnenie stavu motora sú potrebné ďalšie vyšetrenia.

Tabuľka 5.2

Pravdepodobnosti prvkov a pravdepodobnosti predchádzajúceho stavu

D i P(k 1 /D i) P(k 2 /D i) P(Di)
D 1 0,2 0,3 0,05
D 2 0,4 0,5 0,15
D 3 0,0 0,05 0,80

Rozhodujúce pravidlo- pravidlo, podľa ktorého sa rozhoduje o diagnóze. V Bayesovej metóde objekt s komplexom vlastností TO * sa vzťahuje na diagnózu s najvyššou (zadnou) pravdepodobnosťou

K*D i,Ak P(D i / K*) > P(D j / K*) (j = 1, 2,..., n; i ≠ j). (5.22)

Symbol , používaný vo funkčnej analýze, znamená príslušnosť k množine. Podmienka (5.22) označuje, že objekt má danú implementáciu komplexu vlastností TO * alebo skrátka realizácia TO * patrí k diagnóze (stavu) D i. Pravidlo (5.22) sa zvyčajne spresňuje zavedením prahovej hodnoty pre pravdepodobnosť diagnózy:

P (D i /K *) P i, (5.23)

Kde Pi.- vopred vybrané úroveň uznania na diagnostiku D i. V tomto prípade pravdepodobnosť najbližšej konkurenčnej diagnózy nie je vyššia ako 1 – P i. Zvyčajne akceptované P i≥ 0,9. Vzhľadom na to

P(D i /K *)

(5.24)

rozhodnutie o diagnóze sa neprijíma (odmietnutie rozpoznania) a sú potrebné ďalšie informácie.

Rozhodovací proces v Bayesovej metóde pri výpočte na počítači prebieha pomerne rýchlo. Napríklad stanovenie diagnózy pre 24 stavov s 80 viacmiestnymi znakmi trvá na počítači s rýchlosťou 10 - 20 tisíc operácií za sekundu len niekoľko minút.

Ako už bolo uvedené, Bayesova metóda má určité nevýhody, napríklad chyby pri rozpoznávaní zriedkavých diagnóz. V praktických výpočtoch je vhodné vykonať diagnostiku pre prípad rovnako pravdepodobných diagnóz, uvedenie

P(Di) = l/n (5.25)

Potom bude mať diagnóza najväčšiu hodnotu zadnej pravdepodobnosti D i, pre ktoré R (K* /D i) maximálne:

K*D i,Ak P( K*/D i) > P( K*/D j)(j = 1, 2,..., n; i ≠ j). (5.26)

Inými slovami, vykoná sa diagnóza D i ak je tento súbor symptómov častejší počas diagnózy D i ako pri iných diagnózach. Toto rozhodovacie pravidlo zodpovedá metóda maximálnej pravdepodobnosti. Z predchádzajúceho vyplýva, že táto metóda je špeciálnym prípadom Bayesovej metódy s rovnakými predchádzajúcimi pravdepodobnosťami diagnóz. V metóde maximálnej pravdepodobnosti majú „bežné“ a „zriedkavé“ diagnózy rovnaké práva.

Stojí za to povedať, že pre spoľahlivosť rozpoznávania musí byť podmienka (5.26) doplnená o prahovú hodnotu

P(K */Di) ≥ Pi,(5.27)

Kde P i- vopred zvolená úroveň rozpoznávania pre diagnostiku D i.

Bayesova metóda - pojem a typy. Klasifikácia a vlastnosti kategórie "Bayesova metóda" 2017, 2018.

Bayesov vzorec

Bayesova veta- jedna z hlavných teorémov elementárnej teórie pravdepodobnosti, ktorá určuje pravdepodobnosť udalosti vyskytujúcej sa v podmienkach, keď sú na základe pozorovaní známe len niektoré čiastkové informácie o udalostiach. Pomocou Bayesovho vzorca je možné presnejšie prepočítať pravdepodobnosť s prihliadnutím na predtým známe informácie aj údaje z nových pozorovaní.

"Fyzický význam" a terminológia

Bayesov vzorec vám umožňuje „preusporiadať príčinu a následok“: vzhľadom na známu skutočnosť udalosti vypočítajte pravdepodobnosť, že bola spôsobená danou príčinou.

Udalosti odrážajúce pôsobenie „príčin“ sa v tomto prípade zvyčajne nazývajú hypotéz, keďže sú údajný udalosti, ktoré k tomu viedli. Bezpodmienečná pravdepodobnosť, že hypotéza je pravdivá, sa nazýva a priori(aká pravdepodobná je príčina vôbec), a podmienečné – berúc do úvahy skutočnosť udalosti – a posteriori(aká pravdepodobná je príčina sa ukázalo, že zohľadňuje údaje o udalosti).

Dôsledok

Dôležitým dôsledkom Bayesovho vzorca je vzorec pre celkovú pravdepodobnosť udalosti v závislosti od niekoľko nekonzistentné hypotézy ( a len od nich!).

- pravdepodobnosť výskytu udalosti B v závislosti od množstva hypotéz A i, ak je známy stupeň spoľahlivosti týchto hypotéz (napríklad meraný experimentálne);

Odvodenie vzorca

Ak udalosť závisí len od príčin A i, tak ak sa to stalo, znamená to, že musel nastať jeden z dôvodov, t.j.

Podľa Bayesovho vzorca

Prevodom P(B) napravo získame požadovaný výraz.

Metóda filtrovania spamu

Metóda založená na Bayesovej vete našla úspešné uplatnenie pri filtrovaní spamu.

Popis

Pri trénovaní filtra sa pre každé slovo vyskytujúce sa v písmenách vypočíta a uloží jeho „váha“ - pravdepodobnosť, že písmeno s týmto slovom je spam (v najjednoduchšom prípade - podľa klasickej definície pravdepodobnosti: „vyskytuje sa v spame / vystúpenia celkom“).

Pri kontrole novo doručeného listu sa pravdepodobnosť, že ide o spam, vypočíta podľa vyššie uvedeného vzorca pre rôzne hypotézy. V tomto prípade sú „hypotézy“ slová a pre každé slovo je „spoľahlivosť hypotézy“ % tohto slova v písmene a „závislosť udalosti od hypotézy“ P(B | A i) - predtým vypočítaná „váha“ slova. To znamená, že „váha“ písmena v tomto prípade nie je nič iné ako priemerná „váha“ všetkých jeho slov.

List je klasifikovaný ako „spam“ alebo „non-spam“ podľa toho, či jeho „váha“ presahuje určitú úroveň špecifikovanú používateľom (zvyčajne 60 – 80 %). Po rozhodnutí o písmene sa v databáze aktualizujú „váhy“ slov, ktoré obsahuje.

Charakteristický

Táto metóda je jednoduchá (algoritmy sú elementárne), pohodlná (umožní vám zaobísť sa bez „čiernych zoznamov“ a podobných umelých techník), účinná (po natrénovaní na dostatočne veľkej vzorke odstráni až 95 – 97 % spamu a v prípade akýchkoľvek chýb môže byť preškolený). Vo všeobecnosti existujú všetky náznaky jeho širokého používania, čo sa v praxi deje - takmer všetky moderné spamové filtre sú postavené na jeho základe.

Metóda má však aj zásadnú nevýhodu: je na základe predpokladu, Čo niektoré slová sú bežnejšie v spame, zatiaľ čo iné sú bežnejšie v bežných e-mailoch, a je neúčinný, ak je tento predpoklad nesprávny. Ako však ukazuje prax, ani človek nedokáže odhaliť takýto spam „okom“ - iba prečítaním listu a pochopením jeho významu.

Ďalším, nie zásadným nedostatkom súvisiacim s implementáciou je, že metóda pracuje len s textom. Spameri, ktorí poznali toto obmedzenie, začali do obrázka vkladať reklamné informácie, ale text v liste buď chýbal, alebo nemal zmysel. Aby ste tomu zabránili, musíte použiť nástroje na rozpoznávanie textu ("drahý" postup, ktorý sa používa iba v nevyhnutných prípadoch), alebo staré metódy filtrovania - "čierne zoznamy" a regulárne výrazy (keďže takéto písmená majú často stereotypnú formu).

pozri tiež

Poznámky

Odkazy

Literatúra

  • Vtáčie kiwi. Veta reverenda Bayesa. // Časopis Computerra, 24. august 2001.
  • Paul Graham. Plán na spam (anglicky). // Osobná stránka Paula Grahama.

Nadácia Wikimedia. 2010.

Pozrite sa, čo je „Bayesov vzorec“ v iných slovníkoch:

    Vzorec, ktorý má tvar: kde a1, A2,..., An sú nezlučiteľné deje, Všeobecná schéma aplikácie f.v. napr.: ak udalosť B môže nastať v rôznych podmienky, o ktorých bolo vytvorených n hypotéz A1, A2, ..., An s pravdepodobnosťami P(A1), ... známymi pred experimentom. Geologická encyklopédia

    Umožňuje vypočítať pravdepodobnosť udalosti záujmu prostredníctvom podmienených pravdepodobností tejto udalosti za predpokladu určitých hypotéz, ako aj pravdepodobnosti týchto hypotéz. Formulácia Nech je daný priestor pravdepodobnosti a celá skupina vo dvojiciach... ... Wikipedia

    Umožňuje vypočítať pravdepodobnosť udalosti záujmu prostredníctvom podmienených pravdepodobností tejto udalosti za predpokladu určitých hypotéz, ako aj pravdepodobnosti týchto hypotéz. Formulácia Nech je daný priestor pravdepodobnosti a úplná skupina udalostí ako... ... Wikipedia

    - (alebo Bayesov vzorec) je jednou z hlavných teorémov teórie pravdepodobnosti, ktorá umožňuje určiť pravdepodobnosť, že nejaká udalosť (hypotéza) nastala za prítomnosti iba nepriamych dôkazov (údajov), ktoré môžu byť nepresné... Wikipedia

    Bayesova veta je jednou z hlavných teorémov elementárnej teórie pravdepodobnosti, ktorá určuje pravdepodobnosť udalosti vyskytujúcej sa v podmienkach, keď sú na základe pozorovaní známe len niektoré čiastkové informácie o udalostiach. Pomocou Bayesovho vzorca môžete... ... Wikipedia

    Bayes, Thomas Thomas Bayes Reverend Thomas Bayes Dátum narodenia: 1702 (1702) Miesto narodenia ... Wikipedia

    Thomas Bayes Reverend Thomas Bayes Dátum narodenia: 1702 Miesto narodenia: Londýn ... Wikipedia

    Bayesovská inferencia je jednou z metód štatistickej inferencie, v ktorej sa Bayesov vzorec používa na spresnenie pravdepodobnostných odhadov pravdivosti hypotéz pri získaní dôkazov. Použitie bayesovskej aktualizácie je obzvlášť dôležité vo... ... Wikipédii

    Na zlepšenie tohto článku je žiaduce?: Nájdite a usporiadajte vo forme poznámok pod čiarou odkazy na dôveryhodné zdroje potvrdzujúce to, čo bolo napísané. Po pridaní poznámok pod čiarou uveďte presnejšie údaje o zdrojoch. Pere... Wikipedia

    Zradia sa väzni navzájom, sledujúc svoje sebecké záujmy, alebo budú mlčať, čím sa zníži celkový trest? Dilema väzňa

knihy

  • Teória pravdepodobnosti a matematická štatistika v problémoch. Viac ako 360 úloh a cvičení, Borzykh D.A.. Navrhovaná príručka obsahuje úlohy rôznej úrovne zložitosti. Hlavný dôraz sa však kladie na úlohy strednej zložitosti. Toto sa robí zámerne s cieľom povzbudiť študentov, aby...

Základy metódy Generalizovaný Bayesov vzorec. BAYESOVA METÓDA Spomedzi metód technickej diagnostiky je metóda založená na zovšeobecnenom Bayesovom vzorci Bayesova veta alebo Bayesov vzorec jednou z hlavných teorémov teórie pravdepodobnosti, ktorá umožňuje určiť pravdepodobnosť, že nastala akákoľvek udalosť, hypotéza za prítomnosti iba nepriame dôkazy o údajoch, ktoré môžu byť nepresné, zaujímajú osobitné miesto vďaka svojej jednoduchosti a účinnosti. Bayesova metóda má nevýhody: veľký objem...


Zdieľajte svoju prácu na sociálnych sieťach

Ak vám táto práca nevyhovuje, v spodnej časti stránky je zoznam podobných prác. Môžete tiež použiť tlačidlo vyhľadávania


Prednáška 6

Predmet. METÓDY ŠTATISTICKÉHO UZNÁVANIA

Cieľ. Uveďte koncept digitálneho rozpoznávania signálu.

Vzdelávacie. Vysvetlite proces rozpoznávania digitálneho signálu.

Vývojový. Rozvíjať logické myslenie a prírodno - vedecký svetonázor.

Vzdelávacie . Pestovať záujem o vedecké úspechy a objavy v telekomunikačnom priemysle.

Interdisciplinárne prepojenia:

Podporné: informatika, matematika, výpočtová technika a MP, programovacie systémy.

Poskytnuté: Stáž

Metodická podpora a vybavenie:

Metodický vývoj na lekciu.

Sylabus.

Tréningový program

Pracovný program.

Bezpečnostná inštruktáž.

Technické učebné pomôcky: osobný počítač.

Poskytovanie pracovných miest:

Pracovné zošity

Priebeh prednášky.

Organizovanie času.

Analýza a kontrola domácich úloh

Odpovedz na otázku:

  1. V čom je rozdiel digitálne signály z analógových?
  2. Aké triedy grafov sa používajú pri meraní?
  3. Uveďte stručný popis každej triedy.
  4. Čo sa používa na vytvorenie diagramu oka?
  5. Vysvetlite podstatu diagramu oka.

Osnova prednášky

  1. MET OD BAYES
  • Základy metódy
  • Zovšeobecnený Bayesov vzorec.
  • Diagnostická matica.
  • Rozhodujúce pravidlo
  • Základy metódy.
  • Všeobecný postup metódy.

Hlavnou výhodou metód štatistického rozpoznávania je schopnosť súčasne brať do úvahy znaky rôznej fyzikálnej povahy, pretože sú charakterizované bezrozmernými veličinami a pravdepodobnosťou ich výskytu v rôznych stavoch systému..

  1. MET OD BAYES

Medzi technické diagnostické metódy patrí metóda založená na zovšeobecnenom Bayesovom vzorci ( Bayesova veta (resp Bayesov vzorec) jedna z hlavných teorémovteória pravdepodobnosti, ktorý vám umožňuje určiť pravdepodobnosť že nastala udalosť (hypotéza)ak o tom existujú len nepriame dôkazy(údaje), ktoré môžu byť nepresné) , zaujíma osobitné miesto vďaka svojej jednoduchosti a účinnosti.

Bayesova metóda má nevýhody: veľké množstvo predbežných informácií, „potlačenie“ zriedkavých diagnóz a pod. Avšak v prípadoch, keď objem štatistických údajov umožňuje použiť Bayesovu metódu, je vhodné ju použiť ako jednu z tzv. najspoľahlivejšie a najúčinnejšie metódy.

Základy metódy. Metóda je založená na jednoduchom Bayesovom vzorci. Ak existuje diagnóza D i a jednoduché znamenie ki , vyskytujúce sa pri tejto diagnóze, potom pravdepodobnosť spoločného výskytu udalostí (prítomnosť stavu v objekte Di a podpísať ki).

Predchádzajúca pravdepodobnosťrozdelenie pravdepodobnosti, ktoré vyjadruje predpoklady pred zohľadnením experimentálnych údajov.

Predchádzajúca distribúcia pravdepodobnosti (anglicky) predchádzajúce rozdelenie pravdepodobnosti alebo jednoducho predtým ) neistej hodnoty p rozdelenia pravdepodobnosti, ktorý vyjadruje predpoklady o p pred zohľadnením experimentálnych údajov.

(3.1)

Z tejto rovnosti vyplýva Bayesov vzorec

(3.2)

Je veľmi dôležité určiť presný význam všetkých veličín zahrnutých v tomto vzorci.

P(Di)- predchádzajúca pravdepodobnosť hypotézy D

P(ki/Di ) - pravdepodobnosť hypotézy ki pri výskyte udalosti D (zadná pravdepodobnosť - pravdepodobnosť náhodná udalosť za predpokladu, že sú známe a posteriori údaje, t.j. získané po experimente.)

P(ki ) - celková pravdepodobnosť výskytu udalosti ki

P(Di/ki ) - pravdepodobnosť výskytu udalosti Di ak je hypotéza pravdivá ki

P(D ) pravdepodobnosť diagnózy D , určené štatistickými údajmi(predchádzajúca pravdepodobnosť diagnózy).Takže, ak predtým preskúmané N objektov a W ,- objekty mali stav D, teda

P(Di) = Ni/N. (3.3)

Р(kj/Di)kj; pre objekty so stav Di. Ak medzi Ni , objekty s diagnózou Di, y N ij objavilo sa znamenie k j potom

(3.4)

P(kj) pravdepodobnosť výskytu znaku kj vo všetkých objektoch bez ohľadu na stav (diagnózu) objektu. Nech z celkového počtu N predmety podpísať k ) bola zistená v objektoch Nj, potom

(3.5)

V rovnosti (3,2) P (Di / kj) pravdepodobnosť diagnózy D po tom, čo sa zistí, že predmetný predmet má charakteristiku kj (zadná pravdepodobnosť diagnózy).

Zovšeobecnený Bayesov vzorec.

Tento vzorec platí pre prípad, keď sa vyšetrenie vykonáva podľa súboru znakov K vrátane značiek k 1, k 2 ..., k v . Každé zo znamení kj má t j číslic (k j 1 k j 2 ..., k jS ..., k jm ). Výsledkom skúmania je implementácia charakteristiky známa kj * = kjs (3.6) a celý komplex funkcií K *. Index *, ako predtým, znamená konkrétnu hodnotu (realizáciu) atribútu. Bayesov vzorec pre množinu funkcií má tvar

P (D i / K *) = P (Di) P (K * / D i) / P (K *) (i = 1, 2, ..., n), (3,7)

kde P(Di/K*) pravdepodobnosť diagnózy D potom, čo boli známe výsledky vyšetrenia na súbore znakov K, P (Di ) predbežná pravdepodobnosť diagnózy D (podľa doterajších štatistík).

Vzorec (3.7) platí pre ktorúkoľvek z nich P možné stavy (diagnózy) systému. Predpokladá sa, že systém je len v jednom z uvedených stavov a teda

(3.8)

V praktických problémoch sa často pripúšťa možnosť existencie viacerých štátov A1...An a niektoré z nich sa môžu vyskytovať vo vzájomnej kombinácii. Potom, ako rôzne diagnózy D i mali by sa zvážiť individuálne podmienky D i = A 1, ..., D r = A r a ich kombinácie

Dr + i = A 1Λ A 2 atď.

Vo väčšine praktických problémov, najmä pri veľkom množstve znakov, je možné akceptovať podmienku nezávislosti znakov aj pri existencii významných korelácií medzi nimi.

Pravdepodobnosť výskytu komplexu znakov K*

. (3.11)

Zovšeobecnený Bayesov vzorec možno zapísať takto:

(3.12)

kde P (K */ Di ) je určená rovnosťou. Zo zovšeobecnených vzorcov s Bayesian (3.12) znamená, že, samozrejme,

(3.13)

a malo by byť, keďže jedna z diagnóz sa nevyhnutne realizuje a realizácia dvoch diagnóz súčasne je nemožná.

Treba si uvedomiť, že menovateľ Bayesovho vzorca je rovnaký pre všetky diagnózy. To nám umožňuje najskôr určiť pravdepodobnosti spoločného výskytu 1. diagnózy a danej implementácie súboru znakov a následne zadnú pravdepodobnosť diagnózy.

Všimnite si, že niekedy je vhodné použiť predbežný logaritmus vzorca (3.12).

Ak implementácia určitého súboru funkcií K* je určujúci (určujúci- určenie zamerania, selektivity v závislosti od úlohy.) na diagnostiku Dp , potom sa tento komplex nevyskytuje pri iných diagnózach:

Potom na základe rovnosti (3.12)

Teda deterministická logika diagnózy je špeciálnym prípadom pravdepodobnostnej logiky. Bayesov vzorec možno použiť aj v prípade, keď niektoré vlastnosti majú diskrétne rozdelenie a druhá časť má spojité rozdelenie. Pre spojitú distribúciu sa používajú distribučné hustoty. Vo výpočtovom pláne je však špecifikovaný rozdiel v charakteristikách nevýznamný, ak sa definícia spojitej krivky vykonáva pomocou súboru diskrétnych hodnôt.

Diagnostická matica.

Na určenie pravdepodobnosti diagnóz pomocou Bayesovej metódy je potrebné vytvoriť diagnostickú maticu (tab. 1), ktorá sa tvorí na základe predbežného štatistického materiálu. Táto tabuľka obsahuje pravdepodobnosti kategórií znakov pre rôzne diagnózy. Ak sú znaky dvojmiestne (jednoduché znaky „áno/nie“), stačí v tabuľke uviesť pravdepodobnosť výskytu znaku P(kj,/Di).

stôl 1

Diagnostická matica v Bayesovej metóde

Diagnostická matica zahŕňa apriórne pravdepodobnosti diagnóz.Proces učenia v metóde. Bayesovská analýza pozostáva z vytvorenia diagnostickej matrice. Počas diagnostického procesu je dôležité zabezpečiť možnosť objasnenia tabuľky. Na tento účel by sa do pamäte počítača mali uložiť nielen hodnoty pravdepodobnosti, ale aj nasledujúce veličiny: N celkový počet objektov použitých na zostavenie diagnostickej matice; Nt počet objektov s diagnózou D; Nij počet objektov s diagnózou D , preskúmané na zákl Kj.

Rozhodujúce pravidlo pravidlo, podľa ktorého sa rozhoduje o diagnóze.V Bayesovej metóde objekt s komplexom vlastností TO* označuje diagnózu s najvyššou (zadnou) pravdepodobnosťou (Zadná pravdepodobnosť - podmienená pravdepodobnosťnáhodná udalosť za predpokladu, že sú známe údaje získané po experimente)

(3.19)

Symbol Є , používaný vo funkčnej analýze, znamená príslušnosť k množine. Podmienka (3.19) označuje, že objekt má danú implementáciu komplexu vlastností TO * alebo, implementácia K *patrí k diagnóze (stavu) D . Pravidlo (3.19) sa zvyčajne spresňuje zavedením prahovej hodnoty pre pravdepodobnosť diagnózy:

P(Di/K*)>Pí, (3,20)

kde Pi vopred vybranéúroveň uznania na diagnózu D . V tomto prípade pravdepodobnosť najbližšej konkurenčnej diagnózy nie je vyššia ako 1 Pi. Zvyčajne akceptované Pj > 0,9. Vzhľadom na to

P(Di/K*)≤Pi, (3,21)

o diagnóze sa nerozhoduje(odmietnutie uznania) a dodatočné informácie.

Rozhodovací proces v Bayesovej metóde pri výpočte na počítači prebieha pomerne rýchlo.

Ako už bolo uvedené, Bayesova metóda má určité nevýhody, napríklad chyby pri rozpoznávaní zriedkavých diagnóz. V praktických výpočtoch je vhodné vykonať diagnostiku pre prípad rovnako pravdepodobných diagnóz, uvedenie

P (D) i = 1/n. (3,22)

Potom bude mať diagnóza najväčšiu hodnotu zadnej pravdepodobnosti D, pre ktoré je P(D)i maximálne:

Inými slovami, vykoná sa diagnóza D , ak je daný súbor znakov počas diagnostiky bežnejší D ako pri iných diagnózach. Toto rozhodovacie pravidlo zodpovedá metódemaximálna pravdepodobnosť. Z predchádzajúceho vyplýva, že táto metóda je špeciálnym prípadom Bayesovej metódy s rovnakými predchádzajúcimi pravdepodobnosťami diagnóz. V metóde maximálnej pravdepodobnosti majú „bežné“ a „zriedkavé“ diagnózy rovnaké práva.

  1. METÓDA SEKVENČNEJ ANALÝZY

Na diferenciálnu diagnostiku (rozpoznanie dvoch stavov) sa používa metóda sekvenčnej analýzy, ktorú navrhol Wald. Na rozdiel od Bayesovej metódy nie je počet prieskumov vopred stanovený, vykoná sa ich toľko, koľko je potrebné na rozhodnutie s určitou mierou rizika.

Základy metódy. Pri použití Bayesovej metódy na uznanie stavu D1 a D2 mal by sa zostaviť vzťah (pre nezávislé charakteristiky)

Ak

Alebo

potom padne rozhodnutie K*Є D 2

V metóde sekvenčnej analýzy sa uvažujú pravdepodobnostné pomery znakov(pomery pravdepodobnosti)sú zostavené nie okamžite, ale v sekvenčnom poradí; preto je spravidla potrebných menej vyšetrení. Táto forma sa používa na normálne rozdelenie kvantitatívnych charakteristík.

Všeobecný postup metódy.Pre stručnosť budeme predpokladať, že znaky sú nezávislé. Nech sa to uskutoční v 1 vyšetrenia, ktoré ešte neumožnili rozhodnúť,

ale po v - ro vyšetrení

Potom sa rozhodne o klasifikácii objektu ako diagnózy. D2. K * Є D 2 . Ak po v - g o vyšetrení

potom sa objekt vzťahuje na diagnózu D 1.

Aby sa znížil objem vyšetrení, mali by sa najskôr preskúmať najinformatívnejšie charakteristiky.

S súvislosť medzi hranicami rozhodovania a pravdepodobnosťou chýb prvého a druhého typu.

Počas rozpoznávania môžu nastať dva typy chýb.

Chyba súvisiaca s diagnózou D 1 (rozhodne sa o prítomnosti diagnózy D 2 keď v skutočnosti objekt patrí k diagnóze D 1 ), sa nazýva chyba I. typu. Chyba súvisiaca s diagnózou D 2 (prijíma sa rozhodnutie v prospech diagnózy D 1 keď je diagnóza správna D 2 ), sa nazýva chyba typu II.

Stav počítania D 1 prevádzkyschopný a stav D 2 chybný, je ľahké pochopiť, že chyba prvého typu je „falošný poplach“ a chyba druhého typu je „premeškaná chyba“.

Označme pravdepodobnosť chyby prvého druhu α, druhého druhu β . Predpokladajme, že podmienky existujú a že sa rozhodne v prospech diagnózy D2. Pravdepodobnosť, že toto rozhodnutie bude spravodlivé, je 1 β . Pravdepodobnosť objektu s danou implementáciou charakteristík patriacich k diagnóze D1 je a . Na druhej strane, vzhľadom na pomer, pravdepodobnosť diagnózy D 2 aspoň v A krát viac ako diagnóza D 1 t.j.

(4.11)

Podobným spôsobom môžete získať nasledujúci odhad:

(4.12)

V praktických výpočtoch sa často používa α = β = 0,05 alebo α = β = 0,10.

Domáca úloha: § poznámky.

Upevnenie materiálu:

Odpovedz na otázku:

  1. Čo vám umožňuje určiť Bayesov vzorec?
  2. Aké sú základy Bayesovej metódy?Dajte vzorec. Uveďte presný význam všetkých veličín zahrnutých v tomto vzorci.
  3. Čo to znamenáimplementácia určitého súboru funkcií K* je určujúci?
  4. Vysvetlite princíp formovaniadiagnostická matrica.
  5. Čo to znamená rozhodujúce pravidlo prijatia?
  6. Definujte metódu sekvenčnej analýzy.
  7. Aký je vzťah medzi hranicami rozhodovania a pravdepodobnosťou chýb prvého a druhého typu?

Literatúra:

Amrenov S.A. “Metódy pre monitorovanie a diagnostiku komunikačných systémov a sietí” POZNÁMKY K PREDNÁŠKE -: Astana, Kazakh State Agrotechnical University, 2005.

I.G. Baklanov Testovanie a diagnostika komunikačných systémov. - M.: Eko-trendy, 2001.

Birger I. A. Technická diagnostika M.: „Strojárstvo“, 1978.240, s., ill.

ARIPOV M.N., DZHURAEV R.KH., JABBAROV S.YU."TECHNICKÁ DIAGNOSTIKA DIGITÁLNYCH SYSTÉMOV" - Taškent, TEIS, 2005

Platonov Yu.M., Utkin Yu.G.Diagnostika, oprava a prevencia osobných počítačov. -M.: Horúca linka - Telekom, 2003.-312 s.: chor.

M.E.Bushueva, V.V.BelyakovDiagnostika zložitých technických systémov Zborník príspevkov z 1. zasadnutia k projektu NATO SfP-973799 Polovodiče . Nižný Novgorod, 2001

Malyshenko Yu.V. TECHNICKÁ DIAGNOSTIKA časť I poznámky z prednášok

Platonov Yu.M., Utkin Yu.G.Diagnostika zamrznutia a porúch počítača/Séria „Technomir“. Rostov na Done: „Phoenix“, 2001. 320 s.

STRÁNKA \* MERGEFORMAT 5

Ďalšie podobné diela, ktoré by vás mohli zaujímať.vshm>

12903. ŠTATISTICKÉ METÓDY V ASTROFYZIKE 56,4 kB
Friedmanova kozmologická teória z rokov 1922-1924 predpovedala, že vesmír sa rozpína ​​podľa zákona: kde je radiálna rýchlosť galaxie, radiálna znamená projekciu rýchlosti na zornú líniu spájajúcu pozorovateľa a skúmaný objekt na oblohe. , vzdialenosť od galaxie je A nejaká konštanta. Tu je dôležité poznamenať, že Hubble zrejme nepoznal Friedmanovu teóriu. Jedným z cieľov kurzu je ukázať, čo sa skrýva za pojmom budovanie štatistického modelu alebo štatistické modelovanie 2. závislosť uhlovej rýchlosti...
2157. METÓDY METRICKÉHO ROZPOZNÁVANIA 81,48 kB
Poskytnite predstavu o metódach metrického rozpoznávania. Vysvetliť podstatu a praktické zameranie metód metrického rozpoznávania. Algoritmus rozpoznávania.
225. Metódy na rozpoznávanie technických podmienok 623,74 kB
Postupná metóda zisťovania technického stavu Rozpoznanie aktuálneho technického stavu objektu sa vykonáva vykonávaním kontroly. V závislosti od postupnosti kontrol sa rozlišujú sekvenčné a kombinované metódy rozpoznávania. 1 Pri kombinačnom rozpoznávaní sa rozhoduje o aktuálnom technickom stave objektu na základe výsledkov analýzy všetkých kontrol z daného súboru, ktoré je možné vykonať v ľubovoľnom poradí. 5 Vo výraze 5...
2153. METÓDY LOGICKÉHO UZNÁVANIA A ROZPOZNÁVANIA KRIVKY 61,37 kB
Logické metódy sú založené na vytváraní logických spojení medzi vlastnosťami a stavmi objektov, preto sa budú brať do úvahy iba jednoduché (kvalitatívne) vlastnosti, pre ktoré sú možné len dve hodnoty (napríklad 0 a 1). Tak isto stavy technického systému (diagnózy) v posudzovaných metódach môžu mať len dva významy
15259. Metódy používané pri analýze syntetických analógov papaverínu a viaczložkových liekových foriem na nich založených 3.1. Chromatografické metódy 3.2. Elektrochemické metódy 3.3. Fotometrické metódy Záver Zoznam l 233,66 kB
Drotaverín hydrochlorid. Drotaverín hydrochlorid je syntetický analóg papaverín hydrochloridu a z hľadiska jeho chemickej štruktúry je derivátom benzylizochinolínu. Drotaverín hydrochlorid patrí do skupiny liekov s antispazmickým účinkom, antispazmickým myotropickým účinkom a je hlavnou účinnou látkou lieku no-spa. Drotaverín hydrochlorid Liekopisná monografia pre drotaverín hydrochlorid je uvedená vo vydaní liekopisu.
2635. ŠTATISTICKÉ ODHADY 77,14 kB
Jedným z ústredných problémov matematickej štatistiky je problém odhadu teoretického rozdelenia náhodnej premennej na základe údajov vzorky. Je potrebné nájsť približné hodnoty týchto parametrov, to znamená získať štatistické odhady týchto parametrov. Ak vezmeme niekoľko vzoriek na odhad, dostaneme rovnaký počet náhodných odhadov. Bodové odhady Štatistické odhady môžu byť bodové alebo intervalové.
2629. Štatistické hry 186,64 kB
Charakteristickým znakom takýchto hier je, že iba jeden z účastníkov koná vedome. Objektívne prostredie nepôsobí proti hráčovi. Vyžaduje jeden z niekoľkých možných stavov.
217. Monitorovanie a diagnostika ako úloha rozpoznávania vzorov 23,59 kB
Novo prezentovaný objekt bude zaradený do prvej alebo druhej triedy v závislosti od pohlavia. Do ktorej triedy novo prezentovaný objekt patrí, závisí od regiónu jeho bydliska. Aby bolo možné klasifikovať objekt, je potrebné počítať s určitou laxnosťou a vágnosťou kritéria priraďovania objektu do jednej alebo druhej triedy buď zhodou oblastí bydliska alebo ich najbližšieho umiestnenia. Objekty patriace do rovnakého klastra tried majú spoločné vlastnosti.
227. Optimálne programy na rozpoznávanie technických podmienok 33,92 kB
Požiadavky na ukazovatele výkonnosti procesu rozpoznávania technického stavu 3. Úvodné údaje na zostavenie ľubovoľného programu rozpoznávania vozidiel, prednáška 10. Takéto konvenčné jednotky sa používajú pri vytváraní programov rozpoznávania vozidiel.
966. Hlavné štatistické ukazovatele vzdelávania v Ruskej federácii v roku 2013 85,45 kB
Štatistika vzdelanostnej úrovne obyvateľstva a vývoja vzdelávacieho systému. Všeobecné informácie o štatistike vzdelania obyvateľstva. Systém ukazovateľov štatistiky vzdelávania. Štatistiky o vzdelanostnej úrovni obyvateľstva...


© 2024 skypenguin.ru - Tipy na starostlivosť o domáce zvieratá