Artiklit tuleb tõlkida ja kohandada!

Markovi ahelaks (vene matemaatiku Andrei Markov seeniori nime järgi) nimetatakse matemaatikas lõpliku või loenduva olekute hulgaga diskreetse ajaga juhuslikku protsessi, millel on Markovi omadus.

Markovi omadus tähendab, et fikseeritud oleviku korral tulevik ei sõltu minevikust. Teiste sõnadega, olevikuseisundi kirjeldus sisaldab kogu informatsiooni, mis võib protsessi tulevast arengut mõjutada.

Definitsioon muuda

Markovi ahel on juhuslike muutujate jada X1, X2, X3, ..., millel on Markovi omadus:

 

Muutujate Xi võimalikud väärtused moodustavad lõpliku või loenduva hulga S, mida nimetatakse ahela olekute ruumiks.

Markovi ahelat kujutatakse tihti suunatud graafina, mille servade juurde on kirjutatud ühest olekust teistesse ülemineku tõenäosused.

Modifikatsioonid muuda

Pideva ajaga Markovi ahelatel on pidevalt muutuv indeks.

Ajaliselt homogeenne Markovi ahel (ajaliselt homogeensete üleminekutõenäosustega Markovi ahel) on Markovi ahel, kus n kõigi väärtuste korral

  .

m-ndat järku Markovi ahel ehk Markovi ahel mäluga m (m on lõplik) on Markovi ahel, milles iga n korral

 
  ,

st tulevik sõltub ainult olekutest viimasel m hetkel. Ahelast (Xn) saab konstrueerida ahela (Yn), millel on "klassikaline" Markovi omadus. Nimelt, olgu Yn = (Xn; Xn−1; ...; Xnm+1) X väärtuste m-korteež. Sel juhul on Yn klassikalise Markovi omadusega Markovi ahel.

Markovi ahelad võib esitada lõplike automaatidena. Kui automaat on hetkel n olekus y, siis tõenäosus, et ta hetkel n + 1 läheb üle olekusse x, sõltub ainult olekust hetkel n.

Markovi ahelate omadused muuda

Olgu n ajasammuga olekust i olekusse j jõudmise tõenäosus defineeritud kui

 

ja ühe ajasammuga olekust i olekusse j ülemineku tõenäosus kui

 

n sammuga üleminek rahuldab Chapmani-Kolmogorovi võrrandit, mille järgi iga k (0 < k < n) korral

 

Marginaaljaotus Pr (Xn = x) on olekutevaheline jaotus hetkel n. Algjaotus on Pr (X0 = x). Protsessi kulgu sammude kaupa kirjeldab valem

 

Ülaindeks   on mõeldud lihtsalt täisarvulise indeksina. Ent kui Markovi ahel on homogeenne, siis võib seda ülaindeksit tõlgendada ka astmenäitajana.

Taanduvus muuda

Olekut j nimetatakse teisest olekust i kättesaadavaks (accessible; tähistus ij), kui eeldusel, et ollakse olekus i, on nullist erinev tõenäosus, et millalgi tulevikus ollakse olekus j . Teiste sõnadega, olek j on olekust i kättesaadav, kui leidub niisugune täisarv n ≥ 0, et

 

Selles definitsioonis lubatakse ka n väärtust 0, mistõttu iga olek on selle definitsiooni järgi kättesaadav ka iseendast.

Öeldakse, et olek i lävib seisundiga j (ij), kui olek i on kättesaadav olekust j ning olek j on kättesaadav olekust i. Olekute hulk C on läviv klass, kui mis tahes kaks olekut hulgast C lävivad teineteisega ja ükski olek hulgast C ei lävi ühegi olekuga, mis ei kuulu hulka C. (Saab näidata, et lävimine on ekvivalentsusseos.) Läviv klass on kinnine, kui klassist lahkumise tõenäosus (probability of leaving the class) on null: kui olek i asub lävivas klassis C, kuid olek j mitte, siis olek j ei ole kättesaadav olekust i.

Markovi ahel on taandumatu, kui tema olekute ruum on läviv klass. Teiste sõnadega, taandumatus Markovi ahelas on mis tahes olek kättesaadav mis tahes olekust.

Perioodilisus muuda

Olekul i on periood k, kui mis tahes naasmine (return) olekusse i peab toimuma k kordse arvu ajasammude möödudes. Näiteks kui olekusse i on võimalik naasta ainult paarisarvu sammude möödudes, siis i on perioodiline perioodiga 2. Oleku periood on

 

(kus "SYT" on suurim ühistegur). Pandagu tähele, et kui mingil olekul on periood k, ei pruugi sellesse olekusse olla võimalik k sammuga naasta. Näiteks kui olekusse on võimalik naasta {6, 8, 10, 12, ...} ajasammuga, siis k on 2, kuigi 2 selles loetelus ei esine.

Kui k = 1, siis nimetatakse olekut aperioodiliseks. Kui k>1, siis nimetatakse olekut perioodiliseks perioodiga k.

Saab näidata, et lävivas klassis on kõigil olekutel üks ja seesama periood.

Lõpliku olekute arvuga taandumatut Markovi ahelat nimetatakse ergoodiliseks, kui tema olekud on aperioodilised.

Naasmine muuda

Olekut i nimetatakse siirdeolekuks (transient), kui on nullist erinev tõenäosus, et alustades olekust i ei naasta kunagi olekusse i. Olgu juhuslik muutuja Ti esimene naasmisaeg olekusse i ("tabamisaeg" ("hitting time")):

 

Siis olek i on siirdeolek siis ja ainult siis, kui

 

Kui olek i on ei ole siirdeolek (tal on tõenäosusega 1 lõplik tabamisaeg), siis teda nimetatakse naasvaks. Kuigi tabamisaeg on lõplik, ei pruugi tal olla lõplikku matemaatilist ootust.

Olgu Mi naasmisaja matemaatiline ootus

 

Siis olek i on püsiv, kui Mi on lõplik. Vastasel juhul on olek i nullsiirdeolek (null recurrent).

Saab näidata, et olek on naasev (recurrent) siis ja ainult siis, kui

 

Olekut i nimetatakse neelavaks, kui sellest olekut on võimatu lahkuda. Seega on olek i on neelav siis ja ainult siis, kui

  ning  , kui  

Ergoodilisus muuda

Olekut i nimetatakse ergoodiliseks, kui ta on aperioodiline ja püsiv. Kui Markovi ahela kõik olekud on ergoodilised, siis ahelat nimetatakse ergoodiliseks.

Püsivate seisundite analüüs ja piiravad jaotused muuda

(Steady-state analysis and limiting distributions)

Kui Markovi ahel on homogeenne, nii et protsess on kirjeldatav üheainsa ajast sõltumatu maatriksiga pij, siis vektor π on statsionaarne jaotus (stationary distribution) (ka tasakaalus jaotus, invariantne mõõt), kui selle koordinaatide (entries) πj summa on 1 ning nad rahuldavad võrrandit

 

Taandumatul ahelal on statsionaarne jaotus siis ja ainult siis, kui kõik selle olekud on püsivad. Sel juhul leidub ainult üks statsionaarne jaotus π ning ta on seotud naasmisaja matemaatilise ootusega:

 

Kui ahel on taandumatu ja ühtlasi aperioodiline, siis mis tahes i ja j korral

 

Algsele jaotusele ei ole siin mingit piirangut. Ahel koondub statsionaarse jaotusega ahelaks sõltumata algsest olekust.

Kui ahel ei ole taandumatu, siis ei ole tal ühtset statsionaarset jaotust. (Igal kinnisel lävival klassil on oma ainus statsionaarne jaotus. Igaüks neist laieneb kogu ahela statsionaarseks jaotuseks, kus tõenäosus väljaspool klassi on nullile lähenev hulk (set to zero).) Samas, kui olek j on aperioodiline, siis

 

ja iga teise oleku i puhul olgu fij tõenäosus, et startides olekust i, läbib (visits) ahel kunagi olekut j

 

Lõpliku seisundite ruumiga Markovi ahelad muuda

Kui olekute ruum on lõplik, transitsiooni tõenäolist jaotust (transition probability distribution) võib kujutada transitsioonimaatriksina, milles element p järjekorranumbriga (i, j) võrdub

 

P on stohhastiline maatriks. Kui Markovi ahel on ajaliselt homogeenne (time-homogeneous) Markovi ahel, siis transitsioonimaatriks P on sõltumatu tähisest n ning k-astmelise transitsioonitõenäosuse võib arvutada transitsioonimaatriksi astmel k', Pk.

Olekujaotus (stationary distribution) π on (jada) vektor, mis rahuldab võrrandit

 

Teisisõnu, olekujaotus π on normaliseerimisel saadud transitsioonimaatriksi omadusvektor (normalized left eigenvector), mis on seotud omadusväärtusega (eigenvalue) 1.

Väärtust π võib vaadelda lineaarse (järelikult pideva) maatriksiga P seotud ühiksimpleksi (unit simplex) transformatsiooni fikseeritud punktina.

Iga pideva transformatsiooni (continuous transformation) puhul on ühiksimpleksil kindel punkt, milles alati eksisteerib olekujaotus, kuid üldiselt ei ole garanteeritud, et see on ainukordne. Ometi, kui Markovi ahel on redutseerimatu ja aperioodiline, eksisteerib ainukordne olekujaotus π. Lisaks läheneb (converges) Pk üheveeruline maatriks (rank-one matrix), milles iga rida on olekujaotus π

 

kus 1 on veeru vektor (column vector) kõigi väärtuste jaoks, mis võrduvad 1. Seda väidab Perron-Frobeniuse teoreem. See tähendab, et aja möödudes "unustab" Markovi ahel oma algjaotuse ning läheneb oma olekujaotusele.

Pöörduv Markovi ahel muuda

Pöörduva (reversible) Markovi ahela idee tuleneb võimest "inverteerida" ("invert") tõenäosuse tingimuslikkust kasutavat Bayes' seadust:

 
 

Ilmneb, et aeg on pöörduv. Järelikult võib Markovi ahel olla pöörduv (reversible), kui see on π, nagu näiteks

 

Seda tingimust tuntakse ka detailse tasakaalu tingimusena (detailed balance).

Summeerides (summing over)   annab

 

pöörduvate Markovi ahelate puhul, et π on alati olekujaotus.

Bernoulli skeem muuda

(A Bernoulli scheme)

Bernoulli skeem on Markovi ahela erijuhtumiks, kus transitsioonide tõenäosusmaatriksil (transition probability matrix) on identsed read, mis tähendab, et ka järgmine olek on sõltumatu käesolevast (lisaks sellele, et ta on sõltumatu mineviku olekutest). Ainult kahe võimaliku olekuga Bernoulli skeem on tuntud kui Bernoulli protsess.

Üldise olekuruumiga Markovi ahelad muuda

(Markov chains with general state space)


Rakendused muuda

Füüsika muuda

Katsetamine muuda

(Testing)

Järjestusteooria muuda

(Queueing theory)


Internetirakendused muuda

Statistika muuda

Majandusteadus muuda

Matemaatiline bioloogia muuda

Mänguteooria muuda

(Gambling)


Muusika muuda

Markovi ahelaid on kasutatud algoritmilisel komponeerimisel, kasutades selleks näiteks muusikatarkvara Open Music, CSound või Max.

Esimese tasandi järjestusega ahelate (first-order chain) puhul saavad olekutest heli väärtused ning igale helile konstrueeritakse tõenäosusvektor, saades nii üleminekute tõenäolise maatriksi (transition probability matrix). Algoritmi konstrueerimise eesmärgiks on toota üleminekute maatriksi väärtustel põhinevaid muusikaliste parameetrite väärtusi: näiteks MIDI väärtusi, helisagedusi hertsides, helivältuste suurusi või muude muusikaliste parameetrite väärtusi.

Esimese tasandi maatriks (1st-order matrix)
Heliklass A Cis Es
A 0.1 0.6 0.3
Cis 0.25 0.05 0.7
Es 0.7 0.3 0

Teise tasandi Markovi ahelaid (second-order Markov chain) võib kasutada, arvestades käesolevat ja ka eelmist olekut.

Teise tasandi maatriks (2nd-order matrix)
Note A D G
AA 0.18 0.6 0.22
AD 0.5 0.5 0
AG 0.15 0.75 0.1
DD 0 0 1
DA 0.25 0 0.75
DG 0.9 0.1 0
GG 0.4 0.4 0.2
GA 0.5 0.25 0.25
GD 1 0 0

Kõrgematel tasanditel, n-tasandi järjestusega ahelate ( nth-order chains) puhul rühmituvad algsed helid helide rühmadeks, 'purunedes' samal ajal juhuslikeks kujunditeks ja järgnevusteks. Sellised kõrgema tasandi ahelad genereerivad muusikalise fraasi tasemel struktuure, sel ajal kui esimese tasandi järjestusega süsteem toodab 'sihitut ekslemist'[1].

Pesapall muuda

Kirjandus: Markovi paroodiageneraatorid muuda

(Markov parody generators)

Markovi protsesse võib kasutada ka antud tekstikatkest pealiskaudsel vaatlusel reaalsena näivate uute tekstide genereerimiseks. Meetodit on kasutatud erinevate taasloovate "paroodiageneraatorite" tarkvara puhul (vt dissociated press, Jeff Harrison, Mark V Shaney, [2][3] ).

Teooria ajalugu muuda

Andrei Markov vanem sai aastal 1906 nende protsesside esimesi tulemusi alguses puhtalt teoreetiliselt. Arvutuslikult lõpetatud seisundiruumide (countably infinite state spaces) üldistuse esitas Andrei Nikolajevitš Kolmogorov aastal 1936. Markovi ahelaid on seostatud Browni liikumisega ja ergoodilise hüpoteesiga, mis on ühtedeks tähtsamateks teemadeks 20.sajandi alguse füüsikas.


Vaata ka muuda

Viited muuda

  1. Curtis Roads (ed.) (1996). The Computer Music Tutorial. MIT Press. ISBN 0262181584. {{cite book}}: parameetris |author= on üldnimi (juhend)
  2. Kenner, Hugh; O'Rourke, Joseph (november 1984), "A Travesty Generator for Micros", BYTE, 9 (12): 129–131, 449–469
  3. Hartman, Charles (1996), The Virtual Muse: Experiments in Computer Poetry, Hanover, NH: Wesleyan University Press, ISBN 0819522392

Kirjandus muuda

  • A.A. Markov. "Rasprostranenie zakona bol'shih chisel na velichiny, zavisyaschie drug ot druga". Izvestiya Fiziko-matematicheskogo obschestva pri Kazanskom universitete, 2-ya seriya, tom 15, pp 135–156, 1906.
  • A.A. Markov. "Extension of the limit theorems of probability theory to a sum of variables connected in a chain". reprinted in Appendix B of: R. Howard. Dynamic Probabilistic Systems, volume 1: Markov Chains. John Wiley and Sons, 1971.
  • Classical Text in Translation: A. A. Markov, An Example of Statistical Investigation of the Text Eugene Onegin Concerning the Connection of Samples in Chains, trans. David Link. Science in Context 19.4 (2006): 591-600. Online: http://journals.cambridge.org/production/action/cjoGetFulltext?fulltextid=637500
  • Leo Breiman. Probability. Original edition published by Addison-Wesley, 1968; reprinted by Society for Industrial and Applied Mathematics, 1992. ISBN 0-89871-296-3. (See Chapter 7.)
  • J.L. Doob. Stochastic Processes. New York: John Wiley and Sons, 1953. ISBN 0-471-52369-0.
  • S. P. Meyn and R. L. Tweedie. Markov Chains and Stochastic Stability. London: Springer-Verlag, 1993. ISBN 0-387-19832-6. online: http://decision.csl.uiuc.edu/~meyn/pages/book.html . Second edition to appear, Cambridge University Press, 2008.
  • S. P. Meyn. Control Techniques for Complex Networks. Cambridge University Press, 2007. ISBN 9780521884419. Appendix contains abridged Meyn & Tweedie. online: http://decision.csl.uiuc.edu/~meyn/pages/CTCN/CTCN.html
  • Booth, Taylor L. (1967). Sequential Machines and Automata Theory (1st ed.). New York: John Wiley and Sons, Inc. Library of Congress Card Catalog Number 67-25924. Extensive, wide-ranging book meant for specialists, written for both theoretical computer scientists as well as electrical engineers. With detailed explanations of state minimization techniques, FSMs, Turing machines, Markov processes, and undecidability. Excellent treatment of Markov processes pp. 449ff. Discusses Z-transforms, D transforms in their context.
  • Kemeny, John G. (1959). Finite Mathematical Structures (1st ed.). Englewood Cliffs, N.J.: Prentice-Hall, Inc. Library of Congress Card Catalog Number 59-12841. {{cite book}}: eiran tundmatut parameetrit |coauthors=, kasuta parameetrit (|author=) (juhend) Classical text. cf Chapter 6 Finite Markov Chains pp. 384ff.

Välislingid muuda