Kahendotsing: erinevus redaktsioonide vahel
Eemaldatud sisu Lisatud sisu
Resümee puudub |
Resümee puudub |
||
1. rida:
Kahendotsing ehk binaarotsing on [[otsingualgoritm]], mis võtab sisendiks [
Võrdluste arv, mida kahendotsing sooritab ühe väärtuse leidmiseks, on halvimal juhul <math>O(\log n)</math>, kus <math>n</math> on järjendi elementide arv ja <math>O</math> tähistab [
[Knuth][cmpsort]
On palju kahendotsinguga sarnaseid algoritme, näiteks [[eksponentsiaalne otsing]], mille sisend võib olla piiramatu (dünaamiliselt genereeritud) suurusega. [
=== Kirjeldus ===
Olgu järjendi <code>J</code> mõne vahemiku esimese, keskmise ja viimase elemendi [
funktsioon kahend_otsing(o, J, e, v):
21. rida:
tagasta k
(Reaalarvu [
Algsest vahemikust <code>[e, v]</code> saab sõltuvalt väärtustest <code>o</code> ja <code>J[k]</code> kas <code>[e, k-1]</code> või <code>[k+1, v]</code>. Kui järjendi <code>J</code> elementide arv on <code>n</code>, siis tervest järjendist väärtuse otsimiseks kutsume funktsiooni vahemikuga <code>[0, n-1]</code>: <code>kahend_otsing(o, J, 0, n-1)</code>.
Tuleb märkida, et rekursiivne versioon kahendotsingust võib kasutada <math>O(\log n)</math> mälu, mitte optimaalse konstantse mälu hulga, kui funktsiooni [[pinumälu]] ei vabastata enne rekursiivset väljakutset ([[en:tail call | ''tail-call optimization''
funktsioon kahend_otsing(o, J):
44. rida:
===Õigsus===
Näitame, et kui otsitav väärtus leidub järjendis, siis see on alati vahemikus, kust kahendotsing otsib seda. Algses vahemikus on kõik järjendi elemendid, nii et kui otsitav väärtus leidub, siis see peab olema nende hulgas. Kui väärtus leidub vahemikus <code>[e, v]</code> keskmise elemendiga <code>J[k]</code> ja on suurem keskmisest elemendist, siis see peab olema suurem ka kõikidest elementidest vahemikus <code>[e, k]</code>, sest järjend on sorteeritud ning elemendid vahemikus <code>[e, k]</code> on väiksemad keskmisest elemendist või võrdsed sellega. Analoogiliselt, kui otsitav väärtus on väiksem keskmisest elemendist, siis see peab olema väiksem ka kõikidest elementidest vahemikus <code>[k, v]</code>, mis on omakorda keskmisest elemendist suuremad või sellega võrdsed. Järelikult uus vahemik, kus võib leiduda otsitava väärtus, on vastavalt kas <code>[k+1, v]</code> või <code>[e, k-1]</code>, mis ongi vahemik, kus kahendotsing jätkub. [
Lisaks näeme, et vahemikud <code>[e, k-1]</code> ja <code>[k+1, v]</code> mõlemad sisaldavad vähem elemente kui eelmine vahemik <code>[e, v]</code>, mistõttu vahemik, kus kahendotsing toimub, pidevalt läheb väiksemaks ning muutub tühjaks lõpliku aja jooksul, kui väärtust ei leita enne seda. Järelikult kahendotsing alati lõpetab töö lõpliku aja jooksul.
52. rida:
Kahendotsing sooritab ühe väärtuse leidmiseks halvimal juhul <math>\lfloor(\log n)+1 \rfloor \in O(\log n)</math> võrdlust, kus <math> \lfloor\cdot\rfloor</math> tähistab alamtäisosa. [Knuth]
<math>O(\log n)</math> on vähim võimalik võrdluste arv halvimal juhul algoritmi jaoks, mis otsib sorteeritud järjendist ühe väärtuse võrdluste abil. Kui oleks selline algoritm, mis kasutaks vähem kui <math>O(\log n)</math> võrdlust, siis selle abil saaks sorteerida <math>n</math> elemendiga järjendit vähem kui <math>O(n\log n)</math> võrdlusega halvimal juhul, mis on tegelikult võimatu. Selleks teeme uue järjendi <math>S</math>, mis on alguses tühi, ning sisestame sellesse ühekaupa kõik järjendi <math>J</math> elemendid nii, et see jääks sorteerituks. Kui järjendisse <math>S</math> on juba sisestatud <math>m</math> elementi, siis leiame hüpoteetilise otsingualgoritmi abil vähem kui <math>O(\log m)</math> võrdlusega koha, kuhu sisestada <code>J[m]<
Saame otsemini näidata optimaalsust vaadeldes otsingualgoritme, millel on <math>T</math> võimalikku tulemust ning mis kasutavad nendeni jõudmiseks ainult kahe võimaliku tulemusega otsuseid. Kahendotsing on selline algoritm, sest see kasutab tulemuse valimiseks ainult võrdluseid, millel on kaks võimalikku tulemust – üks väärtus on teisest väiksem või mitte – ning kahendotsingul on <math>T=n+1</math> võimalikku tulemust, sest tulemus on kas väärtuse indeks või et väärtus ei leidu. See tähendab, et iga otsingualgoritm on alguses ühes olekus ning peab lõpus olema sõltuvalt sisenditest ühes <math>T</math> erinevast olekust. See vastab puule, mille tipud on algoritmi olekud ning lõigud on olekumuutused, mis võivad toimuda pärast mõnda otsust. Puu on tsükliteta, sest algoritm lõpetab iga sisendi puhul töö lõpliku aja jooksul. Puu on kahendpuu ehk igal tipul on kas 0 või 2 last, sest algoritm lõpetab töö või teeb järgmise tipuni jõudmiseks kahe võimaliku tulemusega otsust. Juurtipp on tipp, kus algoritm alustab töö. On olemas tee juurtipu ja iga lehe vahel, sest algoritmi alguses on võimalikud kõik <math>T</math> tulemust. Algoritmi otsuste arv halvimal juhul on maksimaalne lõikude arv teel juurtipu ja mõne lehe vahel. Käesoleva <math>T</math> lehega kahendpuu puhul lõikude arv teel on väikseim, kui puu on tasakaalus, ja on vähemalt <math>O(\log T) = O(\log(n+1)) = O(\log n)</math>. Järelikult otsuste arv ehk võrdlustega otsimise puhul vähim võrdluste arv halvimal juhul on vähemalt <math>O(\log n)</math>. [decision tree]
60. rida:
===Võrdlus===
Eksponentsiaalne otsing on sarnane kahendotsinguga, aga alustab otsimist vahemikust <code>[0, 1]<
Kahendotsingupuud ja B-puud kasutavad sarnaselt kahendotsinguga võrdlusi elementide välistamiseks, mis on kas kõik väiksemad või suuremad mõne tipu väärtusest. Kui puu on tasakaalus, siis sellesse väärtuse sisestamise ajalise keerukuse hinnang on <math>O(\log n)</math> halvimal juhul, mis on väiksem kui sorteeritud järjendisse sisestamise ajalise keerukuse hinnang <math>O(n)</math> halvimal juhul. Samas kui puu ei ole tasakaalus, siis see võib kasutada ühe väärtuse otsimisel kuni <math>O(n)</math> võrdlust halvimal juhul.
|