Mikroarhitektuur

Mikroarhitektuur (inglise keeles microarchitecture), informaatikas ja arvutitehnikas kirjeldab mikroarhitektuur, kuidas protsessoris on teostatud etteantud käsustik. Kui käsustik kirjeldab, kuidas protsessor käske täidab, siis mikroarhitektuur kirjeldab, kuidas protsessori^[1] osad on ühendatud loogiliselt ja füüsiliselt. Mikroarhitektuur võib kirjeldada ühendusi suuremate osade vahel, nagu kuidas aritmeetika-loogikaplokk on registritega ühenduses või kuidas on ühendatud individuaalsed loogikaväravad.

Mikroarhitektuuri ja käsustiku vahe

Käsustik hoomab enda alla assemblerkeele, registrid, grammatika (syntax), käitumise (execution model), aadressid ja andmetüübid. Näiteks sama käsustiku jagavad kõik x86 protsessorid, x86_64 protsessorid (tuntud ka kui AMD64) ja muud teised.

Protsessori mikroarhitektuur on tavaliselt esitatud kui protsessori osade omavaheliste ühenduste loogikadiagramm. Nendel joonistel on tavaliselt eraldatud juhtsignaalid ja andmesignaalid. Mikroarhitektuuri erinevaid komponente on võimalik kirjeldada sarnaste skeemidega kus on näidatud ühendused erinevate loogika komponentide vahel, nendest loogika komponentidest on omakorda tehtud elektriskeemid mis kirjeldavad tema tööd^[2].

Mikroarhitektuuri skeem koosneb aritmeetika-loogikaplokist, registritest, ühest või mitmest andmesiinist, puhvermälust, juhtliinidest. Diagramm näitab mis juhtsignaalide, sisendite ja väljunditega teatud masina osad tegelevad.

Erinevatel protsessoritel võivad olla erinevad lahendused, et saavutada sama lõpp tulemust kui teised sama käsustiku protsessorid. Mikroarhitektuuri muutused võivad esile tuua ka tehnoloogilised arengud kas pooljuhtides, tootmises või muus^[3].

Sama mikroarhitektuuriga arvutitel on võimalik kasutada erinevaid käsustikke minimaalsete mikrokoodi muudatustega^[4]^[5]. Mikrokood on protsessori sees olev püsimälu mis määrab kuidas protsessori masinkäske täidetakse. Uuematel protsessoritel on võimalik, et see püsimälu on ülekirjutatav (vaata välkmälu). Seda mikrokoodi uuendatakse tihti läbi BIOS ja UEFI püsivara uuenduste.

Mikroarhitektuuri mõisted

Programmide käivitamiseks peab protsessori tegema järgmist:

Mälust käsu lugemine.
Käsu dekodeerimine
Käsu täitmine
Tulemuse salvestamine

Konveier ehk toru (pipeline)

Pikemalt artiklis Toru (arvutustehnika)

Konveier on kogum jadamisi ühendatud andmete töötlemise elemente, kus ühe elemendi väljund on järgmise elemendi sisendiks. Konveierid on arvutites kasutusel selleks, et protsessoril oleks võimalik teha mitu ülesannet ühe takti jooksul. Olenevalt ülesandest võib see drastiliselt suurendada käskude täitmise kiirust. Kui aga on tegu üksteistele järgnevate käskudega, mis kõik omaette olenevad endast varasema käsu tulemusest, siis ei pruugi muutus olla märgatav.

Viieetapiline käsukonveier RISC-arhitektuuris

Käsu töötlemise saab jagada näiteks viieks etapiks:

käsu lugemine (IF)
käsu dekodeerimine (ID)
käsu täitmine (EX)
mälu poole pöördumine (MEM)
tulemuste salvestamine (WB)

Superskalaarne arhitektuur

Superskalaarseks arhitektuuriks nimetatakse arhitektuuri, mis on varustatud rohkem kui ühe konveieriga. Sellisel korral peavad igal konveieril olema oma komponentide komplekt. Superskalaarse arhitektuuriga seadmetel on kahte tüüpi rakendustega konveiereid:

sõltumatud konveierid, iga funktsionaalne seade kuulub mingi kindla konveieri juurde
osaliselt kattuvad konveierid, funktsionaalsete seadmete osas kulude kokkuhoidmiseks on mõned seadmed eri konveierite jaoks ühised.

Vahemälu

Pikemalt artiklis Vahemälu

Vahemälu (cache) on suure kiirusega mälu, mis asub protsessorile võimalikult lähedal, kõige kiirem L1-vahemälu asub protsessori põhi räni peal. Vahemälu eesmärk on hoida andmeid mida võib korduvalt vaja minna ning vältida ajakulukat põhimälust andmete leidmist.

Mitmetasemelise vahemälu struktuur ja põhimälu

Vahemälu tasemed:

L1-vahemälu
L2-vahemälu
L3-vahemälu
L4-vahemälu (väga harval juhul)

Igal füüsilisel tuumal võib olla mitu käsumootorit (execution unit) ja oma vahemälu. L2- ja L3-vahemälu korral on tihti tegu tuumade vahel jagatud vahemäluga. Kui vahemälu kasutaja (CPU, veebibrauser, operatsioonisüsteem) soovib andmeid, uuritakse kõigepealt vahemälu.

Kui vahemälust leitakse kirje ID-ga, mis sobib otsitud andmeühiku ID-ga, siis kasutatakse andmeelementide vahemälu. Vastasel korral prab pöörduma põhimälu poole.

Käsustik

Pikemalt artiklites Käsustik ja en:Instruction set architecture

Käsustiku valik võib drastiliselt mõjutada protsessori mikroarhitektuuri kompleksust. CISC protsessori mikroarhitektuur on palju keerulisem, kui RISC protsessoritel, sest neil on aja jooksul kujunenud keerulisemad käsud spetsialiseeritud ülessanete jaoks. RISC protsessorite põhi disaini strateegia oli lihtsustada individuaalseid juhiseid ja nende täitmiseks vajaliku loogikat.

Spekulatiivne käivitamine ja Siirete ennustamine

Pikemalt artiklites en:Speculative execution ja Siirete ennustamine

Siirete ennustamine on tehtud protsessori poolt, et määrata kuhu käskude täitmine läheb peale tingimuslikku hüppet, selleks, et lugeda mälust järgmisi käske. Spekulatiivne käivitamine on 1 samma rohkem ja tegelikult määrab mis järgneva koodi tulemus oleks.

Spekulatiivse käivitamise puhul käivitatakse kood enne kui selle koodi tulemusi vaja läheb teadmata kas selle koodi tulemust läheb vaja. See tähendab, et tingimusliku hargnemise puhul käiakse läbi mõlemad harud ja kui selgub kummale poole kood tegelikult peale minema peab siis heidetakse vale haru ära. Seda on võimalik teha kui protsessoril on vabu ressursse. Kaasaegsetel protsessoritel võimaldab see meetod paremini ära kasutada konveiereid ja konveieri registrites olevaid ressursse.

Joonis 1. Näide kuidas käsud liiguvad läbi neljaetapilisest konveierist ehk torust. Ühte värvi kastid kujutavad ühte instruktsiooni. Kui lilla käsk on hüpe, mis sõltub rohelise käsu tulemusest, siis ei saa hüppele järgnevat sinist käsku kohe kindlalt sisse lugeda, sest ei ole teada, kas hüpe toimub – võib-olla tuleb hoopis mõni teine käsk sisse lugeda. Üks võimalus on oodata, kuni roheline käsk saab täidetud, aga see tekitab viivise. Parem variant on siirete ennustamine

Siirete ennustamine on programmis olevate hüpete ennustamine enne, kui on teada kas hüpe sooritatakse. Kuna instruktsioonide konveier on mitmesammuline ja käsu täitmiseks kulub mitu takti, siis hüppele järgnevaid käske ei saa alati kohe mällu laadida, vaid tuleb oodata, kuni eelnevad käsud on konveieri läbinud ja nende tulemuse järgi on teada, kas hüpe toimub. Siirete ennustamise võimaluse puudumisel peab protsessor ootama ära hüppe sooritamiseks vajaliku tingimuse tulemust.

Ennustamise implementeerimise viisid:

Staatiline ennustamine, ennustatakse, et alati tuleb tingimus kas tõene või väärne.
Küllastuv loendur, iga kord kui on välja arvutatud, kas hüpe toimub või mitte, uuendatakse loenduri olekut. Kui hüpe ei toimunud, siis muudetakse olekut selliselt, et hüppe toimumise tõenäosus on ühe astme võrra madalam. Vastasel juhul tõstetakse tõenäosust ühe astme võrra kõrgemale.
Kahetasemeline adaptiivne ennustamine, koodis olevate hüpete toimumises võib esineda mustreid. Sellistes olukordades töötab kahetasemeline ennustamine paremini kui küllastuv loendur. Kahetasemeline adaptiivne ennustaja peab meeles viimase n hüppe ajalugu ja kasutab iga 2ⁿ ajaloo variandi jaoks küllastuvat loendurit.
Lokaalne siirete ennustamine, kus igal hüppel on eraldi enda ajaloo puhver. Võidakse kasutada kahetasemelist adaptiivset ennustamist või muud ennustamist.
Globaalne siirete ennustamine, selle korral ei hoita iga hüppe jaoks eraldi andmeid, vaid kõigil hüpetel on ühine ajalugu. Antud meetodi efektiivsuse jaoks on vajalik suur tabel ajaloo hoidmiseks. Kahetasemelise adaptiivse ennustaja korral kasvab ajalugude tabel eksponentsiaalselt meeles hoitavate hüpete arvust.
Hübriidne ennustamine, mille korral kasutatakse mitut ennustamismeetodit. Lõpp otsust tehes arvestatakse meetodite individuaalseid täpsusi.
Tsüklite ennustamine, tsüklis olevaid hüppeid on kõige parem ennustada spetsiaalse ennustajaga. Tsüklite ennustamine on osa hübriidsest süsteemist, kus vastavalt sellele, kas tuvastatakse tsüklilist käitumist, võetakse tsükli ennustaja või mõne muu ennustaja otsust kuulda.
Masinõppel põhinev ennustamine, masinõppe mudeleid kasutades on võimalik saada paremaid tulemusi kui hübriid ennustuse korral. Masinõppe ennustusel on võimalik kasutada pikka ajalugu, kuid selle optimeerimiseks võib kuluda palju protsessoritsükleid.

Dünaamiline ajastamine

Pikemalt artiklis en:Out-of-order execution

Dünaamiline ajastamise^[6] (dynamic execution või out-of-order execution) puhul käivitatakse koodi võimalusel erinevas järjekorras, et optimeerida konveieri kasutust ja minimseerida seisakuid. Näiteks kui protsessor peab ootama, et mingit informatsiooni põhimäust leitakse, siis on ootamise ajal võimalik täita teise käske mis ei vaja andmeid mälust.

Multitöötlus, mitmeprotsessorilisus ja mitmelõimelisus

Pikemalt artiklites en:Multiprocessing , en:Multithreading ja en:Multiprocessor system architecture

Multitöötlus (multiprocessing) on mitme protsessori kasutus ühe arvuti süsteemi sees. Multitöötlussüsteemis võivad kõik protsessorid olla võrdsed, tuntud kui sümmeetriline multitöötlus, või võib tegu olla süsteemiga kus on üks põhiprotsessor mis jagab ülesandeid teistele protsessoritele, asünkroonne multitöötlus. Multitöötluse all mõeldakse pigem, et ühe füüsilise protsessori kiibi sees on mitu n.ö loogilist protsessorit.

Mitmeprotsessorilisus^[7] (multiprocessor system) on kui ühe süsteemi sees on mitu füüsilist protsessorit.

Leebelt ühendatud mitmeprotsessorisüsteem

Mitme protsessoriga süsteemide tüübid:

Leebelt ühendatud mitmeprotsessorisüsteem (loosely coupled multiprocessor system), igal protsessoril on oma mälu, sisend väljund ja operatsioonisüsteem
Rangelt ühendatud mitmeprotsessorisüsteem (tightly coupled multiprocessor system), protsessorite vahel on jagatud mälu, kõik protsessorid on homogeensed ja ühe operatsioonisüsteemi all.
Homogeenne mitmeprotsessorisüsteem (homogeneous multiprocessor system), kõik protsessorid mis süsteemis on peavad olema sama protsessor, näiteks peavad kõik kolm süsteemi protsessorid olema i9 9900k protsessorid.
Heterogeenne mitmeprotsessorisüsteem (heterogeneous multiprocessor system), süsteemis olevad protsessorid, sealhulgas graafikaprotsessorid ja muud teised spetsialiseeritud ülesandega protsessorid, on käik ühendatud sama siiniga ning on võimelised töötama samal tasemel mis põhi protsessor.
Jagatud põhimäluga mitmeprotsessorisüsteem (shared memory multiprocessor system), protsessorite vahel on jagatud mälu
Jaotatud põhimäluga mitmeprotsessorisüsteem (distributed memory multiprocessor system), igal protsessoril on oma põhimälu, tavaliselt on see mälu sellele protsessorile nii lähedal kui võimalik.
Ühtse mälu juurdepääsuga (UMA) süsteem (uniform memory access system)
Vahemälu sidumisega ebaühtlase põhimälu juurdepääsuga süsteem (cc–NUMA system ehk Cache-coherent non-uniform memory access system), igale protsessorile on globaalsest mälust n.ö partitsioneeritud mingi osa kasutamiseks,
Hübriidsüsteem (hybrid system), kus lokaalsete andmete jaoks on lokaalne süsteemi mälu ja globaalsete jaoks on olemas globaalne mälu.

Mitmelõimelisus (multithreading) on protsessori või protsessori tuuma võime jagada programm mitmele lõimele laiali.

Näide protsessist kahe lõimega läbi aja

See on erinev multitöötlusest, sest mitmelõimelises programmis lõimed jagavad ühe või mitme tuuma ressursse, sealhulgas vahemälu, puhvreid jm. Kui multitöötlussüsteemid sisaldavad mitmeid töötlusplokke ühes või mitmes tuumas, siis mitmelõimelisuse eesmärk on optimeerida ühe tuuma kasutust.

Viited

↑ Curriculum Guidelines for Undergraduate Degree Programs in Computer Engineering (PDF). Association for Computing Machinery. 2004. Lk 60. Originaali (PDF) arhiivikoopia seisuga 3. juuli 2017.
↑ Hennessy, John L.; Patterson, David A. (2006). Computer Architecture: A Quantitative Approach (4th ed.). Morgan Kaufmann. ISBN 0-12-370490-1.
↑ Flynn, Michael J. (2007). "An Introduction to Architecture and Machines". Computer Architecture Pipelined and Parallel Processor Design. Jones and Bartlett. Lk 1–3. ISBN 9780867202045.
↑ Murdocca, Miles; Heuring, Vincent (2007). Computer Architecture and Organization, An Integrated Approach. Wiley. Lk 151. ISBN 9780471733881.
↑ Clements, Alan. Principles of Computer Hardware (4th ed.). Lk 1–2.
↑ "Käsukonveierid, käsutaseme paralleelsus, dünaamiline ajastamine ja spekulatiivne käivitamine EUCIP".
↑ "Multiprocessor definition and meaning - Collins English Dictionary". www.collinsdictionary.com.

Lisalugemist

Hamacher, C.; Vranesic, Z.; Zaky, S.; Manjikian, N. (2012). Computer Organization and Embedded Systems 6th edition. McGraw-Hill. ISBN 9780071089005.
Ledin, Jim (2020). Modern Computer Architecture and Organization. Pact Publishing. ISBN 978-1-83898-439-7.
Zhirkov, Igor (2017). Low-Level Programming (C, Assembly and Program Execution on Intel 64 Architecture). Aperss. ISBN 9781484224021.

[1] Curriculum Guidelines for Undergraduate Degree Programs in Computer Engineering (PDF). Association for Computing Machinery. 2004. Lk 60. Originaali (PDF) arhiivikoopia seisuga 3. juuli 2017.

[hennessy-2] Hennessy, John L.; Patterson, David A. (2006). Computer Architecture: A Quantitative Approach (4th ed.). Morgan Kaufmann. ISBN 0-12-370490-1.

[3] Flynn, Michael J. (2007). "An Introduction to Architecture and Machines". Computer Architecture Pipelined and Parallel Processor Design. Jones and Bartlett. Lk 1–3. ISBN 9780867202045.

[4] Murdocca, Miles; Heuring, Vincent (2007). Computer Architecture and Organization, An Integrated Approach. Wiley. Lk 151. ISBN 9780471733881.

[5] Clements, Alan. Principles of Computer Hardware (4th ed.). Lk 1–2.

[6] "Käsukonveierid, käsutaseme paralleelsus, dünaamiline ajastamine ja spekulatiivne käivitamine EUCIP".

[7] "Multiprocessor definition and meaning - Collins English Dictionary". www.collinsdictionary.com.

[1]

[2]

[3]

[4]

[5]

[6]

[7]