Assembler on kompilaator, mis võimaldab tõlkida assemblerkeeles kirjutatud programmi masinkoodiks. Assembler võimaldab suhelda otse arvuti riistvaraga, tõlkides inimesele arusaadavad juhised masinkoodiks, mida arvuti protsessor saab otse täita.[1]

Kõrgtaseme koodi teekond masinkoodiks

Assemblerid on tihedalt seotud arvuti riistvara arhitektuuriga, millele need peavad tõlkima koodi. Erinevad arhitektuurid (nagu x86, ARM jne) kasutavad erinevaid käskude komplekte. Seega peavad assemblerid olema kohandatud vastavalt konkreetsele arhitektuurile, millele need on mõeldud. Näiteks assembler, mis on mõeldud x86 arhitektuuri jaoks, ei pruugi olla ühilduv ARM arhitektuuriga ja vastupidi.

Assembleri kasutatakse laialdaselt tarkvaraarenduses, kus tuleb luua tarkvara, mis suhtleb otse arvuti riistvaraga. Sellised rakendused hõlmavad operatsioonisüsteeme, draivereid ja muid tarkvarakomponente, mis peavad täitma madalal tasemel ülesandeid, nagu mälu haldamine, riistvara juhtimine ja protsessori käskude täitmine.

Arvuti riistvara

Lisaks kasutatakse assembleri mikrokontrollerite programmeerimisel, kus tarkvara peab suhtlema väikeste, spetsialiseeritud arvutisüsteemidega. Sellistes rakendustes on assemblerikeel sageli eelistatud valik, kuna see on kiire ja võimaldab täpset kontrolli riistvara üle.

Vahel kasutatakse sõna "assembler" kõnekeeles ka assemblerkeele kohta.

Ajalugu

muuda
 
Näide kõrgkeelest Python

Esimene assemblerikeeles kirjutatud kood, milles kasutati sõnu masinkoodi juhiste kirjeldamiseks leidub Kathleen ja Andrew Boothi töös "Coding for A.R.C."[2] aastast 1947. Assemblerikeelne kood muudeti käivitatavaks masinkoodiks programmi abil, mida nimetati assembleriks.

Sõna "assembler" omistatakse üldiselt Wheelerile, Wilkesile ja Gillile nende 1951. aasta raamatus "The Preparation of Programs for an Electronic Digital Computer",[3] kus seda kasutati tähenduses "programm, mis koostab teise mitmest osast koosneva programmi üheks programmiks",[4] kus programmi koostamise protsessi kutsuti assembleerimiseks (assembly).

Assemblerid on olnud saadaval alates 1950. aastatest, olles masinkeele ja kõrgkeelte vahel. Assemblerite kasutuselevõtt avas tee kõrgtasemel programmeerimiskeeltele nagu Fortran, Algol, COBOL, Lisp jne.

Enne assemblereid pidid programmeerijad käsitsi “kirjutama” masinkoodi, mis koosnesid arvukatest binaarsetest instruktsioonidest ja mäluaadressidest. See protsess oli aeganõudev, vigade rohke ning nõudis sügavat arusaamist arvuti riistvarast. Assemblerite kasutuselevõtt automatiseeris ja lihtsustas seda protsessi oluliselt.

 
Näide assembler koodist

Tööpõhimõte

muuda

Assemblerkeele põhimõtted[5]

muuda

Assembleri keel koosneb lühikestest mnemoonilistest koodidest ja sümbolitest, mis määravad käskude, andmete ja struktuuride paigutuse. Assembleri keeles kirjutatud programm koosneb tavaliselt mitmest osast.

  1. Muutujate osa – see sektsioon võib sisaldada muutujate või andmestruktuuride defineerimist, mida programm kasutab. Siin võivad olla määratletud sümbolid, mis tähistavad muutujate või andmestruktuuride algust. Selle osa eesmärk on lihtsustada muutujatele või andmestruktuuridele juurdepääsu programmi teistes osades.
  2. Andmete ja konstantide osa – see sisaldab püsivaid andmeid või konstante, mida programm kasutab. Siin võivad olla määratletud näiteks sõned, täisarvud või muud konstantsed andmed, mida programm kasutab oma tööks.
  3. Käskude osa – see on programmikoodi põhiosa, kus asuvad assemblerikeelsed instruktsioonid. Iga käsk koosneb tavaliselt mnemoonikast (nt MOV, ADD, JMP), millele järgneb üks või mitu operandi (nt registrid, mäluaadressid või konstandid).

Assemblerkeele näide

muuda
; -----------------------------------------------------------------------
; hello.asm
;
; See on Win32 konsooliprogramm, mis kirjutab ühele reale "Hello, world"
; ning seejärel lõpetab. See kasutab ainult Win32 süsteemi kutsungeid
; kernel32.dll-st
; -----------------------------------------------------------------------

        .386P
        .model    flat
        extern    _ExitProcess@4:near
        extern    _GetStdHandle@4:near
        extern    _WriteConsoleA@20:near
        public    _go

        .data
msg     byte      'Hello, World', 10
handle  dword     ?
written dword     ?

        .stack

        .code
_go:        
        ; handle = GetStdHandle(-11)
        push      -11
        call      _GetStdHandle@4
        mov       handle, eax

        ; WriteConsole(handle, &msg[0], 13, &written, 0)
        push      0
        push      offset written
        push      13
        push      offset msg
        push      handle
        call      _WriteConsoleA@20

        ; ExitProcess(0)
        push      0
        call      _ExitProcess@4

        end

[6]

Assembleri põhimõtted/töökäik[7]

muuda

Assembler tõlgib assemblerkeeles kirjutatud programmi masinkoodiks. See protsess hõlmab mitmeid samme:

  1. Leksikaalne analüüs – assembler võtab sisendina assemblerkeeles kirjutatud koodi ja analüüsib seda, teisendades selle "tokeniteks". Need tokenid võivad hõlmata käskusid, registreid, mäluaadresse, konstante jne.
  2. Süntaksi analüüs – järgmise sammuna kontrollib assembler, kas tokenid järgivad assemblerkeele süntaksi reegleid. See hõlmab kontrollimist, kas kõikidel kasutatud käskudel on õige vorm ja kas kõik sulud, komad jne on korrektselt paigutatud.
  3. Semantiline analüüs – assembler kontrollib, kas koodi semantika on korrektne, st kas kood teeb mõistlikult midagi. See hõlmab muu hulgas kontrollimist, kas kasutatud registrid ja mäluaadressid on sobivad ning kas juhised on korrektselt koostatud.
  4. *Optimeerimine – mõned assemblerid võivad teha mõningaid optimeerimisi, et muuta genereeritud masinkood efektiivsemaks. Näiteks võib see hõlmata käskude ümberkorraldamist või mõne liigse operatsiooni eemaldamist.
  5. Koodi genereerimine – assembler genereerib masinkoodi, mis on arvuti poolt otse käivitatav.
  6. *Linkimine – linkimine võib olla vajalik, kui programm koosneb mitmest osast või kasutab väliseid funktsioone või raamatukogusid. Linkimine on protsess, kus mitu masinkoodifaili või välised raamatukogud ühendatakse üheks käivitatavaks programmiks.

*Optimeerimist ja Linkimist ei tehta/kasutata alati assembleri tööprotsessis, see sõltub konkreetsest assemblerist ja programmist.

 
Assembleri näide

Masinkoodi näide

muuda
01010101 10001001 11100101 10000011 11100100 11110000 10000011 11101100 00010000 11000111 00000100 00100100 11010100 10000100 00000100 00001000 11101000 10111011 11111110 11111111 11111111 10111000 00000000 00000000 00000000 00000000 11001001 11000011 01100110 10010000 01100110 10010000

[8]

Vaata ka

muuda

Viited

muuda
  1. "Assembly language", Wikipedia (inglise), 28. aprill 2024
  2. Booth, Andrew D; Britten, Kathleen HV (1947). Coding for A.R.C. (PDF). Institute for Advanced Study, Princeton.
  3. Wilkes, Maurice Vincent; Wheeler, David John; Gill, Stanley J. (1951). The preparation of programs for an electronic digital computer (Reprint 1982 ed.). Tomash Publishers. ISBN 978-0-93822803-5. OCLC 313593586.
  4. Fairhead, Harry (2017-11-16). "History of Computer Languages - The Classical Decade, 1950s". I Programmer. Archived from the original on 2020-01-02.
  5. "Assemblerkeel", Vikipeedia, 2. aprill 2024
  6. "x86assembly". cs.lmu.edu.
  7. Salomon, David (February 1993) [1992]. Written at California State University, Northridge, California, US. Chivers, Ian D. (ed.). Assemblers and Loaders (PDF). Ellis Horwood Series In Computers And Their Applications (1 ed.). Chicester, West Sussex, UK: Ellis Horwood Limited / Simon & Schuster International Group. pp. 7, 237–238. ISBN 0-13-052564-2. Archived (PDF) from the original on 2020-03-23
  8. Lam, Ryan. "What are some machine level language examples?". Lk Quora.