Formaalne grammatika

Formaalseks grammatikaks nimetatakse informaatikas ja keeleteaduses formaalse keele täpset kirjeldust, mis tähendab keele kuuluvate stringide (sõne (informaatika)) määratlemist. Formaalses grammatikas on kaks põhilist kategooriat. Esimene neist, generatiivsed grammatikad tegeleb reeglitega kuidas keelde kuuluvaid stringe genereerida. Teine, analüütilised grammatikad tegeleb reeglitega kuidas on võimalik stringe analüüsida, et aru saada, kas see kuulub keelde. Lühidalt, analüütiline grammatika kirjeldab kuidas ära tunda stringe mis kuuluvad mingisse hulka, samal ajal kui generatiivne grammatika kirjeldab kuidas kirjutada ainult neid stringe, mis kuuluvad mingisse hulka.

Generatiivsed grammatikad muuda

  Pikemalt artiklis Generatiivne grammatika

Generatiivne grammatika koosneb reeglitest, mille abil konstrueerida stringe. Selleks, et genereerida keelde kuuluvat stringi tuleb alustada grammatika algussümbolist ning seejärel rakendada teisi sobivaid reegleid. Reegleid võib kasutada suvalises järjekorras ja suvaline arv kordi. Reeglite rakendamise tulemusena saadakse string, mis kuulub grammatikaga määratud keelde. Osad grammatikad võimaldavad saada sama stringi mitmel eri viisil reegleid kohaldades, neid grammatikaid nimetatakse mitmeseks. Grammatikat, mille abil saab kõiki stringe ainult ühtviisi reegleid rakendades genereerida nimetatakse üheseks.

Näiteks võtame keele, milles on kaks tähte -   ja   ning 2 reeglit:

1.  
2.  

Alustame  -st mis on algussümbol. Valides esimese reegli, asendame me  -i  -ga ja saame stringi  . Valides reegli 1 veel üks kord saame stringi   ja seejärel rakendades reeglit 2 saame stringi  . Lühidalt kokkuvõttes oli tuletuskäik järgmine:  . Grammatikaga määratud keeleks on kõikide nende stringide hulk mida antud reeglite abil on võimalik genereerida:  .

Formaalne definitsioon muuda

Noam Chomsky pakkus 1950 aastatel välja formaalse grammatika definitsiooni. Grammatika G koosneb 4 komponendist:

  • Mitteterminalide lõplikust hulgast  
  • Terminalide lõplikust hulgast  , millel puudub ühisosa mitteterminalide hulgaga.
  • Produktsioonireeglite lõplikust hulgast  , igaüks kujul
 
Lahtiseletatuna, iga produktsioonireegel seob ühe stringi teisega, vasakul pool peab olema vähemalt üks sümbol mitteterminalide hulgast. Juhul kui paremal pool on tühi string (string, milles ei ole ühtegi sümbolit), siis kasutatakse selle väljanäitamiseks sümbolit epsilon ( ).
  • Algussümbolist  , mis sisaldub hulgas  
 

Tavaliselt viidatakse grammatikale kui nelikule:  . Formaalse grammatika   poolt määratud keel ( ) on defineeritud kui kõikide nende stringide hulk, mis koosnevad ainult sümbolitest hulgast   ja mida on võimalik genereerida alustades algussümbolist   ja seejärel rakendades produktsioone hulgast   kuni sõnad koosnevad ainult terminalidest (ei leidu sümboleid mitteterminalide hulgast  ).

Näide muuda

Nende näidete jaoks on formaalsete keelte spetsifitseerimiseks kasutatud set-builder notationi.

Olgu meil grammatika  , kus  ,  ,   on algussümbol ja   sisaldab järgmisi produktsioonireegleid:

1.  
2.  
3.  
4.  

Mõned näited keelde   kuuluvate stringide tuletamisest oleks:

  •  
  •  
  •   
(Selgitus: loe   kui "L genereerib R-i kasutades selleks produktsiooni number i" ja genereeritud osa näidatakse iga kord rasvaselt)

See grammatika defineerib keele  , kus   tähendab n arvust   sümbolitest koosnevat stringi. Seega, see keel sisaldab stringe, milles on võrdne nullist suurem arv  ,   ja   stinge ning need sümbolid asuvad samas järjekorras.

Chomsky hierarhia muuda

Analüütilised grammatikad muuda

Kirjandus muuda

  • Jaak Henno. Formaalsed keeled, grammatikad ja translaatorid 2006. TTÜ Kirjastus. ISBN 9985-59-627-7.