Kasutaja:XDLUL/Regulaaravaldis

Regulaaravaldis (inglise keeles regular expression, lühendatult regexp, regex või RE) on sümbolite jada, mis defineerivad ostingu mustri (inglise keeles pattern). Peamiselt kasutatakse seda mustrit teksti osade otsimiseks ja asendamiseks.

Regulaaravaldise mustrid koosnevad literaalsetest ja metasümbolitest. Literaalsed sümbolid esinevad vaatlusaluses tekstis esitatud kujul ehk nad tähistavad iseennast. Metasümbolid ([, ], \, /, ^, $, ., |, ?, *, +, (, ), { ja }) tähistavad mingit kindlat seaduspärasust.

Süntaks muuda

Metasümbolid muuda

Varjestamine muuda

\ sümboli eesliitmine metasümbolile muudab metasümboli literaalseks.

Disjunktsioon muuda

| tähistab kahe mustri disjunktsiooni. Näiteks A|B, kus A ja B on mustrid, tähistab kas A-d või B-d.

Klassid muuda

Metasümbol(id) Tähendus
. Tähistab igat sümbolit peale reavahetuse sümbolit.
[…] Tähistab kõiki sümboleid, mis on on sulgude vahel.
[^…] Tähistab kõiki sümboleid, mis pole sulgude vahel.

Kvantorid muuda

Metasümbol(id) Tähendus
* Eelnev muster esineb suvaline arv (seal hulgas 0) kordi.
+ Eelnev muster esineb vähemalt üks kord (0 või 1).
? Eelnev muster esineb null või üks korda.
{n,m} Eelnev muster esineb vähemalt n ja ülimalt m korda.
{n,} Eelnev muster esineb vähemalt n korda.
{,m} Eelnev muster esineb ülimalt m korda.
{n} Eelnev muster esineb täpselt n korda.

Positsioon muuda

Metasümbol(id) Tähendus
^ Tähistab sõne algust.
$ Tähistab sõne lõppu