PAVADINIMAS (NAME)

perlreref - Perlo įpraiškų žinynas

APRAŠYMAS (DESCRIPTION)

Tai trumpas Perlo įpraiškų žinynas. Pilnos informacijos apie įpraiškas ieškokite perlre ir perlop dokumentacijos skyriuose, o taip pat šio žinyno references skyriuje.

OPERATORIAI

=~ nustato kuriam kintamajam taikyti šabloną.
   Jei nenurodoma, naudoja $_                      

      $var =~ /foo/;                             

m/įpraiška/igmsoxc ieško simbolių eilutėje įpraiškos atitikimo,
   su šiais galimais nustatymais:

      i  Nekreipiant dėmesio į didžiąsias/mažąsias raides
      g  Globalus - visi atitikimai
      m  Per kelias eilutes - ^ ir $ atitinka vidines eilutes
      s  Taikyti kaip vienai eilutei - . atitinka \n
      o  Kompiliuoja įpraišką tik vieną kartą
      x  Išplėstinės įpraiškos - galima naudoti tarpus ir komentarus
      c  Neatitaisyti pos kai įpraiška neatitinka eilutės naudojant /g

   Jei 'įpraiška' yra tuščia eilutė, vietoje jos naudojama paskutinė 
   I<sėkmingai> atitikusi įpraiška. Galima naudoti ir kitokius skirtukus 
   nei '/' tiek šitam operatoriui, tiek ir žemiau aprašytiesiems.

qr/įpraiška/imsox leidžia išsaugoti įpraišką į kintamąjį ar perduoti į 
   funkciją. Modifikatoriai saugomi kartu su įpraiška, kaip ir m// atveju.

s/įpraiška/pakeitimas/igmsoxe pakeičia simbolių eilutėje atitikusias 
   'įpraišką' dalis į 'pakeitimą'. Modifikatoriai tokie patys kaip ir
   m// atveju, tik su vienu papildymu:

      e  Įvykdyti 'pakeitimą' kaip Perlo kodą

   'e' gali būti nurodytas ir keletą kartų. 'pakeitimas' yra 
   interpretuojamas kaip simbolių eilutė tarp dvigubų kabučių, nebent šio 
   operatoriaus skirtukas yra vienguba kabutė (').

?įpraiška? lygiai taip pat kaip m/įpraiška/ tačiau atitinka tik vieną kartą.
   Negalima naudoti jokių kitų skirtukų. Turi būti atstatyta su 'reset'.

SINTAKSĖ

   \       Išvengia tuoj po jo einančio simbolio meta-reikšmės
   .       Atitinka bet kurį vieną simbolį išskyrus naujos eilutės simbolį
	   (nebent naudojamas /s modifikatorius)
   ^       Atitinka teksto pradžią (arba eilutės pradžią, jei naudojamas /m)
   $       Atitinka teksto pabaigą (arba eilutės pabaigą, jei naudojamas /m)
   *       Atitinka prieš tai einantį elementą 0 ar daugiau kartų
   +       Atitinka prieš tai einantį elementą 1 ar daugiau kartų
   ?       Atitinka prieš tai einantį elementą 0 ar 1 kartų
   {...}   Nurodo prieš tai einančio elemento pasikartojimų intervalą
   [...]   Atitinka kurį nors simbolį ir nurodytos aibės
   (...)   Sugrupuoja išraiškas ir priskiria jų rezultatus $1, $2...
   (?:...) Sugrupuoja išraiškas be rezultatų priskyrimo
   |       Atitinka išraišką iš dešinės ARBA iš kairės (alternatyva)
   \1, \2 ...  Tekstas iš N-tosios grupės

SPECIALIOSIOS SEKOS

Šios sekos veikia taip kaip ir paprastose simbolių eilutėse:

\a       Skambutis
\e       Escape
\f       Formfeed
\n       Newline - nauja eilutė
\r       Carriage return
\t       Tab
\038     Bet kuri aštuonetainė ASCII reikšmė
\x7f     Bet kuri šešioliktainė ASCII reikšmė
\x{263a} Plati šešioliktainė reikšmė
\cx      Control-x
\N{name} Vardinis simbolis

\l  Mažosios raidės iki kito simbolio
\u  Didžiosios raidės iki kito simbolio
\L  Mažosios raidės iki \E
\U  Didžiosios raidės iki \E
\Q  Išjungia metasimbolius iki \E
\E  Didžiųjų/mažųjų raidžių transformavimo pabaiga

Ši seka veikia skirtingai nei simbolių eilutėse:

\b  Žodžio riba, o ne "backspace", išskyrus simbolių aibėse

SIMBOLIŲ AIBĖS

[amy]    Atitinka 'a', 'm' ar 'y'
[f-j]    Brūkšnelis nurodo "intervalą"
[f-j-]   Brūkšnelis pačioje pradžioje ar pabaigoje reiškia brūkšnelį
[^f-j]   Stogelio ženklas reiškia "atitinka viską kas NĖRA aibėje"

Šios sekos veikia tiek aibėse, tiek ir už jų:

\d      Skaitmuo, tas pats kaip [0-9]
\D      Ne skaitmuo, tas pats [^0-9]
\w      Raidės arba skaičiaus simbolis, tas pats kaip [a-zA-Z_0-9]
\W      Ne raidė ir ne skaičius, [^a-zA-Z_0-9]
\s      "Baltas" simbolis, tas pats kaip [ \t\n\r\f]
\S      "Nebaltas" simbolis, [^ \t\n\r\f]
\C      Atitinka baitą (Unikode '.' atitinka simbolį)
\pP     Atitinka P-vardo (Unikodinę) savybę
\p{...} Atitinka Unikodo savybę ilgu pavadinimu
\PP     Atitinka ne-P savybę
\P{...} Atitinka ne-P unikodinę savybę ilgu pavadinimu
\X      Atitinka išplėstinę Unikodinę seką

POSIX simbolių aibės bei jų Unikodiniai bei Perlo atitikmenys

alnum   IsAlnum             Raidės ir skaičiai
alpha   IsAlpha             Raidės
ascii   IsASCII             Bet koks ASCII simbolis
blank   IsSpace  [ \t]      horizontalūs "balti" simboliai (GNU)
cntrl   IsCntrl             Konrolės simboliai
digit   IsDigit  \d         Skaitmenys
graph   IsGraph             Raidės, skaičiai ir skyryba
lower   IsLower             Mažosios raidės (pagal lokalę)
print   IsPrint             Raidės, skaičiai, skyryba, tarpų simboliai
punct   IsPunct             Skyryba
space   IsSpace  [\s\ck]    "Balti" simboliai
        IsSpacePerl   \s    "Balti" simboliai pagal Perlo apibrėžimą
upper   IsUpper             Didžiosios raidės (pagal lokalę)
word    IsWord   \w         Raidės, skaičiai ir _ (Perlas)
xdigit  IsXDigit [\dA-Fa-f] Šešioliktainis skaitmuo

Simbolių aibėse:

POSIX       tradicinis    Unikodas
[:digit:]       \d        \p{IsDigit}
[:^digit:]      \D        \P{IsDigit}

INKARAI

Visos šios sekos tik nurodo kurioje vietoje reikia taikyti šabloną.

^  Atitinka teksto pradžią (arba eilutės, jei naudojamas /m)
$  Atitinka teksto pabaigą (arba eilutės, jei naudojamas /m) arba prieš naują eilutę
\b Atitinka žodžio ribą (tarp \w ir \W)
\B Atitinka ne žodžio ribą
\A Atitinka teksto pradžią (nekreipia dėmesio į /m)
\Z Atitinka teksto pabaigą (prieš pabaigą einančią nebūtiną \n)
\z Atitinka absoliučią teksto pabaigą
\G Atitinka tą vietą, kurioje darbą baigė paskutinis m//g 
\c Iš naujo nenustatinėja paieškos vietos kai naudojamas /g.
   Be \c, kiekvieną kartą pradedama ieškoti nuo pradžios

KIEKINĖS SEKOS

Kiekinės sekos automatiškai atitinka ilgiausią seką iš kairės.

Maksimalu Minimalu Leidžiamas intervalas
--------- -------- ---------------------
{n,m}     {n,m}?  Turi būti ne mažiau kaip n kartų, bet ne daugiau nei m kartų
{n,}      {n,}?   Turi būti bent n kartų
{n}       {n}?    Turi būti lygiai n kartus
*         *?      0 arba daugiau kartų (tas pats kaip {0,})
+         +?      1 arba daugiau kartų (tas pats kaip {1,})
?         ??      0 arba 1 kartą (tas pats kaip {0,1})

IŠPLĖSTINĖS SEKOS

(?#tekstas)        Komentaras
(?imxs-imsx:...)   Įjungia/išjungia nustatymą (taip kaip ir m//)
(?=...)            Nulinio ilgio teigiamas sprendinys už šios vietos
(?!...)            Nulinio ilgio neigiamas sprendinys už šios vietos
(?<...)            Nulinio ilgio teigiamas sprendinys prieš šią vietą
(?<!...)           Nulinio ilgio neigiamas sprendinys prieš šią vietą
(?>...)            Atitikti kiek galima daugiau nesaugant reikšmių kintamuosiuose
(?{ kodas })       Įterptas kodas, grąžinta reikšmė tampa $^R
(??{ kodas })      Dinaminė įpraiška, grąžinta reikšmė panaudojama kaip įpraiška
(?(sąlyga)taip|ne) Sąlyga yra skaičius atitinkantis skliaustelius
(?(sąlyga)taip)       

KINTAMIEJI

$_    Kintamais pagal nutylėjimą, kurį naudoja operatoriai
$*    Įjungia šablonų taikymą keletui eilučių (nenaudotinas; nebėra 5.8.1+ versijose)

$&    Visa simbolių eilutė, kuri atitiko
$`    Viskas iki atitikusio simbolių eilutės
$'    Viskas po atitikusios simbolių eilutės

Šių trijų kintamųjų vartojimas sulėtins visas įpraiškas jūsų programoje. Pasiskaitykite perlvar dokumentaciją apie @LAST_MATCH_START masyvą bei ką daryti kad sulėtėjimo nebūtų. Taip pat žiūrėkite Devel::SawAmpersand modulio dokumentaciją.

$1, $2 ...  saugo n-tąją išsaugotą seką
$+    Paskutinė skliausteliuose išsaugota seka
$^N   Holds the most recently closed capture
$^R   Saugo (?{...}) išraiškos rezultatą
@-    Saugo grupių pradžios vietas. $-[0] saugo viso atitikimo pradžią
@+    Saugo grupių pabaigos vietas. $+[0] saugo viso atitikimo pabaigą

Grupės yra numeruojamos pagal atsidarančius skliaustelius.

FUNKCIJOS

lc          Pakeisti simbolių eilutę į mažąsias raides
lcfirst     Pakeisti simbolių eilutės pirmą simbolį į mažąjį raidę
uc          Pakeisti simbolių eilutę į didžiąsias raides
ucfirst     Pakeisti simbolių eilutės pirmą simboliį į didžiąją raidę
pos         Grąžinti arba nustatyti dabartinę įpraiškos atitikimo vietą
quotemeta   Išvengti meta simbolių
reset       Reset ?pattern? status
study       Analyze string for optimizing matching

split       Use regex to split a string into parts

AUTORIUS

Iain Truskett.

Šis dokumentas platinamas tokiomis pat sąlygomis kaip ir pats Perlas.

Vertė: Petras Kudaras, 2003-2004

TOLIMESNĖ INFORMACIJA

DĖKUI

David P.C. Wollmann, Richard Soderberg, Sean M. Burke, Tom Christiansen, Jim Cromie, ir Jeffrey Goff už naudingus patarimus.