174 litriú ar fhocal amháin, in ord minicíochta 😀 pic.twitter.com/6nbn23FRe0
— Caoimhín Ó Scanaill (@kscanne) October 10, 2020
Sampla ana mhaith is ea an méid seo thús de phíblíne *nix. Feidhmíonn go leor, leor cláracha de chuid Unix mar scagairí ar chineáil éagsúla téacs, ag déanamh athrú ar an ionchur agus á sheoladh chuig an aschur. Feidhmíonn an siombal "|" már phíobán a nascann aschur an ordú ar chlé le hionchur an ordú ar dheis.
egrep -i -o 'ch?[oó](mh?)?gh?[a-z]*r[a-z]*d[a-z]*s' sonrai/ga-tweets.txt | tolow | sed 's/^ch/c/' | sort | uniq -c | sort -r -n | sed 's/^ *[0-9]*//' | tr "\n" " " | fmt
Clár is ea "grep" - seasann an ainm do "globally search for a regular expression and print matching lines", bunaithe ar an ordú g/re/p atá san eagarthóir luath ed. Nuair a chuirtear "e" roimhe, is dóigh é chun an leagan de na slonn rialta atá le húsáid a sainmhiniú. Is éard atá i gceist le "slonn rialta" ná pátrún chun teaghráin ar leith a lorg. Sa chás seo is
ch?[oó](mh?)?gh?[a-z]*r[a-z]*d[a-z]*s
an slonn rialta. An t-oideas atá i gceist ná:
- lorg "c";
- leanta ag ar a mhéid "h" amháin;
- leanta ag "o" nó "ó";
- leanta ag "m" agus ar a mhéid "h" amháin, uair amháin ar a mhéid;
- leanta ag "g" agus ar a mhéid "h" amháin;
- leanta ag líon anaithnid litreacha idir a agus z, ceann ar bith san áireamh => [a-z]* ;
- leanta ag r;
- leanta ag [a-z]* arís;
- leanta ag d;
- leanta ag [a-z]* arís;
- leanta ag s.
$ echo "Caoimhín" | egrep '^Caoimh[a-z]n'Caoimhín$ echo "Caoimhín" | LC_ALL=C egrep '^Caoimh[a-z]n'$