2009-03-04 10 views
7

Nel corso degli anni, il pattern matching "regex" è diventato sempre più potente fino al punto in cui mi chiedo: è davvero solo la corrispondenza grammaticale sensibile al contesto? È una variazione/estensione della corrispondenza grammatica libera dal contesto? Dov'è adesso e perché non lo chiamiamo semplicemente al posto della vecchia "espressione regolare" restrittiva?La "regex" nei linguaggi di programmazione moderni è davvero "grammatica sensibile al contesto"?

risposta

9

In particolare i riferimenti secondari per l'acquisizione di parentesi rendono le espressioni regolari più complesse rispetto alle grammatiche regolari, contestuali o sensibili al contesto. Il nome è semplicemente storicamente cresciuto (come molte parole). Vedi anche this section in Wikipedia e questo explanation with an example da Perl.

+0

Potrebbe spiegare la differenza tra "linguaggio normale" e "espressione regolare"? –

+1

È davvero più potente di CSG? Potresti fare un esempio? – notnot

+0

Una lingua normale può essere descritta da una grammatica regolare (vedere http://en.wikipedia.org/wiki/Regular_grammar), mentre le espressioni regolari sono un linguaggio di abbinamento di modelli meno ristretto e quindi più complesso da elaborare. –

3

Il mio modo di vedere:

  • linguaggi regolari:
    • di pari passo con macchine a stati. Solo una variabile può essere usato per rappresentare l'attuale "location" nella grammatica da abbinare: ricorsione non può essere attuato
  • context-free lingue:
    • Abbinato da una macchina stack. L'attuale "posizione" nella grammatica è rappresentata da una pila in una o in un'altra forma. Non può "ricordare" tutto ciò che si è verificato prima
  • sensibili al contesto lingue:
    • maggior parte dei linguaggi di programmazione
    • Tutte maggior parte dei linguaggi umani

so di regolare parser di espressioni che ti permettono di confrontare con qualcosa che il parser ha già incontrato, ottenendo qualcosa come un contesto grammatica intuitiva.

Ancora, i parser di espressioni regolari, per quanto sofisticati possano essere, non consentono un'applicazione ricorsiva delle regole, che è un requisito preciso per le grammatiche context-free.

Il termine regex, a mio parere, si riferisce principalmente al sintassi utilizzato per esprimere quelle grammatiche regolari (le stelle e punti interrogativi).

+0

Lookahead/lookbehind e naming aggiungono sicuramente qualcosa che si trova al di fuori delle espressioni regolari standard - la memoria. Quindi non siamo a livello di PDA? – notnot

+1

In generale non è vero che il linguaggio naturale è sensibile al contesto, vedi http://www.eecs.harvard.edu/~shieber/Biblio/Papers/shieber85.pdf –

+0

ah, questa è la roba buona – notnot

3

Ci sono funzionalità nelle moderne implementazioni di espressioni regolari che infrangono le regole dello classic regular expression definition.

Per esempio Microsoft’s .NET Balancing Group(?<name1-name2> …):

^(?:0(?<L>)|1(?<-L>))*(?(L)(?!))$ 

Questo fa corrisponde alla lingua L ₀₁ = {ε, 01, 0011, 000111, ...}. Ma questa lingua non è regolare secondo lo Pumping Lemma.

+0

So che va oltre la regex classica, ma mi chiedo quanto più lontano. Il link di Fabian sopra è interessante. – notnot

Problemi correlati