Questo interprete di notazione (notazione polacca inversa) di notazione Python può essere reso più efficiente e preciso?

Ecco un interprete di notazione postfix Python che utilizza uno stack per valutare le espressioni. È possibile rendere questa funzione più efficiente e accurata?Questo interprete di notazione (notazione polacca inversa) di notazione Python può essere reso più efficiente e preciso?

#!/usr/bin/env python 


import operator 
import doctest 


class Stack: 
    """A stack is a collection, meaning that it is a data structure that 
    contains multiple elements. 

    """ 

    def __init__(self): 
     """Initialize a new empty stack.""" 
     self.items = []  

    def push(self, item): 
     """Add a new item to the stack.""" 
     self.items.append(item) 

    def pop(self): 
     """Remove and return an item from the stack. The item 
     that is returned is always the last one that was added. 

     """ 
     return self.items.pop() 

    def is_empty(self): 
     """Check whether the stack is empty.""" 
     return (self.items == []) 


# Map supported arithmetic operators to their functions 
ARITHMETIC_OPERATORS = {"+":"add", "-":"sub", "*":"mul", "/":"div", 
         "%":"mod", "**":"pow", "//":"floordiv"} 


def postfix(expression, stack=Stack(), operators=ARITHMETIC_OPERATORS): 
    """Postfix is a mathematical notation wherein every operator follows all 
    of its operands. This function accepts a string as a postfix mathematical 
    notation and evaluates the expressions. 

    1. Starting at the beginning of the expression, get one term 
     (operator or operand) at a time. 
     * If the term is an operand, push it on the stack. 
     * If the term is an operator, pop two operands off the stack, 
     perform the operation on them, and push the result back on 
     the stack. 

    2. When you get to the end of the expression, there should be exactly 
     one operand left on the stack. That operand is the result. 

    See http://en.wikipedia.org/wiki/Reverse_Polish_notation 

    >>> expression = "1 2 +" 
    >>> postfix(expression) 
    3 
    >>> expression = "5 4 3 + *" 
    >>> postfix(expression) 
    35 
    >>> expression = "3 4 5 * -" 
    >>> postfix(expression) 
    -17 
    >>> expression = "5 1 2 + 4 * + 3 -" 
    >>> postfix(expression, Stack(), ARITHMETIC_OPERATORS) 
    14 

    """ 
    if not isinstance(expression, str): 
     return 
    for val in expression.split(" "): 
     if operators.has_key(val): 
      method = getattr(operator, operators.get(val)) 
      # The user has not input sufficient values in the expression 
      if len(stack.items) < 2: 
       return 
      first_out_one = stack.pop() 
      first_out_two = stack.pop() 
      operand = method(first_out_two, first_out_one) 
      stack.push(operand) 
     else: 
      # Type check and force int 
      try: 
       operand = int(val) 
       stack.push(operand) 
      except ValueError: 
       continue 
    return stack.pop() 


if __name__ == '__main__': 
    doctest.testmod()

fonte

2010-10-05 simeonwillbanks

suggerimenti generali:

Evita controlli di tipo non necessarie, e si basano sul comportamento dell'eccezione.
has_key() è stato a lungo sconsigliato a favore dell'operatore in: utilizzare quello.
Profile il tuo programma, prima di tentare qualsiasi ottimizzazione delle prestazioni. Per uno zero-sforzo profilatura run di qualsiasi codice, basta eseguire: python -m cProfile -s cumulative foo.py

punti specifici:

listmakes a good stack fuori dalla scatola. In particolare, consente di utilizzare la notazione di segmento (tutorial) per sostituire lo pop/pop/append con un singolo passaggio.
ARITHMETIC_OPERATORS può riferirsi direttamente alle implementazioni dell'operatore, senza il riferimento a getattr.

Mettendo insieme tutto questo:

ARITHMETIC_OPERATORS = { 
    '+': operator.add, '-': operator.sub, 
    '*': operator.mul, '/': operator.div, '%': operator.mod, 
    '**': operator.pow, '//': operator.floordiv, 
} 

def postfix(expression, operators=ARITHMETIC_OPERATORS): 
    stack = [] 
    for val in expression.split(): 
     if val in operators: 
      f = operators[val] 
      stack[-2:] = [f(*stack[-2:])] 
     else: 
      stack.append(int(val)) 
    return stack.pop()

fonte

2010-10-05 18:18:17

Piet, questa è un'ottima risposta. Il tempo di esecuzione del programma è diminuito. Tuttavia, ho una domanda. In 'postfix', rileveresti tutte le possibili eccezioni e le invierai al chiamante come un'eccezione' Exception', o la chiameresti a 'postfix' in un try/except block completo? – simeonwillbanks

simeonwillbanks: in caso di dubbi sulle eccezioni, non fare nulla. :-) Sono eccezionali per una ragione! È raro definire le proprie eccezioni: non farlo quando una [eccezione built-in] (http://docs.python.org/library/exceptions.html) è sufficiente. Inoltre, non sentirti obbligato a scrivere "completi" try/tranne i blocchi: quasi tutto il codice dovrebbe consentire il passaggio di quasi tutte le eccezioni e gestire solo le eccezioni che * sanno * devono gestire. (Uno degli unici posti in cui vorresti mai un gestore eccezioni catch-all è al livello più alto di un'applicazione di produzione, ad esempio, per segnalare l'errore.) –

Piet, grazie per i suggerimenti. Sto accettando la tua soluzione! Post scriptum L'estate scorsa ho visitato Città del Capo per la Coppa del Mondo 2010. È una città adorabile, e spero di tornare un giorno. – simeonwillbanks

Gli elenchi possono essere utilizzati direttamente come pile:

>>> stack = [] 
>>> stack.append(3) # push 
>>> stack.append(2) 
>>> stack 
[3, 2] 
>>> stack.pop() # pop 
2 
>>> stack 
[3]

Si può anche mettere le funzioni operatore direttamente nelle ARITHMETIC_OPERATORS DICT:

ARITHMETIC_OPERATORS = {"+":operator.add, 
         "-":operator.sub, 
         "*":operator.mul, 
         "/":operator.div, 
         "%":operator.mod, 
         "**":operator.pow, 
         "//":operator.floordiv}

poi

if operators.has_key(val): 
    method = operators[val]

L'obiettivo del Se non è quello di rendere le cose più efficienti (anche se potrebbe avere quell'effetto) ma renderle più ovvie al lettore. Sbarazzarsi di livelli inutili di indirezione e involucri. Ciò tenderà a rendere il tuo codice meno offuscato. Fornirà anche (banali) miglioramenti nelle prestazioni, ma non credere che se non lo si misura.

Per inciso, l'uso di elenchi come stack equivale a common Python idiomatico.

fonte

2010-10-05 17:11:25 nmichaels

punto eccellente. Sostituire il tipo di dati astratti 'Stack' con un' elenco' incorporato dovrebbe rendere più veloce la funzione 'postfix'. Sul mio Mac (OS X 10.5.8/2.6 GHz Intel Core 2 Duo/4GB Mem), lo stack integrato può essere eseguito in 0,18 secondi o 0,19 secondi. Coerentemente, lo Stack ADT viene eseguito in 0,19 secondi. – simeonwillbanks

È possibile mappare direttamente gli operatori: {"+": operator.add, "-": operator.sub, ...}. Questo è più semplice, non ha bisogno del non necessario getattr e consente anche l'aggiunta di ulteriori funzioni (senza hacking del modulo operatore). Si potrebbe anche cadere qualche variabili temporanee che vengono utilizzate solo una volta in ogni caso:

rhs, lhs = stack.pop(), stack.pop() 
stack.push(operators[val](lhs, rhs)).

anche (meno di una performance e più di un problema di stile, anche soggettiva), mi sarebbe stata riordinata non faccio la gestione degli errori in tutto nel ciclo e avvolgerlo in un blocco try con un blocco except KeyError ("Operando sconosciuto"), un blocco (stack vuoto), ...

Ma preciso? Fornisce risultati errati?

fonte

2010-10-05 17:27:17 delnan

Secondato sulla gestione degli errori. Le eccezioni Python non sono eccezioni C++. – nmichaels

Grazie per i suggerimenti. Tutti i doctest stanno passando, ma potrebbero non essere completi. Forse c'è ancora un bug? – simeonwillbanks

'stack.push (operatori [val] (stack.pop(), stack.pop()))' è bacato perché l'operatore func si aspetta il primo operando come secondo argomento. Originariamente, ho codificato questa riga: 'method (stack.pop(), stack.pop())', ma i doctest stavano fallendo. – simeonwillbanks

Questo interprete di notazione (notazione polacca inversa) di notazione Python può essere reso più efficiente e preciso?

risposta

Problemi correlati