2009-04-17 21 views

risposta

36

Questo modulo vi aiuterà a fare ciò che si descrive:

http://www.freewisdom.org/projects/python-markdown/Using_as_a_Module

Una volta convertito il mark-down in HTML, è possibile utilizzare un parser HTML per togliere il testo in chiaro.

Il codice potrebbe essere simile a questo:

from BeautifulSoup import BeautifulSoup 
from markdown import markdown 

html = markdown(some_html_string) 
text = ''.join(BeautifulSoup(html).findAll(text=True)) 
+1

sembra convertire in html .. Ho bisogno di convertire in testo semplice .. come StackOverflow, nel sommario della domanda homepage, rimuove la formattazione – Krish

+0

Ho aggiornato la mia risposta per ottenere testo semplice –

+0

Grazie coonj .. Buono a sapersi a proposito di BeatifulSoup – Krish

2

Commentate e rimosso perché ho finalmente sembra di vedere il punto debole qui: Può essere più facile per convertire il testo Markdown in HTML e rimuovere HTML dal testo . Non sono a conoscenza di nulla per rimuovere efficacemente il markdown dal testo, ma ci sono molte soluzioni HTML per le soluzioni di testo semplice.

Problemi correlati