2009-06-28 18 views
7

Ho un documento piuttosto grande in formato html generato da Microsoft Word. È così disordinato e pieno di cose gonfie (come tag non conosciuti, spazio dei nomi sconosciuto ecc. E altre cose gonfie)come pulire microsoft html doc?

c'è un modo per convertirlo in semplice sintassi html?

risposta

6

Prova HTML Tidy. Ho sentito che funziona abbastanza bene su HTML generato da MS Word (sicuramente almeno fino a Word 2000, ma probabilmente anche su versioni più recenti).

2

Questa non è una domanda di programmazione, ma (almeno versioni recenti di) Word può essere salvata in "Pagina Web, filtrata", che rimuove i tag e le proprietà specifiche di Office e lascia solo i tag necessari per il documento essere reso in un browser web. Quindi, se hai Word, puoi provare a usarlo per aprire il documento HTML e salvarlo in quel formato.

2

Probabilmente stai cercando HTML Tidy, che ha adattatori praticamente in tutte le lingue. Ha opzioni per ripulire l'output HTML di Microsoft Word (e molte altre funzionalità).