Convertire la pagina HTML contenente caratteri arabi in PDF utilizzando FlyingSaucer

Voglio convertire una pagina HTML che contiene caratteri arabi in un file PDF utilizzando FlyingSaucer, ma il PDF generato non contiene caratteri combinati e stampa l'output all'indietro.Convertire la pagina HTML contenente caratteri arabi in PDF utilizzando FlyingSaucer

HTML:

<?xml version="1.0" encoding="UTF-8"?> 
 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> 
 
<html xmlns="http://www.w3.org/1999/xhtml"> 
 
    <head> 
 
     <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> 
 
    </head> 
 

 
    <body style="font-size:15px;font-family: Arial Unicode MS;"> 
 

 
     <center style="font-size: 18px; font-family: Arial Unicode MS;"> 
 
      <b> 
 
       <i style="font-family: Arial Unicode MS;"> 
 
        &#x062C;&#x0645;&#x064A;&#x0639; &#x0627;&#x0644;&#x062D;&#x0642;&#x0648;&#x0642;<br /> 
 
       </i> 
 
      </b> 
 
     </center> 
 
    </body> 
 
</html>

Java Estratto:

String inputFile = "c:\\html.html"; 
     String url = new File(inputFile).toURI().toURL().toString(); 
     String outputFile = "c:\\html.pdf"; 
     OutputStream os = new FileOutputStream(outputFile); 

     ITextRenderer renderer = new ITextRenderer(); 
     renderer.getFontResolver().addFont("c://ARIALUNI.TTF", BaseFont.IDENTITY_H,BaseFont.EMBEDDED); 

     renderer.setDocument(url); 
     renderer.layout(); 
     renderer.createPDF(os); 
     os.close();

Actual PDF Risultato: actual result

atteso PDF Risultato: expected result

Che cosa posso fare per ottenere il risultato giusto?

fonte

2014-11-02 Samy Louize Hanna

In realtà si sta tentando di convertire un'immagine di tela in pdf ??? – CoderNeji

Questo mi sembra un insetto di un disco volante. I caratteri unicode arabi si trovano in un intervallo ben definito e sono (ovviamente) noti come RTL (da destra a sinistra). Chiaramente il browser sta visualizzando RTL, ma non lo è il disco volante. Segnala l'errore a google. –

Hai una soluzione per il formato arabo? – Hana90

Mentre stavo lavorando con caratteri arabi, ho affrontato un problema di allineamento simile. L'arabo è una lingua RTL. Sono necessari contenitori specifici per generare PDF in un linguaggio RTL. Attualmente quando si tenta di generare PDF, la modalità è normale LTR a causa della quale si ottiene l'output corrente.

fonte

2015-08-14 06:21:03 NANCY

Come aggiustalo?? – Hana90

Sì, si riferisce a RTL ma se non si ha scelta relativa ai caratteri, è possibile utilizzare i caratteri Arial che hanno tutti i caratteri richiesti dall'utente. segui questo link https://stackoverflow.com/a/47801584/3335776 per vedere il codice.

Alcuni come problema è con disco volante font predefiniti

you can find Complete article Here

fonte

2017-12-13 20:30:34 LNT

Convertire la pagina HTML contenente caratteri arabi in PDF utilizzando FlyingSaucer

risposta

Problemi correlati