Sto usando listadmin per gestire molte mailing list basate su mailman. Ho una lunga lista di argomenti e da indirizzi impostati per bloccare lo spam. Recentemente, ho ricevuto più intelligente di spam, nel senso che utilizza simpatici personaggi dall'aspetto Unicode, ad esempio:Perl: Come abbinare FULLWIDTH LATIN SMALL
Oggetto: Al l l'annuncio ULT mov i si' hai vedere nulla nare c ompari- ng al nostro Exx xci ti ng compilation di 13'000 movimenti in HD t hat sono disponibili per te adesso!
o
Oggetto: HD qua y acceso VI D EOS uno d pho per rappresentare graficamente s o f Ho ff hic tc
sono qui per u
Ora voglio usa una regex intelligente Perl per bloccarla. Piping questi soggetti a hexdump ha rivelato che molti personaggi sono un FULLWIDTH LATIN SMALL LETTER. Tuttavia, non funziona: Can't find Unicode property definition "FULLWIDTH LATIN SMALL LETTER"
Quindi la domanda è: c'è un \p{something}
corrispondente a quei caratteri a larghezza intera? In alternativa: c'è un altro modo per abbinare quei personaggi?
molte grazie @ikegami per la modifica illuminante e il modulo d'intrattenimento lascia collegato. – amon
È uno di Tchrist's. 'unichars' può essere usato per fare il contrario. per esempio. 'unichars -au '\ p {InHalfwidthAndFullwidthForms}'' elenca i caratteri nel blocco HalfwidthndFullwidthForms. – ikegami