E 'possibile ottenere la data di pubblicazione dei pacchetti CRAN dall'interno di R? Vorrei avere una lista dei k pacchetti CRAN più recentemente pubblicati, o in alternativa tutti i pacchetti pubblicati dopo la data gg-mm-aa. Simile alle informazioni sullo available_packages_by_date.html?available.packages per data di pubblicazione
Il comando available.packages() ha un argomento "fields", ma estrae solo i campi dalla DESCRIZIONE. Il campo data sulla descrizione del pacchetto non è sempre aggiornato.
Posso ottenerlo con una regex intelligente da html page, ma non sono sicuro di quanto sia affidabile e aggiornato questo file html ... A un certo punto Kurt potrebbe decidere di dare al layout un restyling che spezzerebbe la sceneggiatura Un'alternativa è usare timestamp da CRAN FTP ma non sono sicuro di quanto sia buona questa soluzione. Non sono sicuro se ci sia da qualche parte un file formalmente strutturato con date di pubblicazione? Presumo che la pagina HTML sia generata automaticamente da qualche DB.
si può leggere il contenuto della tabella '' html' utilizzando XML :: readHTMLTable'. è questo quello che stavi cercando? – Ramnath
[CRANberries] (http://dirk.eddelbuettel.com/cranberries/index.html) produce un database SQLite con i metadati del pacchetto, incluso quando aggiunto a CRAN, ecc. Sarebbe banale esportarlo e/o CRAN potrebbe semplicemente fare disponibile. Ci sono * alcuni file RData "nascosti" su CRAN, le informazioni potrebbero benissimo esistere ... –