Ho una domanda sull'estrazione di una parte di una stringa. Per esempio io ho una stringa come questa:R estratto parte della stringa
a <- "DP=26;AN=2;DB=1;AC=1;MQ=56;MZ=0;ST=5:10,7:2;CQ=SYNONYMOUS_CODING;GN=NOC2L;PA=1^1:0.720&2^1:0"
ho bisogno di estrarre tutto tra GN=
e ;
.Quindi qui sarà NOC2L
.
È possibile?
Nota: Questo è INFO
modulo colonna VCF file format. GN è Gene Name, quindi vogliamo estrarre il nome del gene dalla colonna INFO
.
La domanda è un po 'poco chiara, in quanto sembra che la stringa desiderata non sarà sempre seguita da un punto e virgola. – jbaums