2011-06-11 16 views
6

Devo calcolare lo h-index da un elenco di pubblicazioni memorizzate in un albero.Calcolo dell'indice h

quello che ho fatto sta attraversando l'albero in modo decrescent ottenere un elenco di posizione di numero di citazioni

Assomiglia:

line 1 10 
line 2 5 
line 3 4 
line 4 0 

dovrei smettere alla linea 3 e restituire 3. Il problema è con gli esempi forniti in questo caso

line 1 4 
line 2 0 
line 3 0 

si arresta a causa 2 4> 1 ma 0> 3 è falso. Dovrebbe restituire 1 invece. Puoi spiegarmi perché? So che è più una domanda di matematico, ma dopo avrò bisogno di ri-implementarlo se qualcosa è profondamente sbagliato.

Ecco il codice

int index_h_calc(rbtree_node n, int *i){ 
    if (n == NULL) { 
     fputs("<empty tree>\n", stdout); 
     return 0; 
    } 
    if (n->right != NULL) 
     index_h_calc(n->right,i); 


    graduat *grad; 
    grad=n->value; 

    if(DEBUG) 
     printf("linea %d %d %s\n ",*i,(int)grad->tot,grad->name); 

    if(*i+1>=(int)grad->tot) { 
     return *i; 
    } else 
     *i+=1; 

    if (n->left != NULL) 
     index_h_calc(n->left,i); 

    return *i; 
    } 

risposta

0

Questo ha diverse soluzioni sul github, ad esempio in Ruby, pari al n è citePages e di essere il h-index calcolato

function h_index(){ 
     var hArray = new Array(); 
     var x = 0; 
     for(var i = 0; i < citePages.length; i++){ 
      var citeArray = citePages[i];   
      for(var j = 0; j < citeArray.length; j++){ 
       // The multiplication by one is a hack to convert the string type into a numerical type 
       hArray[x++] = citeArray[j]*1; 
      } 
     } 
     hArray.sort(sortNumber); 
     //alert(hArray); 
     for(var i = 0; i < hArray.length; i++){ 
      if(i > hArray[i]){ 
       return hArray[i-1]; 
      } 
     } 
    } 

precedente funzione -

function getCitationCount(responseText){ 
    if (responseText == null){ 
    _gel("sContent").innerHTML = "<i>Invalid data.</i>"; 
      alert("There is no data."); 
     return; 
     } 

var cite_exists = 1; 
var cite_str_len = 14; 
var len_of_Cite_by_str = 9; 
var citeArray = new Array(); 
for(var i = 0; cite_exists > 0; i++) 
    { 
    cite_exists = responseText.search('Cited by'); 
    if(cite_exists == -1){ 
     //alert("No more citations for given Author!"); 
     //return; 
    }else{ 
     var tmp_string = responseText.substr(cite_exists, cite_str_len); 
     var end = (tmp_string.indexOf("<")-len_of_Cite_by_str); 
     citeArray[i] = tmp_string.substr(len_of_Cite_by_str, end); 
     publications++; 
     responseText = responseText.substr(cite_exists+cite_str_len, responseText.length); 
    } 
} 
return citeArray; 
} 

Se questo non fornisce un soluzione quindi il problema è verificabile - quindi abbiamo davvero bisogno di dati di esempio, ad esempio un jsfiddle di dati tipici che indicano quale risultato è previsto in ciascun caso, dato che si tratta di un r oltre alla domanda di codifica e può essere testato solo con una struttura di dati complessa popolata.

0

Forse mi manca un po 'di sottigliezza, ma non è la risposta solo per sottrarre uno dal numero di riga? Cioè, se i è il numero di riga e n è il numero di citazioni, si attraversa l'albero finché non si trova una riga con n < i e quindi si restituisce l'h-index come i - 1.

+0

... non dovrebbe essere ", quindi restituire l'h-index come * n * - 1"? Altrimenti mi sembra giusto ... – Dmitri

+0

@Dmitri: no, deve essere 'i - 1'. Considera il primo esempio dell'OT: ci fermiamo alla riga 4 (perché '0 <4') e restituiamo un h-index di' 4 - 1 = 3'. Nel secondo esempio, ci fermiamo alla riga 2 e restituiamo '1'. – deprecated

+0

Oops .. Quando ho scritto che avevo 'n' e' i' indietro nella mia mente per qualche motivo. – Dmitri