2011-08-24 10 views
15

Desidero utilizzare Lucene per calcolare Precisione e Richiamo.Richiamo di precisione in lucene java

ho fatto questi passaggi:

  1. fatto alcuni file di indice. Per fare questo ho usato il codice dell'indicizzatore e ho indicizzato i file .txt che esistono in questo percorso C:/inn (ci sono 4 file di testo in questa cartella) e li prendiamo nella cartella "outt" impostando il percorso dell'indice su C:/outt nel codice dell'indicizzatore.

  2. Creato un pacchetto chiamato lia.benchmark e una classe al suo interno che si chiama "PrecisionRecall" e aggiungere externaljars (rightclick -> generazione Java percorso -> aggiungere vasi esterni) e ha aggiunto Lucene-benchmark-.3.2.0jar e Lucene-core-3.3.0jar

  3. Set il percorso topicsfile nel codice a C:/lia2e/src/lia/benchmark/topics.txt e
    qrelsfile a C:/lia2e/src/lia/benchmark/qrels.txt e dir a "C:/outt".

    Ecco il codice:

    package lia.benchmark;   
    import java.io.File; 
    import java.io.PrintWriter; 
    import java.io.BufferedReader; 
    import java.io.FileReader; 
    import org.apache.lucene.search.*; 
    import org.apache.lucene.store.*; 
    import org.apache.lucene.benchmark.quality.*; 
    import org.apache.lucene.benchmark.quality.utils.*; 
    import org.apache.lucene.benchmark.quality.trec.*; 
    
    public class PrecisionRecall { 
    
        public static void main(String[] args) throws Throwable { 
    
        File topicsFile = new File("C:/lia2e/src/lia/benchmark/topics.txt"); 
         File qrelsFile = new File("C:/lia2e/src/lia/benchmark/qrels.txt"); 
         Directory dir = FSDirectory.open(new File("C:/outt")); 
         IndexSearcher searcher = new IndexSearcher(dir, true); 
    
         String docNameField = "filename"; 
    
         PrintWriter logger = new PrintWriter(System.out, true); 
    
         TrecTopicsReader qReader = new TrecTopicsReader(); 
         QualityQuery qqs[] = qReader.readQueries(      
           new BufferedReader(new FileReader(topicsFile))); 
    
         Judge judge = new TrecJudge(new BufferedReader(   
           new FileReader(qrelsFile)));           
    
         judge.validateData(qqs, logger);           
    
         QualityQueryParser qqParser = new SimpleQQParser("title", "contents"); 
    
         QualityBenchmark qrun = new QualityBenchmark(qqs, qqParser, searcher, docNameField); 
        SubmissionReport submitLog = null; 
         QualityStats stats[] = qrun.execute(judge,     
            submitLog, logger); 
    
         QualityStats avg = QualityStats.average(stats);   
         avg.log("SUMMARY",2,logger, " "); 
        dir.close(); 
        } 
    } 
    
  4. qrels inizializzato e argomenti. Nella cartella documenti (C: \ inn) ho 4 file txt di cui 2 sono pertinenti alla mia query (la query è apple), quindi ho riempito qrels e argomenti. il file

    le qrels come questo:

    <top> 
        <num> Number: 0 
        <title> apple 
        <desc> Description: 
        <narr> Narrative: 
    </top> 
    

    e argomenti file in questo modo:

    0 0  789.txt   1 
    0 0  101.txt   1 
    

    Ho provato anche il formato del percorso vale a dire, ad esempio "C: \ inn \ 789.txt" invece di "789.txt" ma i risultati sono zero:

    0 - contents:apple 
    0 Stats: 
    Search Seconds: 0.016 
    DocName Seconds: 0.000 
    Num Points: 2.000 
    Num Good Points: 0.000 
    Max Good Points: 2.000 
    Average Precision: 0.000 
    MRR: 0.000 
    Recall: 0.000 
    Precision At 1: 0.000 
    SUMMARY 
    Search Seconds: 0.016 
    DocName Seconds: 0.000 
    Num Points: 2.000 
    Num Good Points: 0.000 
    Max Good Points: 2.000 
    Average Precision: 0.000 
    MRR: 0.000 
    Recall: 0.000 
    Precision At 1: 0.000 
    

Puoi dirmi cosa c'è di sbagliato in me?

Ho davvero bisogno di sapere perché i risultati sono zero.

+1

Come tecnica di debug generale, se non si ottiene l'output che ci si aspetta, lavorare all'indietro e interrogare i valori precedenti e precedenti nel proprio programma fino a trovare i valori che * si * si aspettano. In questo modo puoi capire esattamente dove le cose stanno andando male. – Gian

+0

Non so Lucene, ma non è necessario chiudere i tag <desc> e <narr> nel file qrels? – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/460761/">pablosaraiva</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="answer-title"> <span class="text-logo margin-top-sm">A</span> <h2 class="title h4">risposta</h2> </div> <div class="item-description text-md markdown-body margin-bottom-40 voidso"> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">3<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Ho paura che il formato <code class="prettyprint-override">qrels.txt</code> è sbagliato: <a href="http://lucene.apache.org/java/2_3_0/api/org/apache/lucene/benchmark/quality/trec/TrecJudge.html" rel="nofollow">the javadoc</a> suggerisce le seguenti:</p> <p>formato di input atteso:</p> <pre><code class="prettyprint-override">qnum 0 doc-name is-relevant </code></pre> <p>Due linee di campionamento:</p> <pre><code class="prettyprint-override">19 0 doc303 1 19 0 doc7295 0 </code></pre> <p>(So che è 2.3.0 javadoc, ma il formato non è stato modificato in 3.0)</p> <p>Quindi sembra che tu abbia scambiato i file: <code class="prettyprint-override">TrecTopicsReader</code> si aspetta ciò che hai in <code class="prettyprint-override">qrels.txt</code>; <code class="prettyprint-override">TrecJudge</code> si aspetta quello che hai in <code class="prettyprint-override">topics.txt</code>.</p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/7656413">fonte</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2011-10-05 03:31:13</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/562388/">alf</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4319274062" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">Problemi correlati</div> <ul class="relative_list"> <li> 1. <a href="http://it.voidcc.com/question/p-cokpeyjf-k.html" target="_blank" title="Come calcolare precisione e richiamo in clustering?"> Come calcolare precisione e richiamo in clustering? </a> </li> <li> 2. <a href="http://it.voidcc.com/question/p-tbcisbml-x.html" target="_blank" title="Precisione/richiamo per la classificazione multiclasse multilivello"> Precisione/richiamo per la classificazione multiclasse multilivello </a> </li> <li> 3. <a href="http://it.voidcc.com/question/p-asvgpbwr-bx.html" target="_blank" title="Buona curva ROC ma scarsa curva di precisione di richiamo"> Buona curva ROC ma scarsa curva di precisione di richiamo </a> </li> <li> 4. <a href="http://it.voidcc.com/question/p-ejimqkzl-bs.html" target="_blank" title="Java Lucene NGramTokenizer"> Java Lucene NGramTokenizer </a> </li> <li> 5. <a href="http://it.voidcc.com/question/p-tadypgcy-ce.html" target="_blank" title="Precisione incrociata, richiamo e f1 insieme a sklearn"> Precisione incrociata, richiamo e f1 insieme a sklearn </a> </li> <li> 6. <a href="http://it.voidcc.com/question/p-zdwzpeaw-d.html" target="_blank" title="Precisione del timer in java"> Precisione del timer in java </a> </li> <li> 7. <a href="http://it.voidcc.com/question/p-dyxzmile-u.html" target="_blank" title="Richiamo astratto nel metodo reflection di java"> Richiamo astratto nel metodo reflection di java </a> </li> <li> 8. <a href="http://it.voidcc.com/question/p-hyjkdzmp-bc.html" target="_blank" title="Java BigDecimal problemi di precisione"> Java BigDecimal problemi di precisione </a> </li> <li> 9. <a href="http://it.voidcc.com/question/p-mtwvyeos-m.html" target="_blank" title="API di richiamo JNI - NoClassDefFoundError (C/Java)"> API di richiamo JNI - NoClassDefFoundError (C/Java) </a> </li> <li> 10. <a href="http://it.voidcc.com/question/p-susnpktv-y.html" target="_blank" title="Precisione esecutore pianificato Java"> Precisione esecutore pianificato Java </a> </li> <li> 11. <a href="http://it.voidcc.com/question/p-dnxhbkeu-k.html" target="_blank" title="comparazione delle prestazioni tra Zend Lucene e Java Lucene"> comparazione delle prestazioni tra Zend Lucene e Java Lucene </a> </li> <li> 12. <a href="http://it.voidcc.com/question/p-emkglbvy-bn.html" target="_blank" title="Utilizzo di CLucene vs java lucene"> Utilizzo di CLucene vs java lucene </a> </li> <li> 13. <a href="http://it.voidcc.com/question/p-zxfxcxto-k.html" target="_blank" title="CLucene è più veloce di java lucene?"> CLucene è più veloce di java lucene? </a> </li> <li> 14. <a href="http://it.voidcc.com/question/p-asdjykwy-be.html" target="_blank" title="Facile modo di contare precisione, richiamo e punteggio F1 in R"> Facile modo di contare precisione, richiamo e punteggio F1 in R </a> </li> <li> 15. <a href="http://it.voidcc.com/question/p-mmrvhqin-w.html" target="_blank" title="Valore doppio con precisione specifica in java"> Valore doppio con precisione specifica in java </a> </li> <li> 16. <a href="http://it.voidcc.com/question/p-paultoju-ca.html" target="_blank" title="Java calcolo doppia perdere in precisione"> Java calcolo doppia perdere in precisione </a> </li> <li> 17. <a href="http://it.voidcc.com/question/p-pvwrkxwx-o.html" target="_blank" title="Ricerca su intervalli di date con Lucene in Java?"> Ricerca su intervalli di date con Lucene in Java? </a> </li> <li> 18. <a href="http://it.voidcc.com/question/p-mvqnuztm-bs.html" target="_blank" title="Calcolo della precisione, richiamo e F-score in un passaggio - python"> Calcolo della precisione, richiamo e F-score in un passaggio - python </a> </li> <li> 19. <a href="http://it.voidcc.com/question/p-nxzihcyb-br.html" target="_blank" title="Come calcolare la precisione, richiamo e F-score con libSVM in python"> Come calcolare la precisione, richiamo e F-score con libSVM in python </a> </li> <li> 20. <a href="http://it.voidcc.com/question/p-twvpygkw-ba.html" target="_blank" title="Indice di unione in Lucene"> Indice di unione in Lucene </a> </li> <li> 21. <a href="http://it.voidcc.com/question/p-xjtwdlwu-bq.html" target="_blank" title="possibile perdita di errore di precisione in java"> possibile perdita di errore di precisione in java </a> </li> <li> 22. <a href="http://it.voidcc.com/question/p-dewyxndr-bw.html" target="_blank" title="Java: massima perdita di precisione in una doppia aggiunta/sottrazione"> Java: massima perdita di precisione in una doppia aggiunta/sottrazione </a> </li> <li> 23. <a href="http://it.voidcc.com/question/p-mbxggtlq-ba.html" target="_blank" title="di precisione in Erlang"> di precisione in Erlang </a> </li> <li> 24. <a href="http://it.voidcc.com/question/p-tdtyzmih-bn.html" target="_blank" title="Java Generics - richiamo di metodi specifici da quelli generici"> Java Generics - richiamo di metodi specifici da quelli generici </a> </li> <li> 25. <a href="http://it.voidcc.com/question/p-zmuelksf-v.html" target="_blank" title="Java doppia precisione costante moltiplicazione/divisione"> Java doppia precisione costante moltiplicazione/divisione </a> </li> <li> 26. <a href="http://it.voidcc.com/question/p-veqefxou-d.html" target="_blank" title="Ricerca multipla in Lucene"> Ricerca multipla in Lucene </a> </li> <li> 27. <a href="http://it.voidcc.com/question/p-udklhaxj-b.html" target="_blank" title="non interrogare in lucene"> non interrogare in lucene </a> </li> <li> 28. <a href="http://it.voidcc.com/question/p-nimanysi-h.html" target="_blank" title="Metodo di richiamo di MethodInfo"> Metodo di richiamo di MethodInfo </a> </li> <li> 29. <a href="http://it.voidcc.com/question/p-oabegvdg-m.html" target="_blank" title="Alternative rubino per Lucene"> Alternative rubino per Lucene </a> </li> <li> 30. <a href="http://it.voidcc.com/question/p-saekckce-w.html" target="_blank" title="Precisione di parentesi graffe"> Precisione di parentesi graffe </a> </li> </ul> </div> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3534119089"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img2.voidcc.com/voidso/script/side.js?t=1652515422436"></script> <script type="text/javascript" src="http://img2.voidcc.com/voidso/plugin/highlight/highlight.pack.js"></script> <link href="http://img2.voidcc.com/voidso/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <!-- VOIDCC问答侧边栏广告 --> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3862022848" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> Ultima domanda </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://it.voidcc.com/question/p-ggejpxie-bp.html" target="_blank" title="Applicare un filtro su FirebaseRecyclerAdapter"> Applicare un filtro su FirebaseRecyclerAdapter </a> </li> <li class="side_article_list_item"> 2. <a href="http://it.voidcc.com/question/p-tgiyxwcl-bg.html" target="_blank" title="Mostra i servizi Web espongono elenchi annidati o piatti?"> Mostra i servizi Web espongono elenchi annidati o piatti? </a> </li> <li class="side_article_list_item"> 3. <a href="http://it.voidcc.com/question/p-vmxnffep-bd.html" target="_blank" title="Operatore di confronto 'inverso' in Python"> Operatore di confronto 'inverso' in Python </a> </li> <li class="side_article_list_item"> 4. <a href="http://it.voidcc.com/question/p-pvefohku-y.html" target="_blank" title="Bootstrap 3.3.6 e JQuery 3.1.0 non compatibili?"> Bootstrap 3.3.6 e JQuery 3.1.0 non compatibili? </a> </li> <li class="side_article_list_item"> 5. <a href="http://it.voidcc.com/question/p-evxkpzpk-bt.html" target="_blank" title="Come creare un metodo di estensione in TypeScript per il tipo di dati "Data""> Come creare un metodo di estensione in TypeScript per il tipo di dati "Data" </a> </li> <li class="side_article_list_item"> 6. <a href="http://it.voidcc.com/question/p-akxmfrbn-bd.html" target="_blank" title="aggiornamento profilo utente utilizzando django rest framework api"> aggiornamento profilo utente utilizzando django rest framework api </a> </li> <li class="side_article_list_item"> 7. <a href="http://it.voidcc.com/question/p-evtmgrwk-t.html" target="_blank" title="Come utilizzare Gravity Forms gform_validation per garantire che almeno uno dei messaggi di posta elettronica o telefono sia inserito"> Come utilizzare Gravity Forms gform_validation per garantire che almeno uno dei messaggi di posta elettronica o telefono sia inserito </a> </li> <li class="side_article_list_item"> 8. <a href="http://it.voidcc.com/question/p-vlzzoshf-by.html" target="_blank" title="Come usare fgets() per evitare di trasmettere il suo secondo argomento che è di tipo int?"> Come usare fgets() per evitare di trasmettere il suo secondo argomento che è di tipo int? </a> </li> <li class="side_article_list_item"> 9. <a href="http://it.voidcc.com/question/p-umevuagj-bs.html" target="_blank" title="Non digita il parametro nessun ruolo?"> Non digita il parametro nessun ruolo? </a> </li> <li class="side_article_list_item"> 10. <a href="http://it.voidcc.com/question/p-edcmgrce-bn.html" target="_blank" title="Come verificare che venga generata un'eccezione prevista utilizzando google-verità?"> Come verificare che venga generata un'eccezione prevista utilizzando google-verità? </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> Problemi correlati</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://it.voidcc.com/question/p-cokpeyjf-k.html" target="_blank" title="Come calcolare precisione e richiamo in clustering?"> Come calcolare precisione e richiamo in clustering? </a> </li> <li class="side_article_list_item"> 2. <a href="http://it.voidcc.com/question/p-tbcisbml-x.html" target="_blank" title="Precisione/richiamo per la classificazione multiclasse multilivello"> Precisione/richiamo per la classificazione multiclasse multilivello </a> </li> <li class="side_article_list_item"> 3. <a href="http://it.voidcc.com/question/p-asvgpbwr-bx.html" target="_blank" title="Buona curva ROC ma scarsa curva di precisione di richiamo"> Buona curva ROC ma scarsa curva di precisione di richiamo </a> </li> <li class="side_article_list_item"> 4. <a href="http://it.voidcc.com/question/p-ejimqkzl-bs.html" target="_blank" title="Java Lucene NGramTokenizer"> Java Lucene NGramTokenizer </a> </li> <li class="side_article_list_item"> 5. <a href="http://it.voidcc.com/question/p-tadypgcy-ce.html" target="_blank" title="Precisione incrociata, richiamo e f1 insieme a sklearn"> Precisione incrociata, richiamo e f1 insieme a sklearn </a> </li> <li class="side_article_list_item"> 6. <a href="http://it.voidcc.com/question/p-zdwzpeaw-d.html" target="_blank" title="Precisione del timer in java"> Precisione del timer in java </a> </li> <li class="side_article_list_item"> 7. <a href="http://it.voidcc.com/question/p-dyxzmile-u.html" target="_blank" title="Richiamo astratto nel metodo reflection di java"> Richiamo astratto nel metodo reflection di java </a> </li> <li class="side_article_list_item"> 8. <a href="http://it.voidcc.com/question/p-hyjkdzmp-bc.html" target="_blank" title="Java BigDecimal problemi di precisione"> Java BigDecimal problemi di precisione </a> </li> <li class="side_article_list_item"> 9. <a href="http://it.voidcc.com/question/p-mtwvyeos-m.html" target="_blank" title="API di richiamo JNI - NoClassDefFoundError (C/Java)"> API di richiamo JNI - NoClassDefFoundError (C/Java) </a> </li> <li class="side_article_list_item"> 10. <a href="http://it.voidcc.com/question/p-susnpktv-y.html" target="_blank" title="Precisione esecutore pianificato Java"> Precisione esecutore pianificato Java </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://it.voidcc.com/contact">Contattaci</a></li> <li>© 2020 IT.VOIDCC.COM</li> <li><a rel="nofollow" href="https://beian.miit.gov.cn/" target="_blank">沪ICP备13005482号-13</a></li> <li><script type="text/javascript" src="https://s9.cnzz.com/z_stat.php?id=1280098168&web_id=1280098168"></script></li> <li><a href="http://cn.voidcc.com/" target="_blank" title="程序问答园区">简体中文</a></li> <li><a href="http://hk.voidcc.com/" target="_blank" title="程序問答園區">繁體中文</a></li> <li><a href="http://ru.voidcc.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.voidcc.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.voidcc.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.voidcc.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.voidcc.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.voidcc.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.voidcc.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.voidcc.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.voidcc.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.voidcc.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.voidcc.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script async src="https://www.googletagmanager.com/gtag/js?id=UA-77509369-5"></script> <script> window.dataLayer = window.dataLayer || []; function gtag() { dataLayer.push(arguments); } gtag('js', new Date()); gtag('config', 'UA-77509369-5'); </script> <script> var _hmt = _hmt || []; (function () { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?67d4731349f0b00136755b80364ce381"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>