Sto scrivendo un'applicazione spark e vorrei utilizzare algoritmi in MLlib. Nel documento API ho trovato due classi diverse per lo stesso algoritmo.Differenza tra org.apache.spark.ml.classification e org.apache.spark.mllib.classification
Ad esempio, esiste una LogisticRegression in org.apache.spark.ml.classification anche una LogisticRegressionwithSGD in org.apache.spark.mllib.classification.
L'unica differenza che posso trovare è che quello in org.apache.spark.ml è ereditato da Estimator e poteva essere utilizzato nella convalida incrociata. Ero abbastanza confuso dal fatto che fossero messi in pacchetti diversi. Qualcuno ne sa il motivo? Grazie!
Ciao Yijie, grazie mille! Come ho capito, se voglio eseguire la convalida incrociata sugli algoritmi che si trovano in o.a.s.mllib, posso solo impostare i parametri manualmente ed eseguire diverse volte invece di usare il metodo Cross-validator. Hai un modo migliore per farlo? – ailzhang
@ailzhang, potresti postare questa come un'altra domanda e vedere se qualcun altro può aiutarti :) So poco di Mllib –
ok ~ grazie per il tuo aiuto! – ailzhang