2015-07-20 12 views
6

Come creare SparseVector e denso vettore RappresentazioniSparse Vector vs Dense Vector

se il DenseVector è:

denseV = np.array([0., 3., 0., 4.]) 

Quale sarà la rappresentazione Sparse Vector?

+1

Per coloro che leggono il titolo di "Sparse vettore vs Dense vettore" e sono stati alla ricerca di una spiegazione di quando usare quale, [questa risposta] (http: // StackOverflow. it/a/26706528/877069) ha le informazioni che stai cercando. –

risposta

11

A meno che non ho accuratamente capito male il tuo dubbio, il MLlib data type documentation illustra questo chiaramente:

import org.apache.spark.mllib.linalg.Vector; 
import org.apache.spark.mllib.linalg.Vectors; 

// Create a dense vector (1.0, 0.0, 3.0). 
Vector dv = Vectors.dense(1.0, 0.0, 3.0); 
// Create a sparse vector (1.0, 0.0, 3.0) by specifying its indices and values corresponding to nonzero entries. 
Vector sv = Vectors.sparse(3, new int[] {0, 2}, new double[] {1.0, 3.0}); 

Dove il secondo argomento di Vectors.sparse è un array di indici, e il terzo argomento è la matrice dei valori reali in quegli indici.

+0

Oh, non stavo passando il giusto numero di indici. SparseV = SparseVector (4, [0, 1, 2, 3], [0., 3., 0., 4.]) –

+1

qual è il significato di un punto dopo il numero vale a dire 1.? –

+1

Il punto indica solo un tipo a virgola mobile. '1.' è equivalente a' 1.0' –

5

I vettori rari sono quando si hanno molti valori nel vettore come zero. Mentre un vettore denso è quando la maggior parte dei valori nel vettore non sono zero.

Se è necessario creare un vettore sparse dal vettore denso specificato, utilizzare la seguente sintassi:

Vector sparseVector = Vectors.sparse(4, new int[] {1, 3}, new double[] {3.0, 4.0}); 

Il link qui sotto è molto utile per ottenere una buona comprensione del concetto generale.

http://techchai.com/2017/03/13/sparse-vectors-in-apache-spark/

Grazie