Ecco due soluzioni per l'esercizio 4.9 in Scala per impaziente di Cay Horstmann: "Scrivi una funzione lteqgt (valori: Array [Int], v: Int) che restituisce una tripla contenente i conteggi di valori inferiori a v, uguale a v e maggiore di v. " Uno usa la ricorsione di coda, l'altro usa un ciclo di tempo. Ho pensato che entrambi sarebbero stati compilati con un bytecode simile, ma il ciclo while è più lento della ricorsione della coda di un fattore di quasi 2. Questo mi suggerisce che il mio metodo while è scritto male.Perché la mia Scala ricorsione della coda è più veloce del ciclo while?
import scala.annotation.tailrec
import scala.util.Random
object PerformanceTest {
def main(args: Array[String]): Unit = {
val bigArray:Array[Int] = fillArray(new Array[Int](100000000))
println(time(lteqgt(bigArray, 25)))
println(time(lteqgt2(bigArray, 25)))
}
def time[T](block : => T):T = {
val start = System.nanoTime : Double
val result = block
val end = System.nanoTime : Double
println("Time = " + (end - start)/1000000.0 + " millis")
result
}
@tailrec def fillArray(a:Array[Int], pos:Int=0):Array[Int] = {
if (pos == a.length)
a
else {
a(pos) = Random.nextInt(50)
fillArray(a, pos+1)
}
}
@tailrec def lteqgt(values: Array[Int], v:Int, lt:Int=0, eq:Int=0, gt:Int=0, pos:Int=0):(Int, Int, Int) = {
if (pos == values.length)
(lt, eq, gt)
else
lteqgt(values, v, lt + (if (values(pos) < v) 1 else 0), eq + (if (values(pos) == v) 1 else 0), gt + (if (values(pos) > v) 1 else 0), pos+1)
}
def lteqgt2(values:Array[Int], v:Int):(Int, Int, Int) = {
var lt = 0
var eq = 0
var gt = 0
var pos = 0
val limit = values.length
while (pos < limit) {
if (values(pos) > v)
gt += 1
else if (values(pos) < v)
lt += 1
else
eq += 1
pos += 1
}
(lt, eq, gt)
}
}
Regolare la dimensione di bigArray in base alle dimensioni dell'heap. Ecco alcuni esempi di output:
Time = 245.110899 millis
(50004367,2003090,47992543)
Time = 465.836894 millis
(50004367,2003090,47992543)
Perché il metodo while è molto più lento del tailrec? Ingenuamente la versione di tailrec sembra essere leggermente svantaggiata, poiché deve sempre eseguire 3 "se" per ogni iterazione, mentre la versione while spesso esegue solo 1 o 2 test a causa del costrutto else. (NB invertendo l'ordine che eseguo i due metodi non influisce sul risultato).
Me ne sono spesso chiesto. La risposta sta sicuramente nel JIT. Sarebbe interessante ripetere il benchmark disabilitando completamente JIT. –
Vedere i risultati in https://stackoverflow.com/a/48143130/1172685 dove un ciclo while è molto più veloce della ricorsione su coda (scala 2.12.x con benchmark scalametrici che tentano di gestire le incoerenze JVM). –