bcg · April 25, 2011 22:23 · fj · May 2, 2011
diff --git a/indexr-tree.c b/indexr-tree.c
 #include <stdio.h>
 #include <glib.h>

 int
 compare_nodes(gconstpointer a, gconstpointer b) {
 	if (a < b)
 		return -1;
 	else if (a > b)
 		return 1;
 	return 0;
 }

 gint matches = 0;

 gboolean
 foreach_node(gpointer key, gpointer value, gpointer user_data) {
 	GTree *tree= user_data;

 	if (g_tree_lookup(tree, key)) {
 		matches++;
 	}
 	return FALSE;
 }

 int
 main(int argc, char * argv) {

 	GTimer *t = g_timer_new();
 	gulong ms;
 	GTree *one = g_tree_new(compare_nodes);
 	GTree *two = g_tree_new(compare_nodes);
 	gint i=0;

 	g_timer_start(t);
        for(i=0; i <= 999999; i++) {
 		g_tree_insert(one,  GINT_TO_POINTER(i),  GINT_TO_POINTER(i));
 	}
 	g_timer_stop(t);
 	printf("%d inserted. Took %.0f seconds.\n", g_tree_nnodes(one), g_timer_elapsed(t, &ms));
        for(i=0; i <= 999999; i++) {
 		g_tree_insert(two,  GINT_TO_POINTER(i),  GINT_TO_POINTER(i));
 	}

 	g_timer_start(t);
 	g_tree_foreach(one, (GTraverseFunc)foreach_node, two);
 	g_timer_stop(t);
 	printf("%d matches. Took %.0f seconds.\n", matches, g_timer_elapsed(t, &ms));
 }
diff --git a/indexr.c b/indexr.c
 #include <stdio.h>
 #include <glib.h>

 gint matches = 0;

 void
 foreach_node(gpointer key, gpointer value, gpointer user_data) {
 	GHashTable *ht = user_data;

 	if (g_hash_table_lookup(ht, key)) {
 		matches++;
 	}
 	return;
 }

 int
 main(int argc, char * argv) {

 	GTimer *t = g_timer_new();
 	gulong ms;
 	GHashTable *one = g_hash_table_new(NULL, NULL);
 	GHashTable *two = g_hash_table_new(NULL, NULL);
 	gint i=0;

 	g_timer_start(t);
        for(i=0; i <= 9999999; i++) {
 		g_hash_table_insert(one,  GINT_TO_POINTER(i),  GINT_TO_POINTER(i));
 	}
 	g_timer_stop(t);
 	printf("%d inserted. Took %.0f seconds.\n", g_hash_table_size(one), g_timer_elapsed(t, &ms));
        for(i=0; i <= 9999999; i++) {
 		g_hash_table_insert(two,  GINT_TO_POINTER(i),  GINT_TO_POINTER(i));
 	}

 	g_timer_start(t);
 	g_hash_table_foreach(one, (GHFunc)foreach_node, two);
 	g_timer_stop(t);
 	printf("%d matches. Took %.0f seconds.\n", matches, g_timer_elapsed(t, &ms));
 }
diff --git a/indexr.js b/indexr.js
 var set = require ('./set').set // See below

 var one = set(1),
    two = set(1);

 var t1 = new Date();

 for (i=0;i<=9999999;i=i+1) {
  one.add(i);
 }
 console.log(one.size() + ' inserted in ' + Math.floor((new Date() - t1) / 1000));

 for (i=0;i<=9999999;i=i+1) {
  two.add(i);
 }

 var matches = one.intersectionCount(two);

 console.log(matches + ' matched in ' + Math.floor((new Date() - t1) / 1000));
diff --git a/indexr.scala b/indexr.scala
 import scala.collection.mutable.Set

 object Indexr extends Application {

  var one = Set(1)
  var two = Set(1)

  var t = System.currentTimeMillis

  for (i <- 0.until(9999999)) {
    one += i
  }

  Console.println("Loaded set in " + ((System.currentTimeMillis-t)/ 1000.0))

  t = System.currentTimeMillis

  two = one.clone

  Console.println("Loaded set in " + ((System.currentTimeMillis-t)/ 1000.0))

  t = System.currentTimeMillis
  val intersects = one intersect two

  Console.println(intersects.size + " intersects in " + ((System.currentTimeMillis-t)/ 1000.0));
 }
diff --git a/RESULTS b/RESULTS
 # SCALA

 [info] Loaded set in 112.9
 [info] Loaded set in 7.873
 [info] 9999999 intersects in 9.156

 # Node.js

 10000000 inserted in 16
 10000000 matched in 8

 # C / Glib / Hash

 10000000 inserted. Took 1 seconds.
 9999999 matches. Took 1 seconds.

 # C / Glib / Tree

 10000000 inserted. Took 4 seconds.
 9999999 matches. Took 39 seconds.

 # SCALA + TROVE w/o foreach

 [info] Loaded set in 0.711
 [info] Loaded set in 0.727
 [info] 10000001 intersects in 0.403

diff --git a/scala-trove-wo-foreach.scala b/scala-trove-wo-foreach.scala
 import gnu.trove.set.TIntSet
 import gnu.trove.set.hash.TIntHashSet


 object Indexr extends Application {

  val n = 10000000
  val one = new TIntHashSet(n)
  val two = new TIntHashSet(n)
  var i = 0

  var t = System.currentTimeMillis

  i = 0
  while(i <= n) {
    one.add(i)
    i += 1
  }

  Console.println("Loaded set in " + ((System.currentTimeMillis-t)/ 1000.0))

  t = System.currentTimeMillis

  i = 0
  while(i <= n) {
    two.add(i)
    i += 1
  }

  Console.println("Loaded set in " + ((System.currentTimeMillis-t)/ 1000.0))

  t = System.currentTimeMillis

  two.retainAll(one)

  Console.println(two.size() + " intersects in " + ((System.currentTimeMillis-t)/ 1000.0));
 }
diff --git a/set.js b/set.js
 exports.set = function () {
  var members = {}
    , eachArgument = function (args, fn) { Array.prototype.slice.apply(args).forEach (fn) }
    , set = function (item) { return members.hasOwnProperty (item) }

  set.has = set
  
  set.union = function (other) {
    var union = exports.set.apply ({}, set.members)
    union.add.apply (set, other.members)
    return union }
  
  set.intersection = function (other) {
    var intersection = exports.set ()
    set.members.forEach (function (elt) {
      if (other (elt)) intersection.add (elt) })
    return intersection }

  set.intersectionCount = function (other) {
    var intersection = 0;
    set.members.forEach (function (elt) {
      if (other (elt)) intersection++; })
    return intersection }

  set.add = function () {
    eachArgument (arguments, function (arg) { members [arg] = true }) }

  set.add.apply (set, arguments)

  set.del = function (item) {
    eachArgument (arguments, function (arg) { delete members [arg] }) }

  set.__defineGetter__ ('members', function () {
    var m = []
    for (k in members) if (members.hasOwnProperty (k)) m.push (k)
    return m })
  
  delete set.size
  set.size = function () {return set.members.length}

  set.toString = function () { return "<Set:" + set.members.join (",") + ">" }

  return set
 }
	#include <stdio.h>
	#include <glib.h>

	int
	compare_nodes(gconstpointer a, gconstpointer b) {
	if (a < b)
	return -1;
	else if (a > b)
	return 1;
	return 0;
	}

	gint matches = 0;

	gboolean
	foreach_node(gpointer key, gpointer value, gpointer user_data) {
	GTree *tree= user_data;

	if (g_tree_lookup(tree, key)) {
	matches++;
	}
	return FALSE;
	}

	int
	main(int argc, char * argv) {

	GTimer *t = g_timer_new();
	gulong ms;
	GTree *one = g_tree_new(compare_nodes);
	GTree *two = g_tree_new(compare_nodes);
	gint i=0;

	g_timer_start(t);
	for(i=0; i <= 999999; i++) {
	g_tree_insert(one, GINT_TO_POINTER(i), GINT_TO_POINTER(i));
	}
	g_timer_stop(t);
	printf("%d inserted. Took %.0f seconds.\n", g_tree_nnodes(one), g_timer_elapsed(t, &ms));
	for(i=0; i <= 999999; i++) {
	g_tree_insert(two, GINT_TO_POINTER(i), GINT_TO_POINTER(i));
	}

	g_timer_start(t);
	g_tree_foreach(one, (GTraverseFunc)foreach_node, two);
	g_timer_stop(t);
	printf("%d matches. Took %.0f seconds.\n", matches, g_timer_elapsed(t, &ms));
	}
	var set = require ('./set').set // See below

	var one = set(1),
	two = set(1);

	var t1 = new Date();

	for (i=0;i<=9999999;i=i+1) {
	one.add(i);
	}
	console.log(one.size() + ' inserted in ' + Math.floor((new Date() - t1) / 1000));

	for (i=0;i<=9999999;i=i+1) {
	two.add(i);
	}

	var matches = one.intersectionCount(two);

	console.log(matches + ' matched in ' + Math.floor((new Date() - t1) / 1000));
	import scala.collection.mutable.Set

	object Indexr extends Application {

	var one = Set(1)
	var two = Set(1)

	var t = System.currentTimeMillis

	for (i <- 0.until(9999999)) {
	one += i
	}

	Console.println("Loaded set in " + ((System.currentTimeMillis-t)/ 1000.0))

	t = System.currentTimeMillis

	two = one.clone

	Console.println("Loaded set in " + ((System.currentTimeMillis-t)/ 1000.0))

	t = System.currentTimeMillis
	val intersects = one intersect two

	Console.println(intersects.size + " intersects in " + ((System.currentTimeMillis-t)/ 1000.0));
	}
	# SCALA

	[info] Loaded set in 112.9
	[info] Loaded set in 7.873
	[info] 9999999 intersects in 9.156

	# Node.js

	10000000 inserted in 16
	10000000 matched in 8

	# C / Glib / Hash

	10000000 inserted. Took 1 seconds.
	9999999 matches. Took 1 seconds.

	# C / Glib / Tree

	10000000 inserted. Took 4 seconds.
	9999999 matches. Took 39 seconds.

	# SCALA + TROVE w/o foreach

	[info] Loaded set in 0.711
	[info] Loaded set in 0.727
	[info] 10000001 intersects in 0.403
	import gnu.trove.set.TIntSet
	import gnu.trove.set.hash.TIntHashSet


	object Indexr extends Application {

	val n = 10000000
	val one = new TIntHashSet(n)
	val two = new TIntHashSet(n)
	var i = 0

	var t = System.currentTimeMillis

	i = 0
	while(i <= n) {
	one.add(i)
	i += 1
	}

	Console.println("Loaded set in " + ((System.currentTimeMillis-t)/ 1000.0))

	t = System.currentTimeMillis

	i = 0
	while(i <= n) {
	two.add(i)
	i += 1
	}

	Console.println("Loaded set in " + ((System.currentTimeMillis-t)/ 1000.0))

	t = System.currentTimeMillis

	two.retainAll(one)

	Console.println(two.size() + " intersects in " + ((System.currentTimeMillis-t)/ 1000.0));
	}
	exports.set = function () {
	var members = {}
	, eachArgument = function (args, fn) { Array.prototype.slice.apply(args).forEach (fn) }
	, set = function (item) { return members.hasOwnProperty (item) }

	set.has = set

	set.union = function (other) {
	var union = exports.set.apply ({}, set.members)
	union.add.apply (set, other.members)
	return union }

	set.intersection = function (other) {
	var intersection = exports.set ()
	set.members.forEach (function (elt) {
	if (other (elt)) intersection.add (elt) })
	return intersection }

	set.intersectionCount = function (other) {
	var intersection = 0;
	set.members.forEach (function (elt) {
	if (other (elt)) intersection++; })
	return intersection }

	set.add = function () {
	eachArgument (arguments, function (arg) { members [arg] = true }) }

	set.add.apply (set, arguments)

	set.del = function (item) {
	eachArgument (arguments, function (arg) { delete members [arg] }) }

	set.__defineGetter__ ('members', function () {
	var m = []
	for (k in members) if (members.hasOwnProperty (k)) m.push (k)
	return m })

	delete set.size
	set.size = function () {return set.members.length}

	set.toString = function () { return "<Set:" + set.members.join (",") + ">" }

	return set
	}