anp · January 15, 2016 20:15
diff --git a/0results.md b/0results.md
diff --git a/Cargo.toml b/Cargo.toml
 [package]
 name = "hash-test"
 version = "0.1.0"
 authors = ["Adam Perry <[email protected]>"]

 [dependencies]
 rand = "0.3.13"
 metrohash = "0.1.0"
 twox-hash = "0.1.1"
 fnv = "1.0.0"
 crc24 = "0.1.6"
 farmhash = "1.1.4"
diff --git a/main.rs b/main.rs
 #![feature(test, hashmap_hasher, simd)]
 extern crate test;
 use test::Bencher;

 extern crate rand;
 use rand::{Rng, Isaac64Rng};

 use std::collections::HashMap;
 use std::collections::hash_state::{DefaultState, HashState};

 fn bench_generic<H>(b: &mut Bencher, mut map: HashMap<Vec<u8>, u32, H>)
    where H: HashState
 {
    let key_len = 8;
    let mut rng = Isaac64Rng::new_unseeded();
    let input = generate_all_n_bytestrings(key_len, vec![b'A', b'C', b'G', b'T', b'N']);

    for s in &input {
        map.insert(s.to_owned(), 0);
    }

    b.bytes = key_len as u64;
    b.iter(|| {
        let idx = rng.gen_range(0, input.len());
        let key = input[idx].to_owned();
        let mut count = map.entry(key).or_insert(0);
        *count = *count + 1;
    })
 }

 ///////////////////////////////////////////////////////////////////////////////////
 // Identifying random lookup and copy overhead
 ///////////////////////////////////////////////////////////////////////////////////

 #[bench]
 fn bench_random_indexes(b: &mut Bencher) {
    let mut rng = Isaac64Rng::new_unseeded();
    let input = generate_all_n_bytestrings(8, vec![b'A', b'C', b'G', b'T', b'N']);

    b.iter(|| {
        let idx = rng.gen_range(0, input.len());
        let _ = input[idx].to_owned();
    })
 }

 ///////////////////////////////////////////////////////////////////////////////////
 // Default stdlib implementation
 ///////////////////////////////////////////////////////////////////////////////////
 use std::collections::hash_map::RandomState;

 #[bench]
 fn bench_default(b: &mut Bencher) {
    let map: HashMap<Vec<u8>, u32, RandomState> = Default::default();
    bench_generic(b, map);
 }

 ///////////////////////////////////////////////////////////////////////////////////
 // metrohash crate
 ///////////////////////////////////////////////////////////////////////////////////
 extern crate metrohash;
 use metrohash::MetroHash;

 #[bench]
 fn bench_metrohash(b: &mut Bencher) {
    let map: HashMap<Vec<u8>, u32, DefaultState<MetroHash>> = Default::default();
    bench_generic(b, map);
 }

 ///////////////////////////////////////////////////////////////////////////////////
 // twox_hash crate
 ///////////////////////////////////////////////////////////////////////////////////
 extern crate twox_hash;
 use twox_hash::{XxHash, RandomXxHashState};

 #[bench]
 fn bench_twox_fixed_seed(b: &mut Bencher) {
    let map: HashMap<Vec<u8>, u32, DefaultState<XxHash>> = Default::default();
    bench_generic(b, map);
 }

 #[bench]
 fn bench_twox_random_seed(b: &mut Bencher) {
    let map: HashMap<Vec<u8>, u32, RandomXxHashState> = Default::default();
    bench_generic(b, map);
 }

 ///////////////////////////////////////////////////////////////////////////////////
 // fnv crate (from servo)
 ///////////////////////////////////////////////////////////////////////////////////
 extern crate fnv;
 use fnv::FnvHasher;

 #[bench]
 fn bench_servo_fnv(b: &mut Bencher) {
    let map: HashMap<Vec<u8>, u32, DefaultState<FnvHasher>> = Default::default();
    bench_generic(b, map);
 }

 ///////////////////////////////////////////////////////////////////////////////////
 // crc24 crate
 ///////////////////////////////////////////////////////////////////////////////////
 extern crate crc24;
 use crc24::Crc24Hasher;

 #[bench]
 fn bench_crc24(b: &mut Bencher) {
    let map: HashMap<Vec<u8>, u32, DefaultState<Crc24Hasher>> = Default::default();
    bench_generic(b, map);
 }

 ///////////////////////////////////////////////////////////////////////////////////
 // farmhash crate
 ///////////////////////////////////////////////////////////////////////////////////
 extern crate farmhash;
 use farmhash::FarmHasher;

 #[bench]
 fn bench_farmhash(b: &mut Bencher) {
    let map: HashMap<Vec<u8>, u32, DefaultState<FarmHasher>> = Default::default();
    bench_generic(b, map);
 }

 ///////////////////////////////////////////////////////////////////////////////////

 fn generate_all_n_bytestrings(length: usize, alphabet: Vec<u8>) -> Vec<Vec<u8>> {
    let mut strings: Vec<Vec<u8>> = Vec::new();

    for b in &alphabet {
        strings.push(vec![*b]);
    }

    for _ in 2..(length + 1) {
        let mut new_strings = Vec::new();
        for s in strings {

            for byte in &alphabet {
                let mut new_string = s.to_owned();
                new_string.push(*byte);
                new_strings.push(new_string);
            }

        }
        strings = new_strings;

    }
    strings.into_iter().filter(|v| v.len() == length).collect()
 }
algorithm	run 1 (ns)	run 2 (ns)	run 3 (ns)	avg (ns)	minus overhead (ns)	percent faster
crc24	614	604	614	610.7	378.0	4.5%
default	637	612	636	628.3	395.7	0.0%
farm	634	633	644	637.0	404.3	-2.2%
metro	590	586	599	591.7	359.0	9.3%
fnv	581	579	598	586.0	353.3	10.7%
twox_fixed	612	614	620	615.3	382.7	3.3%
twox_random	611	614	623	616.0	383.3	3.1%
indexing overhead	234	232	232	233
	[package]
	name = "hash-test"
	version = "0.1.0"
	authors = ["Adam Perry <[email protected]>"]

	[dependencies]
	rand = "0.3.13"
	metrohash = "0.1.0"
	twox-hash = "0.1.1"
	fnv = "1.0.0"
	crc24 = "0.1.6"
	farmhash = "1.1.4"
	#![feature(test, hashmap_hasher, simd)]
	extern crate test;
	use test::Bencher;

	extern crate rand;
	use rand::{Rng, Isaac64Rng};

	use std::collections::HashMap;
	use std::collections::hash_state::{DefaultState, HashState};

	fn bench_generic<H>(b: &mut Bencher, mut map: HashMap<Vec<u8>, u32, H>)
	where H: HashState
	{
	let key_len = 8;
	let mut rng = Isaac64Rng::new_unseeded();
	let input = generate_all_n_bytestrings(key_len, vec![b'A', b'C', b'G', b'T', b'N']);

	for s in &input {
	map.insert(s.to_owned(), 0);
	}

	b.bytes = key_len as u64;
	b.iter(\|\| {
	let idx = rng.gen_range(0, input.len());
	let key = input[idx].to_owned();
	let mut count = map.entry(key).or_insert(0);
	count = count + 1;
	})
	}

	///////////////////////////////////////////////////////////////////////////////////
	// Identifying random lookup and copy overhead
	///////////////////////////////////////////////////////////////////////////////////

	#[bench]
	fn bench_random_indexes(b: &mut Bencher) {
	let mut rng = Isaac64Rng::new_unseeded();
	let input = generate_all_n_bytestrings(8, vec![b'A', b'C', b'G', b'T', b'N']);

	b.iter(\|\| {
	let idx = rng.gen_range(0, input.len());
	let _ = input[idx].to_owned();
	})
	}

	///////////////////////////////////////////////////////////////////////////////////
	// Default stdlib implementation
	///////////////////////////////////////////////////////////////////////////////////
	use std::collections::hash_map::RandomState;

	#[bench]
	fn bench_default(b: &mut Bencher) {
	let map: HashMap<Vec<u8>, u32, RandomState> = Default::default();
	bench_generic(b, map);
	}

	///////////////////////////////////////////////////////////////////////////////////
	// metrohash crate
	///////////////////////////////////////////////////////////////////////////////////
	extern crate metrohash;
	use metrohash::MetroHash;

	#[bench]
	fn bench_metrohash(b: &mut Bencher) {
	let map: HashMap<Vec<u8>, u32, DefaultState<MetroHash>> = Default::default();
	bench_generic(b, map);
	}

	///////////////////////////////////////////////////////////////////////////////////
	// twox_hash crate
	///////////////////////////////////////////////////////////////////////////////////
	extern crate twox_hash;
	use twox_hash::{XxHash, RandomXxHashState};

	#[bench]
	fn bench_twox_fixed_seed(b: &mut Bencher) {
	let map: HashMap<Vec<u8>, u32, DefaultState<XxHash>> = Default::default();
	bench_generic(b, map);
	}

	#[bench]
	fn bench_twox_random_seed(b: &mut Bencher) {
	let map: HashMap<Vec<u8>, u32, RandomXxHashState> = Default::default();
	bench_generic(b, map);
	}

	///////////////////////////////////////////////////////////////////////////////////
	// fnv crate (from servo)
	///////////////////////////////////////////////////////////////////////////////////
	extern crate fnv;
	use fnv::FnvHasher;

	#[bench]
	fn bench_servo_fnv(b: &mut Bencher) {
	let map: HashMap<Vec<u8>, u32, DefaultState<FnvHasher>> = Default::default();
	bench_generic(b, map);
	}

	///////////////////////////////////////////////////////////////////////////////////
	// crc24 crate
	///////////////////////////////////////////////////////////////////////////////////
	extern crate crc24;
	use crc24::Crc24Hasher;

	#[bench]
	fn bench_crc24(b: &mut Bencher) {
	let map: HashMap<Vec<u8>, u32, DefaultState<Crc24Hasher>> = Default::default();
	bench_generic(b, map);
	}

	///////////////////////////////////////////////////////////////////////////////////
	// farmhash crate
	///////////////////////////////////////////////////////////////////////////////////
	extern crate farmhash;
	use farmhash::FarmHasher;

	#[bench]
	fn bench_farmhash(b: &mut Bencher) {
	let map: HashMap<Vec<u8>, u32, DefaultState<FarmHasher>> = Default::default();
	bench_generic(b, map);
	}

	///////////////////////////////////////////////////////////////////////////////////

	fn generate_all_n_bytestrings(length: usize, alphabet: Vec<u8>) -> Vec<Vec<u8>> {
	let mut strings: Vec<Vec<u8>> = Vec::new();

	for b in &alphabet {
	strings.push(vec![*b]);
	}

	for _ in 2..(length + 1) {
	let mut new_strings = Vec::new();
	for s in strings {

	for byte in &alphabet {
	let mut new_string = s.to_owned();
	new_string.push(*byte);
	new_strings.push(new_string);
	}

	}
	strings = new_strings;

	}
	strings.into_iter().filter(\|v\| v.len() == length).collect()
	}