findepi · February 12, 2025 15:43
diff --git a/01_README.md b/01_README.md
diff --git a/20_bench_code.rs b/20_bench_code.rs
 #[macro_use]
 extern crate criterion;

 use crate::criterion::Criterion;
 use std::time::Duration;

 use itertools::izip;
 use rand::Rng;

 type Result<T> = std::result::Result<T, String>;

 // #[no_mangle]
 // #[inline(always)]
 // #[inline(never)]
 fn simple_sum(a: i32, b: i32, c: i32, d: i32) -> Result<i32> {
    Ok(a + b + c + d)
 }

 // #[no_mangle]
 // #[inline(always)]
 // #[inline(never)]
 fn curried_sum(a: i32, b: i32, c: i32, d: i32) -> Result<i32> {
    Ok(fn_fn_fn_fn(a)?(b)?(c)?(d)?)
 }

 fn fn_fn_fn_fn(
    a: i32,
 ) -> Result<Box<dyn Fn(i32) -> Result<Box<dyn Fn(i32) -> Result<Box<dyn Fn(i32) -> Result<i32>>>>>>>
 {
    Ok(Box::new(move |b| {
        Ok(Box::new(move |c| Ok(Box::new(move |d| Ok(a + b + c + d)))))
    }))
 }

 // #[no_mangle]
 // #[inline(always)]
 // #[inline(never)]
 fn continuation_sum(a: i32, b: i32, c: i32, d: i32) -> Result<i32> {
    fn_continuation(a, &|after_a| /*_*/ {
        after_a?(b, &|after_b| /*_*/ {
            after_b?(c, &|after_c| /*_*/ {
                after_c?(d)
            })
        })
    })
 }

 fn fn_continuation(
    a: i32,
    after_a: &dyn Fn(
        Result<
            &dyn Fn(
                /*b*/ i32,
                /* after_b */
                &dyn Fn(
                    Result<
                        &dyn Fn(
                            /*c*/ i32,
                            /* after_c */
                            &dyn Fn(
                                // calculate final result
                                Result<&dyn Fn(/*d*/ i32) -> Result<i32>>,
                            ) -> Result<i32>,
                        ) -> Result<i32>,
                    >,
                ) -> Result<i32>,
            ) -> Result<i32>,
        >,
    ) -> Result<i32>,
 ) -> Result<i32> {
    after_a(Ok(&move |b, after_b| /*-> Result<i32> */ {
        after_b(Ok(&move |c, after_c| /*-> Result<i32> */ {
            after_c(Ok(&move |d| /*-> Result<i32> */ {
                Ok(a + b + c + d)
            }))
        }))
    }))
 }

 fn criterion_benchmark(c: &mut Criterion) {
    let a_vals = generate_array();
    let b_vals = generate_array();
    let c_vals = generate_array();
    let d_vals = generate_array();

    let mut group = c.benchmark_group("function-calls");
    group.measurement_time(Duration::from_secs(10));
    // quick
    // group.warm_up_time(Duration::from_secs(1));
    // group.measurement_time(Duration::from_secs(2));

    group.bench_function("simple_sum", |b| {
        b.iter(|| {
            let sum = izip!(&a_vals, &b_vals, &c_vals, &d_vals)
                .map(|(a, b, c, d)| simple_sum(*a, *b, *c, *d).unwrap())
                .sum::<i32>();
            criterion::black_box(sum);
        })
    });

    group.bench_function("curried_sum", |b| {
        b.iter(|| {
            let sum = izip!(&a_vals, &b_vals, &c_vals, &d_vals)
                .map(|(a, b, c, d)| curried_sum(*a, *b, *c, *d).unwrap())
                .sum::<i32>();
            criterion::black_box(sum);
        })
    });

    group.bench_function("continuation_sum", |b| {
        b.iter(|| {
            let sum = izip!(&a_vals, &b_vals, &c_vals, &d_vals)
                .map(|(a, b, c, d)| continuation_sum(*a, *b, *c, *d).unwrap())
                .sum::<i32>();
            criterion::black_box(sum);
        })
    });
 }

 fn generate_array() -> Vec<i32> {
    let mut rng = rand::rng();
    (0..10_000).map(|_| rng.random_range(0..100)).collect()
 }

 criterion_group!(benches, criterion_benchmark);
 criterion_main!(benches);
diff --git a/21_bench_results.md b/21_bench_results.md
diff --git a/22_simpler_bench_code.rs b/22_simpler_bench_code.rs
 #[macro_use]
 extern crate criterion;

 use crate::criterion::Criterion;
 use std::time::Duration;

 use itertools::izip;
 use rand::Rng;

 // #[no_mangle]
 // #[inline(always)]
 // #[inline(never)]
 fn simple_sum(a: i32, b: i32) -> i32 {
    a + b
 }

 // #[no_mangle]
 // #[inline(always)]
 // #[inline(never)]
 fn curried_sum(a: i32, b: i32) -> i32 {
    fn_curry(a)(b)
 }

 fn fn_curry(a: i32) -> Box<dyn Fn(i32) -> i32> {
    Box::new(move |b| a + b)
 }

 // #[no_mangle]
 // #[inline(always)]
 // #[inline(never)]
 fn continuation_sum(a: i32, b: i32) -> i32 {
    fn_continuation(a, &|after_a| /*_*/ {
        after_a(b)
    })
 }

 fn fn_continuation(
    a: i32,
    after_a: &dyn Fn(
        &dyn Fn(/*b*/ i32) -> i32, //
    ) -> i32,
 ) -> i32 {
    after_a(&move |b| /*-> i32 */ {
        a + b
    })
 }

 fn criterion_benchmark(c: &mut Criterion) {
    let a_vals = generate_array();
    let b_vals = generate_array();

    let mut group = c.benchmark_group("simpler-function-calls");
    group.measurement_time(Duration::from_secs(10));
    // quick
    // group.warm_up_time(Duration::from_secs(1));
    // group.measurement_time(Duration::from_secs(2));

    group.bench_function("simple_sum", |b| {
        b.iter(|| {
            let sum = izip!(&a_vals, &b_vals)
                .map(|(a, b)| simple_sum(*a, *b))
                .sum::<i32>();
            criterion::black_box(sum);
        })
    });

    group.bench_function("curried_sum", |b| {
        b.iter(|| {
            let sum = izip!(&a_vals, &b_vals)
                .map(|(a, b)| curried_sum(*a, *b))
                .sum::<i32>();
            criterion::black_box(sum);
        })
    });

    group.bench_function("continuation_sum", |b| {
        b.iter(|| {
            let sum = izip!(&a_vals, &b_vals)
                .map(|(a, b)| continuation_sum(*a, *b))
                .sum::<i32>();
            criterion::black_box(sum);
        })
    });
 }

 fn generate_array() -> Vec<i32> {
    let mut rng = rand::rng();
    (0..10_000).map(|_| rng.random_range(0..100)).collect()
 }

 criterion_group!(benches, criterion_benchmark);
 criterion_main!(benches);
diff --git a/22_simpler_bench_results.md b/22_simpler_bench_results.md
diff --git a/30_rustc_patch.diff b/30_rustc_patch.diff
 diff --git library/alloc/src/alloc.rs library/alloc/src/alloc.rs
 index e686a02f29b..9053d9a52c8 100644
 --- library/alloc/src/alloc.rs
 +++ library/alloc/src/alloc.rs
 @@ -91,7 +91,7 @@ pub unsafe fn alloc(layout: Layout) -> *mut u8 {
     unsafe {
         // Make sure we don't accidentally allow omitting the allocator shim in
         // stable code until it is actually stabilized.
 -        core::ptr::read_volatile(&__rust_no_alloc_shim_is_unstable);
 +        //core::ptr::read_volatile(&__rust_no_alloc_shim_is_unstable);

         __rust_alloc(layout.size(), layout.align())
     }
 @@ -174,7 +174,7 @@ pub unsafe fn alloc_zeroed(layout: Layout) -> *mut u8 {
     unsafe {
         // Make sure we don't accidentally allow omitting the allocator shim in
         // stable code until it is actually stabilized.
 -        core::ptr::read_volatile(&__rust_no_alloc_shim_is_unstable);
 +        //core::ptr::read_volatile(&__rust_no_alloc_shim_is_unstable);

         __rust_alloc_zeroed(layout.size(), layout.align())
     }
	#[macro_use]
	extern crate criterion;

	use crate::criterion::Criterion;
	use std::time::Duration;

	use itertools::izip;
	use rand::Rng;

	type Result<T> = std::result::Result<T, String>;

	// #[no_mangle]
	// #[inline(always)]
	// #[inline(never)]
	fn simple_sum(a: i32, b: i32, c: i32, d: i32) -> Result<i32> {
	Ok(a + b + c + d)
	}

	// #[no_mangle]
	// #[inline(always)]
	// #[inline(never)]
	fn curried_sum(a: i32, b: i32, c: i32, d: i32) -> Result<i32> {
	Ok(fn_fn_fn_fn(a)?(b)?(c)?(d)?)
	}

	fn fn_fn_fn_fn(
	a: i32,
	) -> Result<Box<dyn Fn(i32) -> Result<Box<dyn Fn(i32) -> Result<Box<dyn Fn(i32) -> Result<i32>>>>>>>
	{
	Ok(Box::new(move \|b\| {
	Ok(Box::new(move \|c\| Ok(Box::new(move \|d\| Ok(a + b + c + d)))))
	}))
	}

	// #[no_mangle]
	// #[inline(always)]
	// #[inline(never)]
	fn continuation_sum(a: i32, b: i32, c: i32, d: i32) -> Result<i32> {
	fn_continuation(a, &\|after_a\| /_/ {
	after_a?(b, &\|after_b\| /_/ {
	after_b?(c, &\|after_c\| /_/ {
	after_c?(d)
	})
	})
	})
	}

	fn fn_continuation(
	a: i32,
	after_a: &dyn Fn(
	Result<
	&dyn Fn(
	/b/ i32,
	/* after_b */
	&dyn Fn(
	Result<
	&dyn Fn(
	/c/ i32,
	/* after_c */
	&dyn Fn(
	// calculate final result
	Result<&dyn Fn(/d/ i32) -> Result<i32>>,
	) -> Result<i32>,
	) -> Result<i32>,
	>,
	) -> Result<i32>,
	) -> Result<i32>,
	>,
	) -> Result<i32>,
	) -> Result<i32> {
	after_a(Ok(&move \|b, after_b\| /-> Result<i32> / {
	after_b(Ok(&move \|c, after_c\| /-> Result<i32> / {
	after_c(Ok(&move \|d\| /-> Result<i32> / {
	Ok(a + b + c + d)
	}))
	}))
	}))
	}

	fn criterion_benchmark(c: &mut Criterion) {
	let a_vals = generate_array();
	let b_vals = generate_array();
	let c_vals = generate_array();
	let d_vals = generate_array();

	let mut group = c.benchmark_group("function-calls");
	group.measurement_time(Duration::from_secs(10));
	// quick
	// group.warm_up_time(Duration::from_secs(1));
	// group.measurement_time(Duration::from_secs(2));

	group.bench_function("simple_sum", \|b\| {
	b.iter(\|\| {
	let sum = izip!(&a_vals, &b_vals, &c_vals, &d_vals)
	.map(\|(a, b, c, d)\| simple_sum(a, b, c, d).unwrap())
	.sum::<i32>();
	criterion::black_box(sum);
	})
	});

	group.bench_function("curried_sum", \|b\| {
	b.iter(\|\| {
	let sum = izip!(&a_vals, &b_vals, &c_vals, &d_vals)
	.map(\|(a, b, c, d)\| curried_sum(a, b, c, d).unwrap())
	.sum::<i32>();
	criterion::black_box(sum);
	})
	});

	group.bench_function("continuation_sum", \|b\| {
	b.iter(\|\| {
	let sum = izip!(&a_vals, &b_vals, &c_vals, &d_vals)
	.map(\|(a, b, c, d)\| continuation_sum(a, b, c, d).unwrap())
	.sum::<i32>();
	criterion::black_box(sum);
	})
	});
	}

	fn generate_array() -> Vec<i32> {
	let mut rng = rand::rng();
	(0..10_000).map(\|_\| rng.random_range(0..100)).collect()
	}

	criterion_group!(benches, criterion_benchmark);
	criterion_main!(benches);
variant	`simple_sum`	`curried_sum`	`continuation_sum`	notes
no attributes	~1.3	~9.5	~1.3
no attributes with nightly compiler patched `30_rustc_patch.diff`	~1.3	~9	~1.3
`#[inline(never)]`	~9	~9.5	~9	the curried variant usually performs slightly worse, the difference is small though
`#[inline(always)]`	1.3	330	32	simple variant looks like it's always inlined. forced inlining of curried variant gives dramatic slowdown, similar for continuation variant
	diff --git library/alloc/src/alloc.rs library/alloc/src/alloc.rs
	index e686a02f29b..9053d9a52c8 100644
	--- library/alloc/src/alloc.rs
	+++ library/alloc/src/alloc.rs
	@@ -91,7 +91,7 @@ pub unsafe fn alloc(layout: Layout) -> *mut u8 {
	unsafe {
	// Make sure we don't accidentally allow omitting the allocator shim in
	// stable code until it is actually stabilized.
	- core::ptr::read_volatile(&__rust_no_alloc_shim_is_unstable);
	+ //core::ptr::read_volatile(&__rust_no_alloc_shim_is_unstable);

	__rust_alloc(layout.size(), layout.align())
	}
	@@ -174,7 +174,7 @@ pub unsafe fn alloc_zeroed(layout: Layout) -> *mut u8 {
	unsafe {
	// Make sure we don't accidentally allow omitting the allocator shim in
	// stable code until it is actually stabilized.
	- core::ptr::read_volatile(&__rust_no_alloc_shim_is_unstable);
	+ //core::ptr::read_volatile(&__rust_no_alloc_shim_is_unstable);

	__rust_alloc_zeroed(layout.size(), layout.align())
	}