zelaznik · November 4, 2024 20:04
diff --git a/binomial.js b/binomial.js
 // A pure Javscript implementation of binomial distribution
 // This is for educational purposes.  These numbers can become unreliable
 // when the numerators and denominators get too big.  This is because
 // of floating point arithmetic.
 //
 // Use a more robust statistical library for mission critical calculations

 function factorial(n) {
  let total = 1;
  for(let i=n; i>1; i--) {
    total = total * i;
  }

  return total;
 }

 function choose(n, k) {
  return factorial(n) / (factorial(k) * factorial(n - k))
 }

 function binomial(n, k, p) {
  return choose(n, k) * Math.pow(p, k) * Math.pow(1-p, n-k);
 }
diff --git a/brute_force_monte_carlo.js b/brute_force_monte_carlo.js
 // Run 10_000 trials
 // In each trial, 100 people visit site A and 100 people visit site B
 // In the simulation, both sites have the same joint rate
 // The final output of each trial will be the click through rate on page A and the click through rate on page B

 function click_rate(total_visits=100, base_rate=0.115) {
  let visit_count = 0;
  for (let visit=0; visit<=total_visits; visit++) {
    if (Math.random() < base_rate) {
      visit_count += 1;
    }
  }

  return visit_count / total_visits;
 }

 function percent_difference(rate_a, rate_b) {
  if (rate_a === 0 && rate_b === 0) {
    return 1;
  } else {
    return rate_b / rate_a;
  }
 }

 function run_trials(options = {}) {
  const DEFAULTS = {
    total_trials: 100_000,
    total_visits: 100,
    base_rate: 0.115,
    target_difference: 1.30,
  };

  const {
    total_trials,
    total_visits,
    base_rate,
    target_difference
  } = { ...DEFAULTS, ...options};

  let success_count = 0;
  for (let trial=0; trial<total_trials; trial++) {
    let click_rate_a = click_rate(total_visits, base_rate);
    let click_rate_b = click_rate(total_visits, base_rate);

    // Remember this is a two sided test
    let ratio_left  = percent_difference(click_rate_a, click_rate_b);
    let ratio_right = percent_difference(click_rate_b, click_rate_a);
    if (ratio_left > target_difference || ratio_right > target_difference) {
      success_count += 1;
    }
  }

  return success_count / total_trials;
 }
diff --git a/flaky_test_monte_carlo.js b/flaky_test_monte_carlo.js
 function scenario(run_count=5, p=5/6) {
  let total = 0;
  for (let i=0; i<run_count; i++) {
    if (Math.random() < p) {
      total += 1;
    }
  }
  return total / run_count;
 }

 function run_trials(options = {}) {
  const defaults = { trial_count: 100_000, run_count: 5, p: 5/6 };
  const { trial_count, run_count, p } = Object.assign({}, defaults, options);
  let total = 0;
  for (let trial=0; trial<trial_count; trial++) {
    if (scenario(run_count, p) === 1) {
      total += 1;
    }
  }
  return total / trial_count;
 }
diff --git a/javascript_chicago_lightning_talk_outline.md b/javascript_chicago_lightning_talk_outline.md
diff --git a/poisson_simulation.js b/poisson_simulation.js
 function random_poisson_approximation(mu) {
  // Simulates it with a very large binomial distribution

  const n = Math.floor(mu * 100);
  const p = mu / n;

  let total = 0;
  for (let i=0; i<n; i++) {
    if (Math.random() < p) {
      total += 1;
    }
  }

  return total;
 }

 function run_trials(options={}) {
  const defaults = { mu: 10, trial_count: 100_000, target: 8 };
  const { mu, trial_count, target } = { ...defaults, ...options };

  let success_count = 0;

  for (let trial=0; trial<trial_count; trial++) {
    if (random_poisson_approximation(mu) <= target) {
      success_count += 1;
    }
  }

  return success_count / trial_count;
 }
diff --git a/standard_error.js b/standard_error.js
 function mean(values) {
  let total = 0;
  let count = 0;

  for (const value of values) {
    total += value;
    count += 1;
  }

  return total / count;
 }

 function variance(values) {
  let s_1 = 0, s_2 = 0, count = 0;

  for (const value of values) {
    count += 1;
    s_1 += value;
    s_2 += (value * value);
  }

  const mu = s_1 / count;

  return s_2 / count - mu * mu;
 }

 function stdev(values) {
  return Math.sqrt(variance(values));
 }

 function get_observed_rate(visit_count=100, click_rate=0.115) {
  let click_count = 0;

  for (let visit=0; visit<visit_count; visit++) {
    if (Math.random() < click_rate) {
      click_count += 1;
    }
  }

  return click_count / visit_count;
 }

 function run_trials(overrides = {}) {
  const defaults = {
    visit_count: 100,
    click_rate: 0.115,
    trial_count: 100_000,
  }

  const {
    visit_count,
    click_rate,
    trial_count
  } = Object.assign({}, defaults, overrides);

  const observed_rates = [];
  for (let trial=0; trial<=trial_count; trial++) {
    const rate = get_observed_rate(visit_count, click_rate);
    observed_rates.push(rate);
  }

  return {
    mean: mean(observed_rates),
    stdev: stdev(observed_rates),
    values: observed_rates
  }
 }
	// A pure Javscript implementation of binomial distribution
	// This is for educational purposes. These numbers can become unreliable
	// when the numerators and denominators get too big. This is because
	// of floating point arithmetic.
	//
	// Use a more robust statistical library for mission critical calculations

	function factorial(n) {
	let total = 1;
	for(let i=n; i>1; i--) {
	total = total * i;
	}

	return total;
	}

	function choose(n, k) {
	return factorial(n) / (factorial(k) * factorial(n - k))
	}

	function binomial(n, k, p) {
	return choose(n, k) * Math.pow(p, k) * Math.pow(1-p, n-k);
	}
	// Run 10_000 trials
	// In each trial, 100 people visit site A and 100 people visit site B
	// In the simulation, both sites have the same joint rate
	// The final output of each trial will be the click through rate on page A and the click through rate on page B

	function click_rate(total_visits=100, base_rate=0.115) {
	let visit_count = 0;
	for (let visit=0; visit<=total_visits; visit++) {
	if (Math.random() < base_rate) {
	visit_count += 1;
	}
	}

	return visit_count / total_visits;
	}

	function percent_difference(rate_a, rate_b) {
	if (rate_a === 0 && rate_b === 0) {
	return 1;
	} else {
	return rate_b / rate_a;
	}
	}

	function run_trials(options = {}) {
	const DEFAULTS = {
	total_trials: 100_000,
	total_visits: 100,
	base_rate: 0.115,
	target_difference: 1.30,
	};

	const {
	total_trials,
	total_visits,
	base_rate,
	target_difference
	} = { ...DEFAULTS, ...options};

	let success_count = 0;
	for (let trial=0; trial<total_trials; trial++) {
	let click_rate_a = click_rate(total_visits, base_rate);
	let click_rate_b = click_rate(total_visits, base_rate);

	// Remember this is a two sided test
	let ratio_left = percent_difference(click_rate_a, click_rate_b);
	let ratio_right = percent_difference(click_rate_b, click_rate_a);
	if (ratio_left > target_difference \|\| ratio_right > target_difference) {
	success_count += 1;
	}
	}

	return success_count / total_trials;
	}
	function scenario(run_count=5, p=5/6) {
	let total = 0;
	for (let i=0; i<run_count; i++) {
	if (Math.random() < p) {
	total += 1;
	}
	}
	return total / run_count;
	}

	function run_trials(options = {}) {
	const defaults = { trial_count: 100_000, run_count: 5, p: 5/6 };
	const { trial_count, run_count, p } = Object.assign({}, defaults, options);
	let total = 0;
	for (let trial=0; trial<trial_count; trial++) {
	if (scenario(run_count, p) === 1) {
	total += 1;
	}
	}
	return total / trial_count;
	}
page_visits	p-value (%)
100	49.89%
200	34.19%
300	24.97%
400	18.55%
500	13.69%
600	10.33%
700	7.86%
800	6.03%
900	4.70%
1000	3.56%
	function random_poisson_approximation(mu) {
	// Simulates it with a very large binomial distribution

	const n = Math.floor(mu * 100);
	const p = mu / n;

	let total = 0;
	for (let i=0; i<n; i++) {
	if (Math.random() < p) {
	total += 1;
	}
	}

	return total;
	}

	function run_trials(options={}) {
	const defaults = { mu: 10, trial_count: 100_000, target: 8 };
	const { mu, trial_count, target } = { ...defaults, ...options };

	let success_count = 0;

	for (let trial=0; trial<trial_count; trial++) {
	if (random_poisson_approximation(mu) <= target) {
	success_count += 1;
	}
	}

	return success_count / trial_count;
	}
	function mean(values) {
	let total = 0;
	let count = 0;

	for (const value of values) {
	total += value;
	count += 1;
	}

	return total / count;
	}

	function variance(values) {
	let s_1 = 0, s_2 = 0, count = 0;

	for (const value of values) {
	count += 1;
	s_1 += value;
	s_2 += (value * value);
	}

	const mu = s_1 / count;

	return s_2 / count - mu * mu;
	}

	function stdev(values) {
	return Math.sqrt(variance(values));
	}

	function get_observed_rate(visit_count=100, click_rate=0.115) {
	let click_count = 0;

	for (let visit=0; visit<visit_count; visit++) {
	if (Math.random() < click_rate) {
	click_count += 1;
	}
	}

	return click_count / visit_count;
	}

	function run_trials(overrides = {}) {
	const defaults = {
	visit_count: 100,
	click_rate: 0.115,
	trial_count: 100_000,
	}

	const {
	visit_count,
	click_rate,
	trial_count
	} = Object.assign({}, defaults, overrides);

	const observed_rates = [];
	for (let trial=0; trial<=trial_count; trial++) {
	const rate = get_observed_rate(visit_count, click_rate);
	observed_rates.push(rate);
	}

	return {
	mean: mean(observed_rates),
	stdev: stdev(observed_rates),
	values: observed_rates
	}
	}