Liam0205 · August 23, 2024 15:41 · Liam0205 · Dec 2, 2019
diff --git a/random_choice.cc b/random_choice.cc
 #include <cassert>
 #include <cmath>
 #include <iostream>
 #include <random>
 #include <algorithm>
 #include <limits>
 #include <functional>
 #include <map>
 #include <vector>
 #include <queue>

 template <typename T>
 class discrete_random_variable {
 private:
  const std::vector<T> values_;
  const std::vector<std::pair<double, size_t>> alias_;
  mutable std::random_device   rd_;
  mutable std::mt19937         gen_{rd_()};
  mutable std::uniform_real_distribution<double> real_dis_{0.0, 1.0};
  mutable std::uniform_int_distribution<size_t>  int_dis_;

 public:
  discrete_random_variable(const std::vector<T>& vals, const std::vector<double>& probs) :
      values_(vals), alias_(generate_alias_table(probs)), int_dis_(0, probs.size() - 1) {
    assert(vals.size() == probs.size());
    const double sum = std::accumulate(probs.begin(), probs.end(), 0.0);
    assert(std::fabs(1.0 - sum) < std::numeric_limits<double>::epsilon());
  }

  T operator()() const {
    const size_t idx  = int_dis_(gen_);
    if (real_dis_(gen_) >= alias_[idx].first and
          alias_[idx].second != std::numeric_limits<size_t>::max()) {
      return values_[alias_[idx].second];
    } else {
      return values_[idx];
    }
  }

 private:
  std::vector<std::pair<double, size_t>> generate_alias_table(const std::vector<double>& probs) {
    const size_t sz = probs.size();
    std::vector<std::pair<double, size_t>> alias(sz, {0.0, std::numeric_limits<size_t>::max()});
    std::queue<size_t>  small, large;

    for (size_t i = 0; i != sz; ++i) {
      alias[i].first = sz * probs[i];
      if (alias[i].first < 1.0) {
        small.push(i);
      } else {
        large.push(i);
      }
    }

    while (not(small.empty()) and not(large.empty())) {
      auto s = small.front(), l = large.front();
      small.pop(), large.pop();
      alias[s].second = l;
      alias[l].first -= (1.0 - alias[s].first);

      if (alias[l].first < 1.0) {
        small.push(l);
      } else {
        large.push(l);
      }
    }

    return alias;
  }
 };

 int main() {
  std::vector<int> values{1, 2, 3, 4};
  std::vector<double> probs{0.05, 0.25, 0.35, 0.35};

  discrete_random_variable<int> drv{values, probs};

  std::map<int, size_t> counter;

  for (size_t i = 0; i != 400000; ++i) {
    int x = drv();
    assert(std::find(values.begin(), values.end(), x) != values.end());
    ++counter[x];
  }
  for (auto pair : counter) {
    std::cout << pair.first << "[" << pair.second << "]" << ": \t";
    for (size_t i = 0; i != pair.second / 2500; ++i) {
      std::cout << '=';
    }
    std::cout << std::endl;
  }

  return 0;
 }
	#include <cassert>
	#include <cmath>
	#include <iostream>
	#include <random>
	#include <algorithm>
	#include <limits>
	#include <functional>
	#include <map>
	#include <vector>
	#include <queue>

	template <typename T>
	class discrete_random_variable {
	private:
	const std::vector<T> values_;
	const std::vector<std::pair<double, size_t>> alias_;
	mutable std::random_device rd_;
	mutable std::mt19937 gen_{rd_()};
	mutable std::uniform_real_distribution<double> real_dis_{0.0, 1.0};
	mutable std::uniform_int_distribution<size_t> int_dis_;

	public:
	discrete_random_variable(const std::vector<T>& vals, const std::vector<double>& probs) :
	values_(vals), alias_(generate_alias_table(probs)), int_dis_(0, probs.size() - 1) {
	assert(vals.size() == probs.size());
	const double sum = std::accumulate(probs.begin(), probs.end(), 0.0);
	assert(std::fabs(1.0 - sum) < std::numeric_limits<double>::epsilon());
	}

	T operator()() const {
	const size_t idx = int_dis_(gen_);
	if (real_dis_(gen_) >= alias_[idx].first and
	alias_[idx].second != std::numeric_limits<size_t>::max()) {
	return values_[alias_[idx].second];
	} else {
	return values_[idx];
	}
	}

	private:
	std::vector<std::pair<double, size_t>> generate_alias_table(const std::vector<double>& probs) {
	const size_t sz = probs.size();
	std::vector<std::pair<double, size_t>> alias(sz, {0.0, std::numeric_limits<size_t>::max()});
	std::queue<size_t> small, large;

	for (size_t i = 0; i != sz; ++i) {
	alias[i].first = sz * probs[i];
	if (alias[i].first < 1.0) {
	small.push(i);
	} else {
	large.push(i);
	}
	}

	while (not(small.empty()) and not(large.empty())) {
	auto s = small.front(), l = large.front();
	small.pop(), large.pop();
	alias[s].second = l;
	alias[l].first -= (1.0 - alias[s].first);

	if (alias[l].first < 1.0) {
	small.push(l);
	} else {
	large.push(l);
	}
	}

	return alias;
	}
	};

	int main() {
	std::vector<int> values{1, 2, 3, 4};
	std::vector<double> probs{0.05, 0.25, 0.35, 0.35};

	discrete_random_variable<int> drv{values, probs};

	std::map<int, size_t> counter;

	for (size_t i = 0; i != 400000; ++i) {
	int x = drv();
	assert(std::find(values.begin(), values.end(), x) != values.end());
	++counter[x];
	}
	for (auto pair : counter) {
	std::cout << pair.first << "[" << pair.second << "]" << ": \t";
	for (size_t i = 0; i != pair.second / 2500; ++i) {
	std::cout << '=';
	}
	std::cout << std::endl;
	}

	return 0;
	}