gituser768 · January 16, 2022 20:18 · gituser768 · May 12, 2021
diff --git a/f1_var.py b/f1_var.py
 from collections import defaultdict

 import numpy as np
 import numpy.linalg as la
 import pandas as pd
 import numpy.random as rn
 import matplotlib.pyplot as plt


 def hmean(a, b):
  return np.nan_to_num(2 / (1/a + 1/b))

 def main():
  p = 0.5
  n_iter = 10000
  r_steps = 30
  p_steps = 40
  recall = np.linspace(0, 1, r_steps + 1)[1:]
  precision = np.linspace(0, 1, p_steps + 1)[1:]
  p_1_0 = recall * p / precision[:, np.newaxis] - recall * p
  recall_neg = p_1_0 / (1 - p)
  f1s = defaultdict(list)
  num_samples = [100]
  for i in range(n_iter):
    for n in num_samples:
      pos = (rn.rand(n) > p)
      pred_tpos = (rn.rand(n, r_steps) < recall) & pos[:, np.newaxis]
      pred_tneg = (rn.rand(n, p_steps, r_steps) < recall_neg) & ~pos[:, np.newaxis, np.newaxis]
      pred = pred_tpos[:, np.newaxis] | pred_tneg
      recall_hat = pred_tpos.sum(0) / pos.sum(0)
      precision_hat = pred_tpos.sum(0) / pred.sum(0)
      f1s[n].append(hmean(np.tile(recall_hat, p_steps), precision_hat.reshape(-1)).reshape(*precision_hat.shape))

  for n in num_samples:
    plt.contourf(recall, precision, np.stack(f1s[n]).std(0))
    plt.figure()
  plt.show()



 if __name__ == "__main__": main()
	from collections import defaultdict

	import numpy as np
	import numpy.linalg as la
	import pandas as pd
	import numpy.random as rn
	import matplotlib.pyplot as plt


	def hmean(a, b):
	return np.nan_to_num(2 / (1/a + 1/b))

	def main():
	p = 0.5
	n_iter = 10000
	r_steps = 30
	p_steps = 40
	recall = np.linspace(0, 1, r_steps + 1)[1:]
	precision = np.linspace(0, 1, p_steps + 1)[1:]
	p_1_0 = recall * p / precision[:, np.newaxis] - recall * p
	recall_neg = p_1_0 / (1 - p)
	f1s = defaultdict(list)
	num_samples = [100]
	for i in range(n_iter):
	for n in num_samples:
	pos = (rn.rand(n) > p)
	pred_tpos = (rn.rand(n, r_steps) < recall) & pos[:, np.newaxis]
	pred_tneg = (rn.rand(n, p_steps, r_steps) < recall_neg) & ~pos[:, np.newaxis, np.newaxis]
	pred = pred_tpos[:, np.newaxis] \| pred_tneg
	recall_hat = pred_tpos.sum(0) / pos.sum(0)
	precision_hat = pred_tpos.sum(0) / pred.sum(0)
	f1s[n].append(hmean(np.tile(recall_hat, p_steps), precision_hat.reshape(-1)).reshape(*precision_hat.shape))

	for n in num_samples:
	plt.contourf(recall, precision, np.stack(f1s[n]).std(0))
	plt.figure()
	plt.show()



	if __name__ == "__main__": main()