Skip to content

Instantly share code, notes, and snippets.

@hanabokuro
Last active September 2, 2024 09:20
Show Gist options
  • Save hanabokuro/142344b86c6180f47911c593bacdfda4 to your computer and use it in GitHub Desktop.
Save hanabokuro/142344b86c6180f47911c593bacdfda4 to your computer and use it in GitHub Desktop.
MEGA BIG
元にしたデータ
https://gist.github.com/wadako111/3fcae2e9d283b60fe707e1db64c724c8
総購入数
> wc -l megabig.csv
15984 megabig.csv
出現数字の偏りはなさそう
> cat megabig.csv | sed 's/,/\
/g' | sort | uniq -c
47910 1
47807 2
47925 3
48178 4
重複を探す
15984件購入して 7件重複してる
> sort megabig.csv | uniq -c | sort -nr | head
2 4,4,4,1,1,3,3,3,1,3,1,1
2 4,4,3,4,3,1,2,2,1,3,3,1
2 4,1,2,2,3,1,1,4,4,1,3,2
2 3,1,4,3,2,4,3,1,1,4,1,1
2 2,4,1,3,2,2,1,2,2,2,4,4
2 1,2,1,1,1,4,4,2,4,1,2,1
2 1,1,4,1,4,1,1,2,2,2,4,4
1 4,4,4,4,4,4,3,2,3,4,2,1
出現数字の偏りはないのでありえるパターンは16777216パターン
echo '4 ^ 12' | bc
16777216
重複する確率は 0.095%
echo '15984*100/16777216' | bc --scale 7
.0952720
7件重複ってありえるんだろうか?
MEGA BIG の乱数生成がなんか変な気がする
重複しない可能性は非常に小さいので、重複しても問題なかった
むしろ重複しないと変だった
echo '(1 - 0.001) ^ 15984' | bc --scale 10
.0000001134
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment