$ zless Allele.bcp.gz| cut -f2 | awk '{print length($1)}' | sort -n | uniq -c > dbsnp_allele_length_count.txt
1 0
24 1
105 2
174 3
2046 4
3503 5
9223 6
25570 7
76348 8
192014 9
287834 10
296919 11
293199 12
238354 13
204385 14
168283 15
138982 16
110110 17
109025 18
82524 19
84094 20
67558 21
52388 22
38785 23
45368 24
31759 25
30558 26
24916 27
26157 28
19067 29
21279 30
14374 31
16454 32
11448 33
11568 34
9378 35
11532 36
7870 37
8626 38
6742 39
8417 40
5840 41
6944 42
4688 43
6085 44
4976 45
3884 46
3406 47
4488 48
2784 49
2934 50
2448 51
2840 52
2087 53
2690 54
1993 55
2386 56
1844 57
2618 58
1988 59
2714 60
1557 61
1871 62
1610 63
1930 64
1280 65
1717 66
1164 67
1563 68
1134 69
1418 70
972 71
1469 72
884 73
1095 74
931 75
1128 76
732 77
1052 78
644 79
964 80
674 81
646 82
410 83
541 84
283 85
380 86
320 87
333 88
288 89
476 90
291 91
343 92
324 93
272 94
210 95
384 96
220 97
312 98
273 99
336 100
176 101
284 102
154 103
226 104
234 105
196 106
178 107
348 108
190 109
210 110
155 111
240 112
144 113
220 114
154 115
228 116
141 117
192 118
142 119
254 120
155 121
158 122
132 123
211 124
152 125
216 126
102 127
187 128
137 129
154 130
105 131
210 132
126 133
198 134
200 135
158 136
108 137
145 138
78 139
163 140
82 141
128 142
82 143
162 144
89 145
112 146
128 147
180 148
120 149
161 150
106 151
132 152
102 153
116 154
72 155
128 156
80 157
92 158
70 159
139 160
54 161
166 162
62 163
128 164
100 165
82 166
80 167
128 168
86 169
96 170
98 171
102 172
96 173
122 174
84 175
126 176
124 177
88 178
82 179
156 180
102 181
88 182
106 183
96 184
82 185
100 186
78 187
80 188
124 189
108 190
88 191
132 192
66 193
94 194
134 195
132 196
86 197
126 198
100 199
166 200
134 201
160 202
158 203
156 204
158 205
150 206
148 207
168 208
150 209
210 210
132 211
158 212
166 213
128 214
126 215
116 216
104 217
110 218
86 219
98 220
92 221
90 222
84 223
114 224
72 225
74 226
86 227
80 228
52 229
52 230
62 231
72 232
54 233
96 234
110 235
88 236
36 237
88 238
52 239
94 240
52 241
50 242
64 243
54 244
98 245
48 246
74 247
56 248
38 249
74 250
50 251
102 252
48 253
18 254
3851 255
13 256
11 257
3 258
8 259
9 260
3 261
6 262
9 263
17 264
4 265
7 266
12 267
6 268
8 269
16 270
3 271
9 272
8 273
12 274
8 275
12 276
4 277
12 278
9 279
13 280
14 281
12 282
8 283
11 284
16 285
10 286
8 287
14 288
18 289
11 290
12 291
9 292
7 293
9 294
11 295
12 296
7 297
8 298
10 299
16 300
16 301
5 302
20 303
11 304
20 305
19 306
29 307
19 308
23 309
36 310
38 311
39 312
30 313
44 314
54 315
43 316
53 317
56 318
55 319
35 320
43 321
48 322
50 323
44 324
28 325
41 326
43 327
41 328
34 329
35 330
27 331
23 332
21 333
16 334
26 335
26 336
14 337
19 338
14 339
18 340
11 341
13 342
11 343
13 344
10 345
4 346
9 347
7 348
9 349
6 350
9 351
8 352
8 353
10 354
8 355
4 356
5 357
4 358
4 359
8 360
8 361
5 362
5 363
6 364
4 365
3 366
7 367
6 368
7 369
7 370
4 371
6 372
3 373
5 374
3 375
3 376
7 377
6 378
4 379
8 380
3 381
5 382
3 383
5 384
7 385
7 386
5 387
6 388
1 389
3 390
4 391
8 392
5 393
5 394
6 395
5 396
6 397
4 398
2 399
8 400
1 401
6 402
7 403
4 404
4 405
2 406
6 408
4 409
2 410
5 411
5 412
2 413
5 414
2 415
7 416
8 417
3 418
5 419
13 420
5 421
4 422
6 423
4 424
7 425
4 426
1 427
3 428
4 429
3 430
5 431
3 432
6 433
7 434
6 435
3 436
2 437
3 438
4 439
9 440
3 441
7 442
5 443
7 444
6 445
1 446
7 447
9 448
3 449
10 450
4 451
3 452
6 453
8 454
3 455
3 456
3 457
3 458
4 459
6 460
6 461
7 462
5 463
5 464
5 465
6 466
5 467
6 468
4 469
5 470
2 471
5 472
5 473
4 474
7 475
7 476
4 477
6 478
3 479
6 480
1 481
2 482
3 483
5 484
5 485
5 486
5 487
7 488
5 489
3 490
7 491
4 492
8 493
2 494
3 495
7 496
7 497
1 498
6 499
6 500
1 501
7 502
6 503
4 504
4 505
3 506
3 508
7 509
6 510
8 511
4 512
5 513
8 514
3 515
2 516
2 517
2 518
4 519
6 520
5 521
4 522
3 523
1 524
6 525
2 526
1 527
2 528
3 529
4 530
2 531
4 532
3 533
3 534
4 535
5 536
2 537
3 538
2 539
10 540
5 541
7 542
1 543
3 544
8 545
1 546
7 547
2 548
7 549
2 550
4 551
3 552
5 553
3 554
1 555
4 556
4 557
1 558
3 559
5 560
2 561
4 562
3 564
3 565
5 566
3 567
8 568
2 569
8 570
2 571
5 572
4 573
3 574
2 575
4 576
3 577
1 578
2 579
3 580
1 581
6 582
1 583
1 584
2 585
1 586
4 587
6 588
1 589
2 590
1 591
2 592
1 593
4 594
5 595
8 596
5 597
2 598
3 599
4 600
1 601
3 602
5 603
2 604
1 605
3 606
3 607
1 608
3 609
1 610
4 611
4 612
2 613
2 614
5 615
2 616
3 617
2 618
3 619
2 621
1 623
4 624
3 625
2 626
5 627
6 629
3 630
3 631
7 632
3 633
3 635
2 636
2 637
4 638
4 639
4 640
2 641
1 642
2 643
3 644
8 645
2 646
1 647
8 648
2 649
3 650
1 651
2 652
5 653
3 654
3 655
2 656
2 657
3 658
4 660
4 661
2 662
4 663
2 664
3 665
5 666
1 667
5 668
2 669
1 670
3 671
7 672
4 673
3 674
1 675
4 678
5 679
1 680
4 681
5 682
4 683
4 684
2 685
2 686
1 687
1 689
2 690
1 691
5 692
4 693
2 694
2 695
1 696
1 698
1 699
6 700
2 701
3 702
2 703
4 704
2 705
4 706
2 707
1 708
2 709
5 710
3 711
4 712
1 713
3 714
4 715
2 716
4 717
2 718
5 719
4 720
1 721
2 722
1 723
6 724
2 725
1 726
2 728
2 729
9 730
3 732
2 733
2 734
3 736
1 737
2 738
1 739
3 740
3 741
3 742
2 743
5 744
2 745
1 746
2 747
5 748
2 749
2 750
1 752
1 753
2 755
3 756
3 757
2 758
4 759
4 760
7 761
2 762
1 763
3 764
3 765
3 766
5 767
8 768
3 769
3 770
2 772
1 773
2 774
4 775
1 776
1 777
4 778
4 779
6 780
6 781
1 782
2 783
3 784
3 785
2 786
1 787
3 788
2 790
3 791
2 792
2 793
1 794
1 795
4 796
3 797
1 798
1 799
3 800
1 801
3 802
5 804
5 805
3 806
5 807
7 808
1 809
4 810
2 811
1 813
2 814
3 815
5 816
2 817
3 819
3 820
3 821
2 822
6 823
2 824
2 825
4 826
3 828
3 829
1 830
2 831
1 833
2 834
1 835
2 836
4 837
1 839
4 840
1 842
5 843
5 844
1 845
4 846
3 847
4 848
1 849
5 850
1 851
4 853
2 854
3 856
5 858
3 859
3 860
4 863
6 864
3 865
1 866
1 867
5 868
1 869
1 870
4 871
4 872
3 873
3 874
3 876
1 877
4 878
4 879
3 880
1 881
3 882
3 883
4 884
2 885
6 886
3 887
3 888
3 889
1 891
1 893
1 894
1 895
4 896
1 897
4 898
3 899
5 900
2 901
3 902
1 903
2 904
3 905
3 906
1 908
1 909
2 910
2 911
4 912
5 913
5 914
2 915
2 916
3 917
2 918
3 919
7 920
1 921
3 922
2 923
3 924
1 926
2 927
3 928
4 929
2 930
4 931
3 933
2 934
2 935
2 936
3 937
2 938
1 939
2 940
2 941
3 942
2 943
1 944
1 945
1 946
2 947
1 948
1 949
6 950
2 952
3 953
1 954
2 955
3 956
2 957
4 958
1 959
3 960
1 961
1 962
2 963
1 964
2 965
2 966
2 967
5 969
1 970
2 971
4 972
1 973
9 974
4 975
1 977
1 978
2 979
2 980
3 981
4 984
2 985
1 986
2 987
3 988
5 989
3 990
1 991
2 992
3 993
2 994
3 995
2 996
1 997
2 998
1 999
$ zless Allele.bcp.gz| awk '{if(length($2) == 999) {print}}'
2896117 CTCGGGGCTGCACACCTCTCCCATCGCAGGTCCTGGCACTGCTCTCCGGCACCGAGCTCCCCCTCCCAGGTGGGGCTCAGGCGGTTCCCTGCCCTCCGTCCTTAGACCTCAGCTGAAACCTGAGCTCTCCCCACCACCCGCCCCCGCCAGCCTCTGCACTGCTCCCCACGGGAAGGCCGTTCTCCCTTGGTTTACCGTTCCCTGCGCTTGGCTCGGCCATGTGCACATAGTAGGTGCTTACCACACTCGTGCAATGAACACACAGAGCGGTGCAGGGCCCAGGACAGCGCCTTCCCCACGTGCTCAGGGGGCACAAGGGCGTCCCTCCAAGTCTTGCTCAGGGGCCTCCCAGGGTCCCTGCCCAGCTGTGGGTCCTCACTGAGCACCCGGCGAGGACAGAGTACGGCATCCGTTGGCCTCGATCTCCGGAACAACACGGGCACACGGCCGTCCCAGCCAGCAACGAGAGCCACGAAACAAATCCACCCGGGCTGACTCCCGAAGCCCTCGGACTGTTCCGCCCCACGGACCTCCCGGACCCTCTCTTCCACGGGGAAGACACCGCCCAGCCAGGACCGGGTGTATAAAGAAACGGGATTTCCGTAGGGGCAGGCCGATTTCCCCTGCGGGGCCGAGGGAGGTGTGGGGAGGATTCTGCGCTGGGGGGAGGAGGAGAGGGAGGACGCCTTTCTGCCTGGGAAGGGAAAACGCGCCCCCTCCTGATTGGCATGGCGGGCCGTCCCCCGGGCCCCAGGGCCCTGCCGGGAACGCTCTGGGCTCCCCAAACATGGGGTCTCCGAGCAGTGGGGCCCAGCCTCTGCCTCCGGCGACTGGAGACTCACCTCACCCGCCCAAATCCGCCCCGCTCTCCGACTGGGCCCCGCCTCCCACTGCCCCGCCATCCGCCCACCCTTTCACCGCCCCCTGCGGGCAGCAGGCGCGTCCTGGGGCTGGGCAACCGGGGTGCAGGTTCCGGAGCTGCCAGAGCTGTGAGGGGGA 2013-09-16 16:39:00.0 2896118 assay 2013-09-16 16:39:00.0 CTCGGGGCTGCACACCTCTCCCATCGCAGGTCCTGGCACTGCTCTCCGGCACCGAGCTCCCCCTCCCAGGTGGGGCTCAGGCGGTTCCCTGCCCTCCGTCCTTAGACCTCAGCTGAAACCTGAGCTCTCCCCACCACCCGCCCCCGCCAGCCTCTGCACTGCTCCCCACGGGAAGGCCGTTCTCCCTTGGTTTACCGTTCCCTGCGCTTGGCTCGGCCATGTGCACATAGTAGGTGCTTACCACACTCGTGCAATGAACACACAGAGCGGTGCAGGGCCCAGGACAGCGCCTTCCCCACGTGCTCAGGGGGCACAAGGGCGTCCCTCCAAGTCTTGCTCAGGGGCCTCCCAGGGTCCCTGCCCAGCTGTGGGTCCTCACTGAGCACCCGGCGAGGACAGAGTACGGCATCCGTTGGCCTCGATCTCCGGAACAACACGGGCACACGGCCGTCCCAGCCAGCAACGAGAGCCACGAAACAAATCCACCCGGGCTGACTCCCGAAGCCCTCGGACTGTTCCGCCCCACGGACCTCCCGGACCCTCTCTTCCACGGGGAAGACACCGCCCAGCCAGGACCGGGTGTATAAAGAAACGGGATTTCCGTAGGGGCAGGCCGATTTCCCCTGCGGGGCCGAGGGAGGTGTGGGGAGGATTCTGCGCTGGGGGGAGGAGGAGAGGGAGGACGCCTTTCTGCCTGGGAAGGGAAAACGCGCCCCCTCCTGATTGGCATGGCGGGCCGTCCCCCGGGCCCCAGGGCCCTGCCGGGAACGCTCTGGGCTCCCCAAACATGGGGTCTCCGAGCAGTGGGGCCCAGCCTCTGCCTCCGGCGACTGGAGACTCACCTCACCCGCCCAAATCCGCCCCGCTCTCCGACTGGGCCCCGCCTCCCACTGCCCCGCC