Skip to content

Instantly share code, notes, and snippets.

@knmkr
Created June 10, 2015 02:07
Show Gist options
  • Select an option

  • Save knmkr/d658fcd50e1555992fe6 to your computer and use it in GitHub Desktop.

Select an option

Save knmkr/d658fcd50e1555992fe6 to your computer and use it in GitHub Desktop.
dbSNP allele length count
$ zless Allele.bcp.gz| cut -f2 | awk '{print length($1)}' | sort -n | uniq -c > dbsnp_allele_length_count.txt     
      1 0
     24 1
    105 2
    174 3
   2046 4
   3503 5
   9223 6
  25570 7
  76348 8
 192014 9
 287834 10
 296919 11
 293199 12
 238354 13
 204385 14
 168283 15
 138982 16
 110110 17
 109025 18
  82524 19
  84094 20
  67558 21
  52388 22
  38785 23
  45368 24
  31759 25
  30558 26
  24916 27
  26157 28
  19067 29
  21279 30
  14374 31
  16454 32
  11448 33
  11568 34
   9378 35
  11532 36
   7870 37
   8626 38
   6742 39
   8417 40
   5840 41
   6944 42
   4688 43
   6085 44
   4976 45
   3884 46
   3406 47
   4488 48
   2784 49
   2934 50
   2448 51
   2840 52
   2087 53
   2690 54
   1993 55
   2386 56
   1844 57
   2618 58
   1988 59
   2714 60
   1557 61
   1871 62
   1610 63
   1930 64
   1280 65
   1717 66
   1164 67
   1563 68
   1134 69
   1418 70
    972 71
   1469 72
    884 73
   1095 74
    931 75
   1128 76
    732 77
   1052 78
    644 79
    964 80
    674 81
    646 82
    410 83
    541 84
    283 85
    380 86
    320 87
    333 88
    288 89
    476 90
    291 91
    343 92
    324 93
    272 94
    210 95
    384 96
    220 97
    312 98
    273 99
    336 100
    176 101
    284 102
    154 103
    226 104
    234 105
    196 106
    178 107
    348 108
    190 109
    210 110
    155 111
    240 112
    144 113
    220 114
    154 115
    228 116
    141 117
    192 118
    142 119
    254 120
    155 121
    158 122
    132 123
    211 124
    152 125
    216 126
    102 127
    187 128
    137 129
    154 130
    105 131
    210 132
    126 133
    198 134
    200 135
    158 136
    108 137
    145 138
     78 139
    163 140
     82 141
    128 142
     82 143
    162 144
     89 145
    112 146
    128 147
    180 148
    120 149
    161 150
    106 151
    132 152
    102 153
    116 154
     72 155
    128 156
     80 157
     92 158
     70 159
    139 160
     54 161
    166 162
     62 163
    128 164
    100 165
     82 166
     80 167
    128 168
     86 169
     96 170
     98 171
    102 172
     96 173
    122 174
     84 175
    126 176
    124 177
     88 178
     82 179
    156 180
    102 181
     88 182
    106 183
     96 184
     82 185
    100 186
     78 187
     80 188
    124 189
    108 190
     88 191
    132 192
     66 193
     94 194
    134 195
    132 196
     86 197
    126 198
    100 199
    166 200
    134 201
    160 202
    158 203
    156 204
    158 205
    150 206
    148 207
    168 208
    150 209
    210 210
    132 211
    158 212
    166 213
    128 214
    126 215
    116 216
    104 217
    110 218
     86 219
     98 220
     92 221
     90 222
     84 223
    114 224
     72 225
     74 226
     86 227
     80 228
     52 229
     52 230
     62 231
     72 232
     54 233
     96 234
    110 235
     88 236
     36 237
     88 238
     52 239
     94 240
     52 241
     50 242
     64 243
     54 244
     98 245
     48 246
     74 247
     56 248
     38 249
     74 250
     50 251
    102 252
     48 253
     18 254
   3851 255
     13 256
     11 257
      3 258
      8 259
      9 260
      3 261
      6 262
      9 263
     17 264
      4 265
      7 266
     12 267
      6 268
      8 269
     16 270
      3 271
      9 272
      8 273
     12 274
      8 275
     12 276
      4 277
     12 278
      9 279
     13 280
     14 281
     12 282
      8 283
     11 284
     16 285
     10 286
      8 287
     14 288
     18 289
     11 290
     12 291
      9 292
      7 293
      9 294
     11 295
     12 296
      7 297
      8 298
     10 299
     16 300
     16 301
      5 302
     20 303
     11 304
     20 305
     19 306
     29 307
     19 308
     23 309
     36 310
     38 311
     39 312
     30 313
     44 314
     54 315
     43 316
     53 317
     56 318
     55 319
     35 320
     43 321
     48 322
     50 323
     44 324
     28 325
     41 326
     43 327
     41 328
     34 329
     35 330
     27 331
     23 332
     21 333
     16 334
     26 335
     26 336
     14 337
     19 338
     14 339
     18 340
     11 341
     13 342
     11 343
     13 344
     10 345
      4 346
      9 347
      7 348
      9 349
      6 350
      9 351
      8 352
      8 353
     10 354
      8 355
      4 356
      5 357
      4 358
      4 359
      8 360
      8 361
      5 362
      5 363
      6 364
      4 365
      3 366
      7 367
      6 368
      7 369
      7 370
      4 371
      6 372
      3 373
      5 374
      3 375
      3 376
      7 377
      6 378
      4 379
      8 380
      3 381
      5 382
      3 383
      5 384
      7 385
      7 386
      5 387
      6 388
      1 389
      3 390
      4 391
      8 392
      5 393
      5 394
      6 395
      5 396
      6 397
      4 398
      2 399
      8 400
      1 401
      6 402
      7 403
      4 404
      4 405
      2 406
      6 408
      4 409
      2 410
      5 411
      5 412
      2 413
      5 414
      2 415
      7 416
      8 417
      3 418
      5 419
     13 420
      5 421
      4 422
      6 423
      4 424
      7 425
      4 426
      1 427
      3 428
      4 429
      3 430
      5 431
      3 432
      6 433
      7 434
      6 435
      3 436
      2 437
      3 438
      4 439
      9 440
      3 441
      7 442
      5 443
      7 444
      6 445
      1 446
      7 447
      9 448
      3 449
     10 450
      4 451
      3 452
      6 453
      8 454
      3 455
      3 456
      3 457
      3 458
      4 459
      6 460
      6 461
      7 462
      5 463
      5 464
      5 465
      6 466
      5 467
      6 468
      4 469
      5 470
      2 471
      5 472
      5 473
      4 474
      7 475
      7 476
      4 477
      6 478
      3 479
      6 480
      1 481
      2 482
      3 483
      5 484
      5 485
      5 486
      5 487
      7 488
      5 489
      3 490
      7 491
      4 492
      8 493
      2 494
      3 495
      7 496
      7 497
      1 498
      6 499
      6 500
      1 501
      7 502
      6 503
      4 504
      4 505
      3 506
      3 508
      7 509
      6 510
      8 511
      4 512
      5 513
      8 514
      3 515
      2 516
      2 517
      2 518
      4 519
      6 520
      5 521
      4 522
      3 523
      1 524
      6 525
      2 526
      1 527
      2 528
      3 529
      4 530
      2 531
      4 532
      3 533
      3 534
      4 535
      5 536
      2 537
      3 538
      2 539
     10 540
      5 541
      7 542
      1 543
      3 544
      8 545
      1 546
      7 547
      2 548
      7 549
      2 550
      4 551
      3 552
      5 553
      3 554
      1 555
      4 556
      4 557
      1 558
      3 559
      5 560
      2 561
      4 562
      3 564
      3 565
      5 566
      3 567
      8 568
      2 569
      8 570
      2 571
      5 572
      4 573
      3 574
      2 575
      4 576
      3 577
      1 578
      2 579
      3 580
      1 581
      6 582
      1 583
      1 584
      2 585
      1 586
      4 587
      6 588
      1 589
      2 590
      1 591
      2 592
      1 593
      4 594
      5 595
      8 596
      5 597
      2 598
      3 599
      4 600
      1 601
      3 602
      5 603
      2 604
      1 605
      3 606
      3 607
      1 608
      3 609
      1 610
      4 611
      4 612
      2 613
      2 614
      5 615
      2 616
      3 617
      2 618
      3 619
      2 621
      1 623
      4 624
      3 625
      2 626
      5 627
      6 629
      3 630
      3 631
      7 632
      3 633
      3 635
      2 636
      2 637
      4 638
      4 639
      4 640
      2 641
      1 642
      2 643
      3 644
      8 645
      2 646
      1 647
      8 648
      2 649
      3 650
      1 651
      2 652
      5 653
      3 654
      3 655
      2 656
      2 657
      3 658
      4 660
      4 661
      2 662
      4 663
      2 664
      3 665
      5 666
      1 667
      5 668
      2 669
      1 670
      3 671
      7 672
      4 673
      3 674
      1 675
      4 678
      5 679
      1 680
      4 681
      5 682
      4 683
      4 684
      2 685
      2 686
      1 687
      1 689
      2 690
      1 691
      5 692
      4 693
      2 694
      2 695
      1 696
      1 698
      1 699
      6 700
      2 701
      3 702
      2 703
      4 704
      2 705
      4 706
      2 707
      1 708
      2 709
      5 710
      3 711
      4 712
      1 713
      3 714
      4 715
      2 716
      4 717
      2 718
      5 719
      4 720
      1 721
      2 722
      1 723
      6 724
      2 725
      1 726
      2 728
      2 729
      9 730
      3 732
      2 733
      2 734
      3 736
      1 737
      2 738
      1 739
      3 740
      3 741
      3 742
      2 743
      5 744
      2 745
      1 746
      2 747
      5 748
      2 749
      2 750
      1 752
      1 753
      2 755
      3 756
      3 757
      2 758
      4 759
      4 760
      7 761
      2 762
      1 763
      3 764
      3 765
      3 766
      5 767
      8 768
      3 769
      3 770
      2 772
      1 773
      2 774
      4 775
      1 776
      1 777
      4 778
      4 779
      6 780
      6 781
      1 782
      2 783
      3 784
      3 785
      2 786
      1 787
      3 788
      2 790
      3 791
      2 792
      2 793
      1 794
      1 795
      4 796
      3 797
      1 798
      1 799
      3 800
      1 801
      3 802
      5 804
      5 805
      3 806
      5 807
      7 808
      1 809
      4 810
      2 811
      1 813
      2 814
      3 815
      5 816
      2 817
      3 819
      3 820
      3 821
      2 822
      6 823
      2 824
      2 825
      4 826
      3 828
      3 829
      1 830
      2 831
      1 833
      2 834
      1 835
      2 836
      4 837
      1 839
      4 840
      1 842
      5 843
      5 844
      1 845
      4 846
      3 847
      4 848
      1 849
      5 850
      1 851
      4 853
      2 854
      3 856
      5 858
      3 859
      3 860
      4 863
      6 864
      3 865
      1 866
      1 867
      5 868
      1 869
      1 870
      4 871
      4 872
      3 873
      3 874
      3 876
      1 877
      4 878
      4 879
      3 880
      1 881
      3 882
      3 883
      4 884
      2 885
      6 886
      3 887
      3 888
      3 889
      1 891
      1 893
      1 894
      1 895
      4 896
      1 897
      4 898
      3 899
      5 900
      2 901
      3 902
      1 903
      2 904
      3 905
      3 906
      1 908
      1 909
      2 910
      2 911
      4 912
      5 913
      5 914
      2 915
      2 916
      3 917
      2 918
      3 919
      7 920
      1 921
      3 922
      2 923
      3 924
      1 926
      2 927
      3 928
      4 929
      2 930
      4 931
      3 933
      2 934
      2 935
      2 936
      3 937
      2 938
      1 939
      2 940
      2 941
      3 942
      2 943
      1 944
      1 945
      1 946
      2 947
      1 948
      1 949
      6 950
      2 952
      3 953
      1 954
      2 955
      3 956
      2 957
      4 958
      1 959
      3 960
      1 961
      1 962
      2 963
      1 964
      2 965
      2 966
      2 967
      5 969
      1 970
      2 971
      4 972
      1 973
      9 974
      4 975
      1 977
      1 978
      2 979
      2 980
      3 981
      4 984
      2 985
      1 986
      2 987
      3 988
      5 989
      3 990
      1 991
      2 992
      3 993
      2 994
      3 995
      2 996
      1 997
      2 998
      1 999
$ zless Allele.bcp.gz| awk '{if(length($2) == 999) {print}}'
2896117 CTCGGGGCTGCACACCTCTCCCATCGCAGGTCCTGGCACTGCTCTCCGGCACCGAGCTCCCCCTCCCAGGTGGGGCTCAGGCGGTTCCCTGCCCTCCGTCCTTAGACCTCAGCTGAAACCTGAGCTCTCCCCACCACCCGCCCCCGCCAGCCTCTGCACTGCTCCCCACGGGAAGGCCGTTCTCCCTTGGTTTACCGTTCCCTGCGCTTGGCTCGGCCATGTGCACATAGTAGGTGCTTACCACACTCGTGCAATGAACACACAGAGCGGTGCAGGGCCCAGGACAGCGCCTTCCCCACGTGCTCAGGGGGCACAAGGGCGTCCCTCCAAGTCTTGCTCAGGGGCCTCCCAGGGTCCCTGCCCAGCTGTGGGTCCTCACTGAGCACCCGGCGAGGACAGAGTACGGCATCCGTTGGCCTCGATCTCCGGAACAACACGGGCACACGGCCGTCCCAGCCAGCAACGAGAGCCACGAAACAAATCCACCCGGGCTGACTCCCGAAGCCCTCGGACTGTTCCGCCCCACGGACCTCCCGGACCCTCTCTTCCACGGGGAAGACACCGCCCAGCCAGGACCGGGTGTATAAAGAAACGGGATTTCCGTAGGGGCAGGCCGATTTCCCCTGCGGGGCCGAGGGAGGTGTGGGGAGGATTCTGCGCTGGGGGGAGGAGGAGAGGGAGGACGCCTTTCTGCCTGGGAAGGGAAAACGCGCCCCCTCCTGATTGGCATGGCGGGCCGTCCCCCGGGCCCCAGGGCCCTGCCGGGAACGCTCTGGGCTCCCCAAACATGGGGTCTCCGAGCAGTGGGGCCCAGCCTCTGCCTCCGGCGACTGGAGACTCACCTCACCCGCCCAAATCCGCCCCGCTCTCCGACTGGGCCCCGCCTCCCACTGCCCCGCCATCCGCCCACCCTTTCACCGCCCCCTGCGGGCAGCAGGCGCGTCCTGGGGCTGGGCAACCGGGGTGCAGGTTCCGGAGCTGCCAGAGCTGTGAGGGGGA     2013-09-16 16:39:00.0   2896118 assay   2013-09-16 16:39:00.0      CTCGGGGCTGCACACCTCTCCCATCGCAGGTCCTGGCACTGCTCTCCGGCACCGAGCTCCCCCTCCCAGGTGGGGCTCAGGCGGTTCCCTGCCCTCCGTCCTTAGACCTCAGCTGAAACCTGAGCTCTCCCCACCACCCGCCCCCGCCAGCCTCTGCACTGCTCCCCACGGGAAGGCCGTTCTCCCTTGGTTTACCGTTCCCTGCGCTTGGCTCGGCCATGTGCACATAGTAGGTGCTTACCACACTCGTGCAATGAACACACAGAGCGGTGCAGGGCCCAGGACAGCGCCTTCCCCACGTGCTCAGGGGGCACAAGGGCGTCCCTCCAAGTCTTGCTCAGGGGCCTCCCAGGGTCCCTGCCCAGCTGTGGGTCCTCACTGAGCACCCGGCGAGGACAGAGTACGGCATCCGTTGGCCTCGATCTCCGGAACAACACGGGCACACGGCCGTCCCAGCCAGCAACGAGAGCCACGAAACAAATCCACCCGGGCTGACTCCCGAAGCCCTCGGACTGTTCCGCCCCACGGACCTCCCGGACCCTCTCTTCCACGGGGAAGACACCGCCCAGCCAGGACCGGGTGTATAAAGAAACGGGATTTCCGTAGGGGCAGGCCGATTTCCCCTGCGGGGCCGAGGGAGGTGTGGGGAGGATTCTGCGCTGGGGGGAGGAGGAGAGGGAGGACGCCTTTCTGCCTGGGAAGGGAAAACGCGCCCCCTCCTGATTGGCATGGCGGGCCGTCCCCCGGGCCCCAGGGCCCTGCCGGGAACGCTCTGGGCTCCCCAAACATGGGGTCTCCGAGCAGTGGGGCCCAGCCTCTGCCTCCGGCGACTGGAGACTCACCTCACCCGCCCAAATCCGCCCCGCTCTCCGACTGGGCCCCGCCTCCCACTGCCCCGCC
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment