axiaoxin · May 12, 2017 08:54 · axiaoxin · May 12, 2017
diff --git a/get_uncontinue_id_range.py b/get_uncontinue_id_range.py
 In [25]: from itertools import groupby

 In [26]: f = open('Fattrid.csv')

 In [27]: lines = f.readlines()

 In [28]: f.close()

 In [29]: ids = sorted([int(line.split()[0]) for line in lines])

 In [30]: fun = lambda (i, v): v - i

 In [31]: c_ids_list = []

 In [32]: for k, g in groupby(enumerate(ids), fun):
    ...:     c_ids = [v for i, v in g]
    ...:     c_ids_list.append(c_ids)
    ...:
 In [35]: for i, l in enumerate(c_ids_list):
    ...:     if i >= len(c_ids_list)-1:break
    ...:     if c_ids_list[i+1][0] - c_ids_list[i][-1] > 1000:
    ...:         print '[%s, %s]' %(c_ids_list[i][-1]+1,  c_ids_list[i+1][0]-1)
    ...:
 [922, 9043]
 [16182, 36999]
 [38000, 49999]
 [680119, 1999999]
 [2236283, 2339999]
	In [25]: from itertools import groupby

	In [26]: f = open('Fattrid.csv')

	In [27]: lines = f.readlines()

	In [28]: f.close()

	In [29]: ids = sorted([int(line.split()[0]) for line in lines])

	In [30]: fun = lambda (i, v): v - i

	In [31]: c_ids_list = []

	In [32]: for k, g in groupby(enumerate(ids), fun):
	...: c_ids = [v for i, v in g]
	...: c_ids_list.append(c_ids)
	...:
	In [35]: for i, l in enumerate(c_ids_list):
	...: if i >= len(c_ids_list)-1:break
	...: if c_ids_list[i+1][0] - c_ids_list[i][-1] > 1000:
	...: print '[%s, %s]' %(c_ids_list[i][-1]+1, c_ids_list[i+1][0]-1)
	...:
	[922, 9043]
	[16182, 36999]
	[38000, 49999]
	[680119, 1999999]
	[2236283, 2339999]