dingmaotu · August 9, 2019 14:51 · dingmaotu · Aug 10, 2019 · andsens · May 28, 2021
diff --git a/fast-remove-redis-keys.py b/fast-remove-redis-keys.py
 # to remove all keys matching a pattern in redis
 # we could use the recommended way: redis-cli --scan --pattern 'abc:*' | xargs redis-cli del
 # but this can be very slow if you have lots of data (like 8G redis cluster)
 # we can use the following script to remove keys (considerably faster)

 import time
 import logging
 from rediscluster import StrictRedisCluster

 logger = logging.getLogger(__name__)
 client = StrictRedisCluster(startup_nodes=hosts, password=password,
                                    skip_full_coverage_check=True)

 pattern = "abc:*"
 start_time = time.time()
 item_count = 0
 batch_size = 100000
 keys = []

 logger.info("Start scanning keys...")

 for k in client.scan_iter(pattern, count=batch_size):
    keys.append(k)
    if len(keys) >= batch_size:
        item_count += len(keys)
        logger.info("batch delete to {} ...".format(item_count))

        client.delete(*keys)
        keys = []

 if len(keys) > 0:
    item_count += len(keys)
    logger.info("batch delete to {}".format(item_count))

    client.delete(*keys)

 end_time = time.time()

 logger.info("deleted {0} keys in {1:0.3f} ms.".format(item_count, (end_time - start_time) / 1000.0))