jondkelley · August 29, 2018 06:44
diff --git a/twitter_follow.py b/twitter_follow.py
 #!/usr/bin/env python3
 # -*- coding: utf-8 -*-
 """A tool to fetch limit N number of twitter posts from twitter handle

 Usage:
    twitter_follow --handle HANDLE [--limit NUMBER]
    twitter_follow -h

 Options:
    -h                                                 show help
    --handle HANDLE                                    twitter handle to follow
    --limit NUMBER                                      number of retweets to show
                                                       [default: 40]
 Dependecies:
   pip install twitter_scraper
   pip install docopt

 Example:
   twitter_follow --handle realdonaldtrump --limit 1

 Example Output:
    [
       {
          "tweetId": 1034445783876161536,
          "time": "2018-08-28 10:21:08",
          "text": "I smile at Senators and others talking about how good free trade ...",
          "replies": 12940,
          "retweets": 21697,
          "likes": 78424,
          "entries": {
             "hashtags": [],
             "urls": [],
             "photos": [],
             "videos": []
          },
          "timeEpoch": 1535466068,
          "textLength": 273,
          "stackId": 13
       }
    ]
 """

 from itertools import islice
 from json import dumps
 from operator import itemgetter
 import datetime
 from twitter_scraper import get_tweets

 class TooManyRequestedTweets(Exception):
    """
    gets raised when more then 40 tweets, the limit per page!
    """
    pass

 class TwitterAdapter(object):
    """
    simple adapter class to utilize twitter_scraper and pull out tweets in various forms
    """
    def __init__(self, handle, num_items=40, reverse=True):
        if num_items > 40:
            raise TooManyRequestedTweets("Can't specify more then 40 tweets")
        self.handle = handle
        self.num_items = num_items
        self.reverse = reverse
        self.raw = self.retrieve()

    def transform_tweet(self, tweetitem):
        """
        performs useful transformations on tweet properties
        """
        for k, v in tweetitem.items():
            if k == "text":
                # replace pic url with secure pic url
                v = v.replace("\u00a0pic.twitter.com", " https://pic.twitter.com")
            tweetitem[k] = v

        # rename time as timeEpoch
        # convert items to integers
        tweetitem['timeEpoch'] = int(tweetitem['time'])
        tweetitem['tweetId'] = int(tweetitem['tweetId'])
        tweetitem['textLength'] = len(tweetitem['text'])
        return tweetitem

    def retrieve(self):
        """
        retrieves a block of up to 40 tweets
        """
        tweets = []
        tfeed = get_tweets(self.handle, pages=1)
        for tweet in tfeed:
            tweetitem = {}
            for k, v in tweet.items():
                if k == "time":
                    # convert dt to epoch
                    v = v.strftime('%s')
                tweetitem[k] = v
            # common transforms
            tweetitem = self.transform_tweet(tweetitem)
            # convert time field to datetime
            tweetitem['time'] = datetime.datetime.fromtimestamp(tweetitem['timeEpoch']).strftime('%Y-%m-%d %H:%M:%S')
            tweetitem['entries'] = {}
            # copy over sub-entries
            tweetitem['entries']['hashtags'] = tweet['entries']['hashtags']
            tweetitem['entries']['urls'] = tweet['entries']['urls']
            tweetitem['entries']['photos'] = tweet['entries']['photos']
            tweetitem['entries']['videos'] = tweet['entries']['videos']
            tweets.append(tweetitem)

        # sort list by epoch newest first
        tweets = sorted(tweets, key=itemgetter('time'), reverse=self.reverse)
        # restrict list to first length of self.num_items
        tweets = [k for k in islice(tweets, self.num_items)]
        # append incremental stackId to list of tweets
        for x in tweets:
            i = tweets.index(x)
            tweets[i]['stackId'] = i + 1
        return tweets

    @property
    def dict(self):
        """
        returns twitter stream as dictionary
        """
        return self.raw

    @property
    def json(self):
        """
        returns twitter stream as json
        """
        return dumps(self.raw, indent=2)

    @property
    def limit(self):
        """
        returns twitter stream limit object as dictionary
        """
        return self.raw[0]

 def main():
    """parse first arguement to call specific functions"""

    args = docopt(__doc__, version='0.0.0', options_first=True)

    handle = args.get('--handle')
    limit = int(args.get('--limit'))
    twitter = TwitterAdapter(handle=handle, num_items=limit)
    print(twitter.json)

 if __name__ == '__main__':
    from docopt import docopt
    main()
	#!/usr/bin/env python3
	# -- coding: utf-8 --
	"""A tool to fetch limit N number of twitter posts from twitter handle

	Usage:
	twitter_follow --handle HANDLE [--limit NUMBER]
	twitter_follow -h

	Options:
	-h show help
	--handle HANDLE twitter handle to follow
	--limit NUMBER number of retweets to show
	[default: 40]
	Dependecies:
	pip install twitter_scraper
	pip install docopt

	Example:
	twitter_follow --handle realdonaldtrump --limit 1

	Example Output:
	[
	{
	"tweetId": 1034445783876161536,
	"time": "2018-08-28 10:21:08",
	"text": "I smile at Senators and others talking about how good free trade ...",
	"replies": 12940,
	"retweets": 21697,
	"likes": 78424,
	"entries": {
	"hashtags": [],
	"urls": [],
	"photos": [],
	"videos": []
	},
	"timeEpoch": 1535466068,
	"textLength": 273,
	"stackId": 13
	}
	]
	"""

	from itertools import islice
	from json import dumps
	from operator import itemgetter
	import datetime
	from twitter_scraper import get_tweets

	class TooManyRequestedTweets(Exception):
	"""
	gets raised when more then 40 tweets, the limit per page!
	"""
	pass

	class TwitterAdapter(object):
	"""
	simple adapter class to utilize twitter_scraper and pull out tweets in various forms
	"""
	def __init__(self, handle, num_items=40, reverse=True):
	if num_items > 40:
	raise TooManyRequestedTweets("Can't specify more then 40 tweets")
	self.handle = handle
	self.num_items = num_items
	self.reverse = reverse
	self.raw = self.retrieve()

	def transform_tweet(self, tweetitem):
	"""
	performs useful transformations on tweet properties
	"""
	for k, v in tweetitem.items():
	if k == "text":
	# replace pic url with secure pic url
	v = v.replace("\u00a0pic.twitter.com", " https://pic.twitter.com")
	tweetitem[k] = v

	# rename time as timeEpoch
	# convert items to integers
	tweetitem['timeEpoch'] = int(tweetitem['time'])
	tweetitem['tweetId'] = int(tweetitem['tweetId'])
	tweetitem['textLength'] = len(tweetitem['text'])
	return tweetitem

	def retrieve(self):
	"""
	retrieves a block of up to 40 tweets
	"""
	tweets = []
	tfeed = get_tweets(self.handle, pages=1)
	for tweet in tfeed:
	tweetitem = {}
	for k, v in tweet.items():
	if k == "time":
	# convert dt to epoch
	v = v.strftime('%s')
	tweetitem[k] = v
	# common transforms
	tweetitem = self.transform_tweet(tweetitem)
	# convert time field to datetime
	tweetitem['time'] = datetime.datetime.fromtimestamp(tweetitem['timeEpoch']).strftime('%Y-%m-%d %H:%M:%S')
	tweetitem['entries'] = {}
	# copy over sub-entries
	tweetitem['entries']['hashtags'] = tweet['entries']['hashtags']
	tweetitem['entries']['urls'] = tweet['entries']['urls']
	tweetitem['entries']['photos'] = tweet['entries']['photos']
	tweetitem['entries']['videos'] = tweet['entries']['videos']
	tweets.append(tweetitem)

	# sort list by epoch newest first
	tweets = sorted(tweets, key=itemgetter('time'), reverse=self.reverse)
	# restrict list to first length of self.num_items
	tweets = [k for k in islice(tweets, self.num_items)]
	# append incremental stackId to list of tweets
	for x in tweets:
	i = tweets.index(x)
	tweets[i]['stackId'] = i + 1
	return tweets

	@property
	def dict(self):
	"""
	returns twitter stream as dictionary
	"""
	return self.raw

	@property
	def json(self):
	"""
	returns twitter stream as json
	"""
	return dumps(self.raw, indent=2)

	@property
	def limit(self):
	"""
	returns twitter stream limit object as dictionary
	"""
	return self.raw[0]

	def main():
	"""parse first arguement to call specific functions"""

	args = docopt(__doc__, version='0.0.0', options_first=True)

	handle = args.get('--handle')
	limit = int(args.get('--limit'))
	twitter = TwitterAdapter(handle=handle, num_items=limit)
	print(twitter.json)

	if __name__ == '__main__':
	from docopt import docopt
	main()