DerekHawkins

Technical SEO specialist. Emphasis on SEO, unstructured data analytics and linguistic research. Repositories subject to alterations or removal.

DerekHawkins / log_file_analysis_3.py

Created July 28, 2021 17:44

	import socket
	log_file = pd.read_pickle('log.pkl')
	log_file = log_file.ip_address.apply(lambda ip: socket.gethostbyaddr(ip)[0])

	# Alternative
	from crawlerdetect import CrawlerDetect
	crawler_detect = CrawlerDetect()
	validate = []
	for crawl in log_file.user_agent:
	data = {'valid':crawler_detect.isCrawler(crawl),

DerekHawkins / log_file_analysis_1.py

Created July 28, 2021 17:43

	# Approach takes into consideration multiple log files stored locally with a .gz format
	log_file_slugs = os.listdir(r'C:\Users\Derek.Hawkins\Log File Analysis Folder')
	log_file_slugs = [x for x in log_file_slugs if '.gz' in x]
	main = []
	for i in log_file_slugs:
	with gzip.open(r'C:\Users\Derek.Hawkins\Log File Analysis\{}'.format(i),'r') as fin:
	for line in tqdm(fin):
	try:
	main.append(log_parse(line.decode()))
	except AttributeError as e:

DerekHawkins / log_file_analysis_1.py

Created July 28, 2021 17:42

	def log_parse(data):
	# Response Size
	try:
	size = re.search(r'[0-9] (\d{1,4})', data).group(1)
	except AttributeError as e:
	size = 'n/a'

	# Server Response
	try:
	server_response = re.search(r'http.*?[\"]', data).group(0).replace('"', '')

DerekHawkins / semantic_keyword_research_2.py

Created February 3, 2021 01:46

	term = input('What keyword would you like to explore?')
	df1 = pd.DataFrame(parse_response(requests.get(build_seo_urls(phrase=term)).content))

	try:
	keyword_list = secondary_layer(crawl_urls=df1['Url'])
	except KeyError as e:
	raise Exception("The keyword you have inputted is either not in SEMrush's database or your input was incorrectly submitted. Please rerun and try again.")

	third_layer = third_layer_setup(second_layer_kw=keyword_list)
	third_layer = third_layer.merge(keyword_list[['Keyword','Search Volume', 'CPC', 'Competition']], on="Keyword", how='left')

DerekHawkins / semantic_keyword_research_1.py

Created February 3, 2021 01:44

	### Import Libraries ###

	import urllib
	import requests
	import pandas as pd
	from tqdm.notebook import tqdm
	from urllib.parse import urlparse

	### Load API Key
	api_key = ''

DerekHawkins / htz_search_comparison.py

Created June 10, 2020 18:19

Example of how to take search interest around multiple keywords and align it to stock activity

	import pandas as pd
	from time import sleep
	from random import randint
	from tqdm import notebook as tqdm

	### Import Modules and Set Perimeters for Pytrends ###
	from pytrends.request import TrendReq

	### For Ticker Information
	import yfinance as yf

DerekHawkins / core_web_vitals_analysis_example.py

Created June 1, 2020 13:47

core_web_vitals_analysis_example.py

DerekHawkins / kwpt_forecast.py

Created April 20, 2020 17:54

	# for Plotly API Credentials, create a json file with credentials
	import json
	with open('path_to_credentials.json') as f:
	creds = json.load(f)

	# Essentials
	import math
	x = float('nan')
	import pandas as pd
	import numpy as np

DerekHawkins / google_trends.py

Last active April 23, 2020 18:13

	# Essentials
	import pandas as pd
	import numpy as np
	from time import sleep
	from random import randint

	# Trends API
	from pytrends.request import TrendReq

	# Optional

DerekHawkins / navigation.py

Created September 17, 2019 14:51

	data_list_mobile = []
	firstContent_mobile = str(response["lighthouseResult"]['audits']['first-contentful-paint']['displayValue'])
	timetoInteractive_mobile = str(response["lighthouseResult"]['audits']['interactive']['displayValue'])
	speedData_mobile = str(response["lighthouseResult"]['audits']['speed-index']['displayValue'])
	data_list_mobile.append((firstContent_mobile, timetoInteractive_mobile, speedData_mobile))