Last active
October 11, 2017 19:16
-
-
Save baffioso/0917f7dd447734089b60eabdb4d5ea00 to your computer and use it in GitHub Desktop.
Kategoriser tekst udfra dictionary med kategorier og tilhørende nøgleord
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
# Nøgleord jeg ønsker at søge efter og tagge med key | |
keywords = { | |
'belysning': ['lampe', 'lys', 'mørke'], | |
'affald': ['skrald', 'affald', 'skraldespand'] | |
} | |
# Ekempel på tre beskeder som skal klassificeres | |
msg1 = 'Der ikke lys i lamperne i Ballerup' | |
msg2 = 'De flyder med affald i gågaden' | |
msg3 = 'Der ikke lys og den skraldespand' | |
msg4 = 'Det sner i Afrika' | |
# Funktion til at bestemme om en besked indeholder nøgleord | |
def classify(msg, keywords): | |
categories = [] | |
for cat, words in keywords.items(): | |
if any(word in msg.split(' ') for word in words): | |
categories.append( cat ) | |
else: | |
None | |
return categories | |
print(classify(msg1, keywords)) | |
print(classify(msg2, keywords)) | |
print(classify(msg3, keywords)) | |
print(classify(msg4, keywords)) |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment