Last active
September 16, 2021 22:34
-
-
Save azengard/37208378fae75154f0ada88a5743331e to your computer and use it in GitHub Desktop.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
""" | |
13. wordcount | |
Este desafio é um programa que conta palavras de um arquivo qualquer de duas | |
formas diferentes. | |
A. Lista todas as palavras por ordem alfabética indicando suas ocorrências. | |
Ou seja... | |
Dado um arquivo letras.txt contendo as palavras: A a C c c B b b B | |
Quando você executa o programa: python wordcount.py --count letras.txt | |
Ele deve imprimir todas as palavras em ordem alfabética seguidas | |
do número de ocorrências. | |
Por exemplo: | |
$ python wordcount.py --count letras.txt | |
a 2 | |
b 4 | |
c 3 | |
B. Lista as 20 palavras mais frequêntes indicando suas ocorrências. | |
Ou seja... | |
Dado um arquivo letras.txt contendo as palavras: A a C c c B b b B | |
Quando você executa o programa: python wordcount.py --topcount letras.txt | |
Ele deve imprimir as 20 palavras mais frequêntes seguidas | |
do número de ocorrências, em ordem crescente de ocorrências. | |
Por exemplo: | |
$ python wordcount.py --topcount letras.txt | |
b 4 | |
c 3 | |
a 2 | |
Abaixo já existe um esqueleto do programa para você preencher. | |
Você encontrará a função main() chama as funções print_words() e | |
print_top() de acordo com o parâmetro --count ou --topcount. | |
Seu trabalho é implementar as funções print_words() e depois print_top(). | |
""" | |
import sys | |
from collections import Counter | |
def _word_count(filename): | |
with open(filename, 'r') as file: | |
file = file.read().lower().split() | |
words = Counter(file) | |
return words | |
def _print_elements(words): | |
for key, value in words: | |
print(f'{key} {value}') | |
def print_words(filename): | |
words = _word_count(filename) | |
words = sorted(words.items()) | |
_print_elements(words) | |
def print_top(filename): | |
words = _word_count(filename) | |
_print_elements(words.most_common(20)) | |
# A função abaixo chama print_words() ou print_top() de acordo com os | |
# parêtros do programa. | |
def main(): | |
if len(sys.argv) != 3: | |
print('Utilização: ./wordcount.py {--count | --topcount} file') | |
sys.exit(1) | |
option = sys.argv[1] | |
filename = sys.argv[2] | |
if option == '--count': | |
print_words(filename) | |
elif option == '--topcount': | |
print_top(filename) | |
else: | |
print('unknown option: ' + option) | |
sys.exit(1) | |
if __name__ == '__main__': | |
main() |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment