TODO: Write a project description
TODO: Describe the installation process
Comment: Sobreviva a luta com o inglês, resista, bata de frente e dê um jeito de ler — nem que tenha que usar o google translator (arrck!). Estou tentando compartilhar o máximo de coisas na nossa língua nativa... mas você, caro pythoneiro, sabe como é, não é? O inglês americano é língua padrão pra desenvolvimento de código, documentação e outras maravilhas do mundo da computação. Dê um jeito no seu inglês! — eu preciso dar um jeito no meu.
Comment: Você precisa das dependências do Pygame, inclusive ele, no seu ambiente de desenvolvimento. Pra instalar pode usar pip, apt-get, pacman, yum ou qualquer que seja o gerenciador de pacotes que você usa. Ou você pode baixar o source e instalar por si mesmo (_hard-inst
| #!/bin/bash | |
| # | |
| # This script syncronize a repository forked. | |
| # | |
| # Deliright @ Manoel Vilela | |
| # | |
| # The original source: https://help.github.com/articles/syncing-a-fork/ | |
| # | |
| # Warning: THIS A UNTESTED SCRIPT! IF YOU HAVE PROBLEMS, TRY READ THE STDOUT! |
| #!/bin/bash | |
| # | |
| # Created by Manoel Vilela | |
| # | |
| ssh_setup() { | |
| eval "$(ssh-agent -s)" | |
| ssh-add ~/.ssh/id_rsa | |
| ssh -T git@github.com | |
| } |
| #!/usr/bin/env bash | |
| # A command to get the keycodes of your keyboard and configure your ~/.Xmodmap | |
| # I used that for configure my multimedia-keys on XFCE4 @ Manjaro | |
| xev | grep -A2 --line-buffered '^KeyRelease' | sed -n '/keycode /s/^.*keycode \([0-9]*\).* (.*, \(.*\)).*$/\1 \2/p' | |
| # [e.g.: ~/.Xmodmap | |
| # keycode 162 = XF86AudioPlay | |
| # keycode 164 = XF86AudioStop |
| #!/usr/bin/env bash | |
| # | |
| # Bash Script | |
| # | |
| # Copyright © Manoel Vilela | |
| # | |
| # | |
| find . -iname .git -exec bash -c \ | |
| "cat '{}/config' | \ |
| #!/usr/bin/env python | |
| # | |
| # Python Script | |
| # | |
| # Copyright © Juca Crispim | |
| # | |
| # original source: https://goo.gl/NhfKET | |
| import math | |
| import nltk |
| #!/usr/bin/env python | |
| # | |
| # Python Script | |
| # | |
| # Copyleft © Manoel Vilela | |
| # | |
| # | |
| # complexity time: O(n x m) |
| #!/usr/bin/env bash | |
| # | |
| # Bash Script | |
| # | |
| # Copyright © Manoel Vilela | |
| # | |
| # | |
| from requests import get | |
| from bs4 import BeautifulSoup |
Descrição: Dado um conjunto de documentos, com esse tipo de algoritmo conseguimos uma distribuição de keywords como tópicos para cada documento individual, na qual é ordenado pela sua probabilidade. Podemos definir que o tópico mais provável daquele post é o que tem maior score após o treinamento do modelo LDA.
Prós: Conseguimos um conjunto de tokens para categorizar um post/comment. Como os tópicos são genérico e um tópico tem a tendência de ser categorizado por um documento mais de uma vez, é possível pensar em clusterização de documentos a partir desses tópicos — muito mais facilmente que abordagem anterior usando expressões regulares capitalizadas. Como a análise de criação de tópicos é global, podemos ter inferências de assuntos, pois não necessariamente as keywords (tokens) do tópico mais provavél estarão todas no documento, pode haver mais. (veja no exemplo)
Contras: Precisamos definir antes de rodar o algoritmo quantos tópicos queremos gerar num conjunto de documentos. Um conjun