TODO: Write a project description
TODO: Describe the installation process
Comment: Sobreviva a luta com o inglês, resista, bata de frente e dê um jeito de ler — nem que tenha que usar o google translator (arrck!). Estou tentando compartilhar o máximo de coisas na nossa língua nativa... mas você, caro pythoneiro, sabe como é, não é? O inglês americano é língua padrão pra desenvolvimento de código, documentação e outras maravilhas do mundo da computação. Dê um jeito no seu inglês! — eu preciso dar um jeito no meu.
Comment: Você precisa das dependências do Pygame, inclusive ele, no seu ambiente de desenvolvimento. Pra instalar pode usar pip, apt-get, pacman, yum ou qualquer que seja o gerenciador de pacotes que você usa. Ou você pode baixar o source e instalar por si mesmo (_hard-inst
#!/bin/bash | |
# | |
# This script syncronize a repository forked. | |
# | |
# Deliright @ Manoel Vilela | |
# | |
# The original source: https://help.github.com/articles/syncing-a-fork/ | |
# | |
# Warning: THIS A UNTESTED SCRIPT! IF YOU HAVE PROBLEMS, TRY READ THE STDOUT! |
#!/bin/bash | |
# | |
# Created by Manoel Vilela | |
# | |
ssh_setup() { | |
eval "$(ssh-agent -s)" | |
ssh-add ~/.ssh/id_rsa | |
ssh -T [email protected] | |
} |
#!/usr/bin/env bash | |
# A command to get the keycodes of your keyboard and configure your ~/.Xmodmap | |
# I used that for configure my multimedia-keys on XFCE4 @ Manjaro | |
xev | grep -A2 --line-buffered '^KeyRelease' | sed -n '/keycode /s/^.*keycode \([0-9]*\).* (.*, \(.*\)).*$/\1 \2/p' | |
# [e.g.: ~/.Xmodmap | |
# keycode 162 = XF86AudioPlay | |
# keycode 164 = XF86AudioStop |
#!/usr/bin/env bash | |
# | |
# Bash Script | |
# | |
# Copyright © Manoel Vilela | |
# | |
# | |
find . -iname .git -exec bash -c \ | |
"cat '{}/config' | \ |
#!/usr/bin/env python | |
# | |
# Python Script | |
# | |
# Copyright © Juca Crispim | |
# | |
# original source: https://goo.gl/NhfKET | |
import math | |
import nltk |
#!/usr/bin/env python | |
# | |
# Python Script | |
# | |
# Copyleft © Manoel Vilela | |
# | |
# | |
# complexity time: O(n x m) |
#!/usr/bin/env bash | |
# | |
# Bash Script | |
# | |
# Copyright © Manoel Vilela | |
# | |
# | |
from requests import get | |
from bs4 import BeautifulSoup |
Descrição: Dado um conjunto de documentos, com esse tipo de algoritmo conseguimos uma distribuição de keywords como tópicos para cada documento individual, na qual é ordenado pela sua probabilidade. Podemos definir que o tópico mais provável daquele post é o que tem maior score após o treinamento do modelo LDA.
Prós: Conseguimos um conjunto de tokens para categorizar um post/comment. Como os tópicos são genérico e um tópico tem a tendência de ser categorizado por um documento mais de uma vez, é possível pensar em clusterização de documentos a partir desses tópicos — muito mais facilmente que abordagem anterior usando expressões regulares capitalizadas. Como a análise de criação de tópicos é global, podemos ter inferências de assuntos, pois não necessariamente as keywords (tokens) do tópico mais provavél estarão todas no documento, pode haver mais. (veja no exemplo)
Contras: Precisamos definir antes de rodar o algoritmo quantos tópicos queremos gerar num conjunto de documentos. Um conjun