Skip to content

Instantly share code, notes, and snippets.

@dsoares
Created March 6, 2014 20:00
Show Gist options
  • Save dsoares/9398179 to your computer and use it in GitHub Desktop.
Save dsoares/9398179 to your computer and use it in GitHub Desktop.
Some project report.

Relatórios Síntese







2014-03-04

Principais atividades executadas

  • Voxx OSD contract interpretation; use the module opensearch.
  • Get used with the VoxxREST service.
  • Top N words from Paulo Portas's quotes.
    • use of CountVectorizer and TfidfVectorizer.
    • variations with uni-grams, bi-grams and a tokenizer with stemming.

Dificuldades

  • Adapting to python flexibility.
  • Too many modules mixed!
  • stemming this way, does not use stop_words.

Oportunidades

Prioridades para o período seguinte

  • Improve stemming: remove stop_words before stemming.
  • Where do this words come from? Show the quotes where this words come from.
  • A timeline with the top words (linked to their quotes)? How to relate to the quote date?

2014-02-25

Principais atividades executadas

  • Implementação de bibliotecas para acesso ao SAPO Services.
    • extensão da classe python sugerida no próprio site para outros serviços sapoServices
  • Testes com os feeds do Voxx

Dificuldades

Oportunidades

  • Módulos em Python

Prioridades para o período seguinte

2014-02-19

Principais atividades executadas

  • scikit-learn tutorial part 1: "Learning and predicting".
  • scikit-learn tutorial part 4: "Feature Extraction".

Dificuldades

Oportunidades

Prioridades para o período seguinte

2014-02-01

Principais atividades executadas

  • Algumas leituras do livro "Python for Data Analysis".
  • Introdução a:
    • pandas: provides data structures
    • scikit-learn: machine learning (classif, regress, clust, ...)
    • numpy: scientific computing
    • scipy: scientific computing

Dificuldades

Oportunidades

Prioridades para o período seguinte

until_date

Principais atividades executadas

Dificuldades

Oportunidades

Prioridades para o período seguinte

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment