- Equipes de 4 pessoas
- Ao final do projeto
- Entrega de relatório; e
- Apresentação;
O projeto consiste em utilizar o Matlab para simular uma Rede Multilayer Perceptron com o script e os dados fornecidos no site da disciplina. Basicamente, o que se há de fazer é alterar o nome de rotinas no script e definir parâmetros da rede.
A rede deverá ser utilizada para processar um problema de classificação de padrões aplicado para a prática de Cross Selling / venda casada.
Investigar diferentes topologias da rede e diferentes valores de parâmetros:
- Tamanho do conjunto de dados;
- Quantidade de unidades de processamento;
- Taxa de aprendizagem;
- Overfitting (utilizar conjuntos de treinamento, validação e testes para decidir quando parar o treinamento);
Consiste numa base de dados com 40.700 casos de compra casada (sendo 40.000 de ofertas que não foram aceitas e 700 de ofertas que foram aceitas). Trata-se, portanto, de um conjunto de dados com classes desbalanceadas: uma classe (de ofertas não finalizadas/ aceitas) é muito maior que outra (ofertas finalizadas). Há duas abordagens para se tratar esse problema:
- Replicação (de casos da classe menos favorecida); ou
- Redução (de casos da classe mais favorecida);
Consiste em dividir os dados fornecidos em três conjuntos:
- Conjunto de treinamento (50%)
- Conjunto de validação (25%)
- Conjunto de testes (25%)
Consiste em estabelecer quais parâmetros serão modificados (e como) e a sequência em que tais modificações ocorrerão. Isto é:
- Conjunto de parâmetros modificados;
- Sequência de modificações;
Análise de desempenho (26/03/2013 -- data do último acompanhamento, não necessariamente entrega da análise finalizada)
Analisar o desempenho obtido com diferentes conjuntos de parâmetros seguindo os modelos de análise de desempenho:
- Erro Médio Quadrado (MSE);
- Matriz de Confusão;
- Curvas ROC;
Entrega final que consiste na entrega de relatório e apresentação mencionados abaixo.
Máximo de 5 slides explicando:
- Processo de experimentação; e
- Análise de desempenho;
Dissertando acerca dos tópicos:
- Modelo MLP;
- Divisão dos dados;
- Processo de experimentação; e
- Análise de desempenho;