Ciências da Educação

Dissertações de Mestrado

 

O desempenho escolar via uma abordagem de descoberta de conhecimento em bases de dados

 

Autor: Alice Maria Gonçalves Silva
Orientador:
Paulo Alexandre Ribeiro Cortez

 

Mestrado em Sistemas de Informação

Universidade do Minho
 

Se é autor de uma tese / dissertação de mestrado ou de doutoramento envie-nos para knoow.net@gmail.com e ajude-nos a enriquecer ainda mais o nosso site.

continuar

 

O desempenho escolar via uma abordagem de descoberta de conhecimento em bases de dados

Resumo

As políticas de adopção e manutenção de Sistemas e Tecnologias de Informação (S&TI) numa escola secundária são uma matéria sensível que envolve várias vertentes: pedagógica, tecnológica, económica, ética e legal. Questões complexas como a dependência de empresas produtoras de Tecnologias de Informação e Comunicação, a formação dos Recursos Humanos do Serviço de Informática, a coexistência de tecnologias, etc., levam a decisões complexas e envolvem, com certeza, perspectivas diferentes dos grupos de pessoas com capacidade para decidir ou influenciar decisões na organização (docentes, funcionários, sindicatos, alunos, Estado, indústria nacional, etc.). É necessário levar em conta que o panorama dos S&TI muda cada vez mais rapidamente e que tal facto causa dificuldades acrescidas à tomada de decisão na organização, particularmente, na tomada de decisão estratégica. Com este projecto pretendeu-se desenvolver e utilizar um instrumento de descoberta de conhecimento para auxiliar a elaboração de políticas de S&TI numa escola secundária. Esse instrumento de fundamenta-se na abordagem baseada em Cenários e foi utilizado para suportar a elaboração de uma política de conhecimento para os dados existentes, utilizados e desenvolvidos por uma escola secundária. Embora a escolaridade da população tenha francamente melhorado nas últimas décadas, os indicadores posicionam Portugal na cauda da Europa. Em causa está o abandono escolar precoce conjugado com o insucesso escolar. O insucesso escolar na disciplina de Língua Portuguesa é extremamente grave, na medida em que esta língua é o instrumento de acesso a múltiplos conhecimentos nas diversas áreas disciplinares. Com efeito, se o aluno não domina eficientemente a Língua Portuguesa não terá a capacidade de interpretar e compreender as matérias de outras disciplinas. Por isso, o insucesso nesta área disciplinar pode constituir uma das causas principais que influenciam negativamente o desempenho escolar do aluno em diferentes níveis de ensino. Por sua vez na disciplina de Matemática o caso é semelhante. Neste trabalho é abordado o desempenho escolar no ensino secundário, sendo que foi realizada análise de uma base de dados. Esta base de dados foi criada no ano lectivo 2005/2006, com os resultados obtidos através da elaboração e aplicabilidade de um questionário em duas escolas alentejanas (Escola Secundária Gabriel Pereira em Évora e Escola Secundária Mousinho da Silveira em Portalegre) e a informação foi completada com as notas e faltas (justificadas e injustificadas) presentes nas pautas finais de período. As pautas foram cedidas pelo Conselho Executivo de cada uma das escolas. Serão aplicadas diversas técnicas de Data Mining, como por exemplo: máquinas de vectores de suporte, redes neuronais e árvores de decisão, foram aplicadas com vista à extracção de conhecimento relevante na previsão do desempenho escolar. A solução proposta pretende prever o desempenho escolar dos alunos, através de um conjunto de variáveis de entrada. Com este estudo pretende-se ajudar a comunidade educativa a melhorar a gestão de recursos e a aplicação de estratégias, por forma a melhorar o desempenho dos alunos.

 

Índice

Agradecimentos
Resumo 
Abstract 
Índice de Árvores
Índice de Figuras 
Índice de Gráficos
Índice de Tabelas

1. Introdução

1.1. Motivação
1.2. Objectivos
1.3. Organização da Dissertação

2. Descoberta de Conhecimento em Bases de Dados

2.1. Descoberta de Conhecimento em Bases de Dados (DCBD)

2.1.1. Elementos de Apoio à Analise de Dados
2.1.2. Etapas da Descoberta de Conhecimento
2.1.3. Problemas Inerentes ao Processo de DCBD 

2.2. Data Mining (DM)

2.2.1. Tarefas de Data Mining

2.2.1.1. Classificação 
2.2.1.2. Regressão
2.2.1.3. Segmentação (Clustering) 
2.2.1.4. Associação 
2.2.1.5. Sumariação

2.2.2. Técnicas de Data Mining

2.2.2.1. Árvores de Decisão
2.2.2.2. Indução de Regras 
2.2.2.3. Redes Neuronais Artificiais
2.2.2.4. Random Forest
2.2.2.5. Support Vector Machines 

2.3. Metodologias Usadas para a Descoberta de Conhecimento 

2.3.1. SEMMA 
2.3.2. CRISP-DM 
2.3.3. CRISP-DM vs SEMMA 

2.4. Sumário

3. As Escolas Secundárias e o Desempenho Escolar 

3.1. Sistemas de Informação nas Escolas Secundárias 
3.2. O Ensino Secundário

3.2.1. Tipos de Ensino e Formação
3.2.2. A Diversidade dos Jovens
3.2.3. Base Cultural Comum
3.2.4. Tecnologias da Informação para Todos

3.3. O Insucesso Escolar 
3.4. Estudos Realizados para Avaliar o Desempenho Escolar 

3.4.1. Métodos de Avaliação do Desempenho Escolar 
3.4.2. Causas para o Baixo Desempenho Escolar 

3.5. O Estado da Arte sobre a Previsão do Desempenho Escolar

3.5.1. Abordagens de Descoberta de Conhecimento Relacionadas com o Ensino 
3.5.2. Abordagens de Descoberta de Conhecimento para a Previsão do Desempenho Escolar 

3.5.3. Estudos em Portugal sobre o Desempenho Escolar 

3.6. Sumário

4. Previsão do Desempenho Escolar 

4.1. Introdução 
4.2. Ferramenta Utilizada 
4.3. Metodologia CRISP-DM

4.3.1. Estudo do Negócio 
4.3.2. Estudo dos Dados 

4.3.2.1. Descrição dos Dados 

4.3.2.2. Exploração dos Dados

4.3.3. Preparação dos Dados 

4.3.3.1. Seleccionar os Dados 
4.3.3.2. Garantir a Coerência dos Dados 
4.3.3.3. Transformar e Formatar os Dados

4.3.4. Modelação 

4.3.4.1. Seleccionar Técnicas de Modelação 
4.3.4.2. Criar Dados de Treino e de Teste
4.3.4.3. Executar e Avaliar Modelo 

4.3.4.3.1. Desempenho Preditivo 

4.3.4.3.2. Capacidade Explicativa 

4.3.5. Avaliação 

4.4. Sumário

5. Conclusões e Trabalho Futuro

5.1. Resumo 

5.2. Discussão 
5.3. Trabalho Futuro 

Referências 

Anexo A – Questionário 
Anexo B – Pautas finais de período 
Anexo C – Explicação dos atributos da base de dados alunos
Anexo D – Base de Dados de Alunos (exemplo) 
Anexo E – Histogramas dos atributos da base de dados alunos 
Anexo E – Código escrito em R

E1 – Código utilizado para a construção dos histogramas 
E2 - Código utilizado na fase de pré-processamento da Base de Dados 
E2 - Código utilizado na fase de modelação da Base de Dados 

Anexo F – Glossário de Termos
 

 

Capas

Tese