dc.description.abstract | O Exame Nacional de Avaliação do Estudante (ENADE), é uma prova que
serve para avaliar o desempenho do estudante de nível superior. Tendo em vista,
explorar se fatores socioeconômicos determinam o desempenho na nota final da
prova, este trabalho aplica o processo Knowledge Discovery in Databases (KDD), com
o intuito de buscar padrões por meio de técnicas que utilizam aprendizado de
máquina. Os tipos de aprendizagem empregados neste trabalho, são: a aprendizagem
não supervisionada, mediante regras de associação, obtidas pelo algoritmo Apriori, e
a aprendizagem supervisionada, por meio da classificação, pelos algoritmos, J48,
Naive Bayes, IBk, Sequential Minimal Optimization (SMO), e Multilayer Perceptron
(MPL). As bases de dados do ENADE foram coletadas do site do Instituto Nacional de
Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), sendo selecionados os
dados referentes aos estudantes de ciência da computação da Universidade do
Estado do Rio Grande do Norte (UERN), do Campus Avançado de Natal, dos anos de
2008, 2011, e 2014. Este trabalho traça o perfil do estudante que fez a prova, obtém
a correlação das variáveis selecionadas dos questionários citados, compara o
desempenho dos estudantes de Natal com o cenário nacional, e identifica quais áreas
do conhecimento do curso os estudantes têm um melhor rendimento. Duas
ferramentas principais foram utilizadas para execução deste trabalho. Para a
classificação, foi utilizada a Waikato Environment for Knowledge Analysis (WEKA), e
a R Studio para a obtenção de regras de associação, cálculos estatísticos, e geração
de gráficos. Após a finalização da mineração de dados, foi identificado que a situação
de trabalho é um dos fatores que determinam a nota final. Estudantes que trabalhavam
40 horas semanais ou mais, tinham um rendimento inferior aos que apenas
estudavam. Apesar disso o desempenho dos estudantes, está de acordo com a
realidade do curso a nível nacional, com pequenas variações | en_US |