Predicción de Satisfacción con la Carrera

Descripción del Proyecto

Este proyecto explora un conjunto de datos recopilados de estudiantes universitarios para predecir su satisfacción con su carrera, basándose en diversos factores demográficos y académicos.

Resumen del Conjunto de Datos

El conjunto de datos incluye detalles de estudiantes universitarios obtenidos a través de un formulario de Google. Contiene atributos como:

Cursos de certificación completados
Género
Departamento
Rendimiento académico
Pasatiempos
Hábitos de estudio
Expectativas salariales

Nuestra variable objetivo es "Do you like your degree?", que indica si a los estudiantes les gusta su carrera o no.

Tipo de Problema

Este es un problema de clasificación binaria, ya que nuestro objetivo es predecir si a un estudiante le gusta su carrera (clase positiva) o no (clase negativa). Entrenaremos modelos de aprendizaje automático utilizando los datos proporcionados para predecir la probabilidad de satisfacción con la carrera de un estudiante.

Resumen del Análisis

Carga de librerías necesarias y datos
Análisis preliminar de los datos y preparación de los mismos
Elección de la métrica
Ajuste y selección de algoritmos y sus parámetros
Evaluación de algoritmos
Conclusiones

Solución

La solución se encuentra en el archivo notebooks/Degree_Satisfaction_Prediction.ipynb.

Conclusiones

Basándonos en los resultados de precisión (accuracy) obtenidos, el modelo Random Forest sobresale con la precisión más alta de 0.987. Esto indica que Random Forest tiene el mejor desempeño en términos de precisión de predicción en comparación con los otros modelos evaluados en este estudio. Sin embargo, es esencial tener en cuenta que estos resultados se basan en la validación cruzada y no garantizan necesariamente un rendimiento óptimo en datos no vistos.

Requisitos

Este proyecto requiere las siguientes librerías de Python:

pandas: Manejo y análisis de datos
numpy: Operaciones y funciones matemáticas
missingno: Visualización de valores faltantes en el conjunto de datos
sklearn: Modelos y herramientas para el aprendizaje automático
xgboost: Implementación del algoritmo de Gradient Boosting
ydata_profiling: Generación de reportes de análisis exploratorio de datos
matplotlib: Generación de gráficos y visualizaciones

Puedes instalar las librerías necesarias usando el siguiente comando:

pip install pandas numpy missingno scikit-learn xgboost ydata-profiling matplotlib

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
data		data
notebooks		notebooks
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Predicción de Satisfacción con la Carrera

Descripción del Proyecto

Resumen del Conjunto de Datos

Tipo de Problema

Resumen del Análisis

Solución

Conclusiones

Requisitos

About

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Predicción de Satisfacción con la Carrera

Descripción del Proyecto

Resumen del Conjunto de Datos

Tipo de Problema

Resumen del Análisis

Solución

Conclusiones

Requisitos

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Contributors

Uh oh!

Languages