Skip to content

LuizMqs/Data-Engineering

Repository files navigation

Espelhos

Analise de dados

Este projeto foi desenvolvido pelo grupo Espelhos para apresentação final de ciclo do curso AlphaEdTech.

Objetivo

Realizar uma análises de dados sobre suicídios ocorridos entre os anos de 2010 e 2019.

Desafio

Nosso objetivo foi compreender e analisar os dados de acordo com o tema proposto, seguindo as seguintes metodologias:

  1. Coleta de dados: Utilizamos fontes confiáveis, como ibge.gov, para obter informações sobre suicídios registrados durante o período mencionado.

  2. Limpeza e preparação dos dados: Realizamos um processo de limpeza para remover quaisquer dados incompletos, inconsistentes ou irrelevantes. Também fizemos ajustes nos formatos dos dados, quando necessário.

  3. Análise exploratória: Realizamos uma análise inicial dos dados, explorando as principais estatísticas, tendências e características relevantes dos suicídios no período de 2010 a 2019.

  4. Análise mais aprofundada: Aplicamos técnicas estatísticas avançadas, como correlação e agrupamento, para identificar possíveis fatores de influência e relações entre variáveis.

Funcionalidades

  • Processamento de dados com Python e Pandas: Utilizamos a linguagem de programação Python juntamente com a biblioteca Pandas para manipular e analisar os dados de suicídios contidos nos arquivos CSV. Com o Pandas, realizamos tarefas como leitura, limpeza, filtragem e transformação dos dados.

  • Utilização do NumPy para cálculos numéricos: Utilizamos a biblioteca NumPy para realizar operações numéricas eficientes nos dados, como cálculos estatísticos, manipulação de arrays e criação de matrizes.

  • Trabalho com arquivos CSV: Utilizamos a biblioteca padrão do Python para trabalhar com arquivos CSV, possibilitando a leitura dos dados brutos e sua conversão em estruturas de dados adequadas para análise.

  • Conexão ao banco de dados PostgreSQL com psycopg2: Utilizamos a biblioteca psycopg2 para estabelecer conexão com o banco de dados PostgreSQL, permitindo a realização de consultas, inserção e atualização de dados diretamente no banco de dados.

  • Configuração de variáveis de ambiente com dotenv: Utilizamos a biblioteca dotenv para carregar variáveis de ambiente a partir de arquivos de configuração. Isso nos permite armazenar informações sensíveis, como credenciais de banco de dados, em um arquivo separado e protegido.

  • Visualizações de dados interativas com Plotly Express: Utilizamos a biblioteca Plotly Express para criar visualizações interativas e de alto nível com apenas algumas linhas de código. Com o Plotly Express, é possível criar gráficos de dispersão, barras, histogramas, entre outros, com facilidade.

  • Visualizações personalizadas com Plotly Graph Objects: Utilizamos a biblioteca Plotly Graph Objects para criar visualizações personalizadas e altamente configuráveis. Com o Plotly Graph Objects, temos controle total sobre a aparência e a interatividade dos gráficos, permitindo a criação de visualizações avançadas e interativas.

Licença

Este projeto está licenciado sob a licença MIT. Para mais informações, consulte o arquivo LICENSE.

Colaboradores

Para saber mais sobre os membros, acesse nossos perfis do GitHub:

👩‍💻 Ana Dias
👨‍💻 Carlos Oliveira
👨‍💻 Luiz Antônio
👨‍💻 Yan Victor

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages