Este projeto foi desenvolvido pelo grupo Espelhos para apresentação final de ciclo do curso AlphaEdTech.
Realizar uma análises de dados sobre suicídios ocorridos entre os anos de 2010 e 2019.
Nosso objetivo foi compreender e analisar os dados de acordo com o tema proposto, seguindo as seguintes metodologias:
-
Coleta de dados: Utilizamos fontes confiáveis, como ibge.gov, para obter informações sobre suicídios registrados durante o período mencionado.
-
Limpeza e preparação dos dados: Realizamos um processo de limpeza para remover quaisquer dados incompletos, inconsistentes ou irrelevantes. Também fizemos ajustes nos formatos dos dados, quando necessário.
-
Análise exploratória: Realizamos uma análise inicial dos dados, explorando as principais estatísticas, tendências e características relevantes dos suicídios no período de 2010 a 2019.
-
Análise mais aprofundada: Aplicamos técnicas estatísticas avançadas, como correlação e agrupamento, para identificar possíveis fatores de influência e relações entre variáveis.
-
Processamento de dados com Python e Pandas: Utilizamos a linguagem de programação Python juntamente com a biblioteca Pandas para manipular e analisar os dados de suicídios contidos nos arquivos CSV. Com o Pandas, realizamos tarefas como leitura, limpeza, filtragem e transformação dos dados.
-
Utilização do NumPy para cálculos numéricos: Utilizamos a biblioteca NumPy para realizar operações numéricas eficientes nos dados, como cálculos estatísticos, manipulação de arrays e criação de matrizes.
-
Trabalho com arquivos CSV: Utilizamos a biblioteca padrão do Python para trabalhar com arquivos CSV, possibilitando a leitura dos dados brutos e sua conversão em estruturas de dados adequadas para análise.
-
Conexão ao banco de dados PostgreSQL com psycopg2: Utilizamos a biblioteca psycopg2 para estabelecer conexão com o banco de dados PostgreSQL, permitindo a realização de consultas, inserção e atualização de dados diretamente no banco de dados.
-
Configuração de variáveis de ambiente com dotenv: Utilizamos a biblioteca dotenv para carregar variáveis de ambiente a partir de arquivos de configuração. Isso nos permite armazenar informações sensíveis, como credenciais de banco de dados, em um arquivo separado e protegido.
-
Visualizações de dados interativas com Plotly Express: Utilizamos a biblioteca Plotly Express para criar visualizações interativas e de alto nível com apenas algumas linhas de código. Com o Plotly Express, é possível criar gráficos de dispersão, barras, histogramas, entre outros, com facilidade.
-
Visualizações personalizadas com Plotly Graph Objects: Utilizamos a biblioteca Plotly Graph Objects para criar visualizações personalizadas e altamente configuráveis. Com o Plotly Graph Objects, temos controle total sobre a aparência e a interatividade dos gráficos, permitindo a criação de visualizações avançadas e interativas.
Este projeto está licenciado sob a licença MIT. Para mais informações, consulte o arquivo LICENSE.
Para saber mais sobre os membros, acesse nossos perfis do GitHub:
👩💻 Ana Dias
👨💻 Carlos Oliveira
👨💻 Luiz Antônio
👨💻 Yan Victor