Skip to content

bytelabss/etl-dataforest

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ETL Data Forest

Sobre os Dados

Mapa de Solos IBGE

Base de dados contendo os tipos de solos no território brasileiro. A intenção é servir para classificar a área cadastrada para o plantio dos pinheiros e eucaliptos.

Solos_5000mil.zip

Bases de dados do AMBDATA

Diversas bases de dados contendo informações sobre preciptação, altidude, declive, temperatura, vegetação, entre outras coisas. A intenção é servir para classificar a área cadastrada para o plantio dos pinheiros e eucaliptos.

DOCS Download

Malha municipal 2023 IBGE

Base de dados contendo os limites dos Municípios coletada em 2023. Serviu para a análise dos dados.

Malha municipal -> municipio_2023 -> Brasil -> BR_Municipios_2023.zip

Instalação e Configuração

Caso prefira usar pyenv para gerenciar as suas versões do Python, siga as instruções em pyenv installation:

Instale a versão correta do python para esta aplicação:

pyenv install 3.13.2
pyenv global 3.13.2

Em seguida, instale o pip e o virtualenv:

pip install --upgrade pip virtualenv

Agora, crie e ative um ambiente virtual e em seguida instale as dependências do projeto:

virtualenv .venv --prompt='etl-dataforest'
source .venv/bin/activate
pip install -r requirements.txt

Crie uma cópia do arquivo .env.example:

cp .env.example .env

Abra o arquivo .env e edite os valores conforme necessário para o seu ambiente.

Certifique-se de não commitar o arquivo .env, pois ele pode conter informações sensíveis, como credenciais de banco de dados ou chaves de API.

Crie uma cópia do arquivo /input_data/files.json.example:

cp /input_data/files.json.example /input_data/files.json

Não se esqueça de editar o arquivo /input_data/files.json com os caminhos corretos para os arquivos .asc ou .shp que você deseja processar, assim como seus metadados.

Configuração do Banco de Dados

Este projeto utiliza PostgreSQL com PostGIS para manipulação de dados geoespaciais.

Execute os seguintes comandos para criar o banco de dados e configurar o usuário:

sudo -u postgres psql

No prompt do PostgreSQL, execute:

-- Criar o usuário
CREATE USER dataforest WITH ENCRYPTED PASSWORD 'dataforest';

-- Criar o banco de dados e definir o usuário como proprietário
CREATE DATABASE reflorestamento OWNER dataforest;

-- Saia do PostgreSQL
\q

Agora, conecte-se ao banco de dados e ative a extensão PostGIS:

sudo -u postgres psql

No prompt do PostgreSQL, execute:

-- Conectar ao banco de dados
\c dataforest

-- Habilitar PostGIS
CREATE EXTENSION postgis;

Para verificar a instalação:

SELECT postgis_full_version();

-- Saia do PostgreSQL
\q

Execução do ETL

Para executar o ETL, estando na raiz do projeto, utilize o seguinte comando após configurar suas variáveis de ambiente e os arquivos de entrada:

  python -m etl-dataforest.main

Comandos Adicionais

Para desativar o ambiente virtual, execute:

deactivate

Se novas dependências forem adicionadas, atualize o requirements.txt:

pip freeze > requirements.txt

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages