You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
base: data frame contendo a base de dados. Internamente a função deve manipular os dados como uma data.table
DV_vars: vetor com os nomes das variáveis que tem dígito verificador
DV_tipos: vetor com os tipos das variáveis que tem dígito veirficador (precisa ter o mesmo comprimento de DV_vars)
IDs_unicas: lista as variáveis que deveriam, em tese, identificar unicamente as linhas da base (depois explico a lógica disso, que vai encaixar com outras funções que eu já desenvolvi a respeito)
A função deveria retornar um documento de PDF contendo um relatório de:
Parte 1:
Frequencia de missings (NAs) ou strings vazias ("") em todas as variáveis da base.
Acho que isso poderia ser mostrado como um gráfico de barras, onde cada barra corr
Parte 2:
Para as variáveis em DV_vars
Frequencia de missings, zeros, strings vazias, DV valido e DV inválido
Parte 3:
Unicidade das supostas IDs_unicas
Algo que desenvolvi usando componentes conexos (teoria dos grafos, pacote igraph) formados pelas IDs_unicas, descrevendo o número de linhas em cada componente conexo
Pensei em ago como:
onde:
A função deveria retornar um documento de PDF contendo um relatório de:
Frequencia de missings (NAs) ou strings vazias ("") em todas as variáveis da base.
Acho que isso poderia ser mostrado como um gráfico de barras, onde cada barra corr
Para as variáveis em DV_vars
Frequencia de missings, zeros, strings vazias, DV valido e DV inválido
Unicidade das supostas IDs_unicas
Algo que desenvolvi usando componentes conexos (teoria dos grafos, pacote igraph) formados pelas IDs_unicas, descrevendo o número de linhas em cada componente conexo