Skip to content

cewebbr/cordata

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

235 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CORDATA

O CORDATA - Catálogo Online de Reúso de Dados Públicos é um projeto que cataloga casos de uso de dados públicos, isto é, dados disponibilizados na Web, com livre acesso. Você pode acessar a página oficial do projeto aqui: https://cordata.ceweb.br. Neste repositório, disponibilizamos os dados coletados pelo projeto (ou seja, os metadados a respeito dos reúsos), além de códigos utilizados durante a catalogação ativa e algumas análises realizadas sobre os casos catalogados.

CORDATA - Catálogo Online de Reutilización de Datos Públicos es un proyecto que cataloga casos de uso de datos públicos, es decir, datos disponibles en la web con acceso libre. Puedes acceder a la página oficial del proyecto aquí: https://cordata.ceweb.br. En este repositorio, proporcionamos los datos recopilados por el proyecto (es decir, metadatos sobre reutilizaciones), así como los códigos utilizados durante la catalogación activa y algunos análisis realizados sobre los casos catalogados.

Estrutura do projeto:

.
├── README.md               <- Este documento
├── LICENSE                 <- Licença dos dados e códigos do projeto
├── requirements.txt        <- Principais pacotes de python necessários
├── codigo                  <- Web app interno de catalogação e gestão dos dados (CMS) 
├── dados                   <- Metadados sobre casos de uso 
|   ├── brutos              <- Metadados brutos, originais, vindos do formulário
|   ├── curados             <- Metadados originados do form manualmente corrigidos
|   └── limpos              <- Metadados limpos, corrigidos, padronizados
├── imagens                 <- Imagens representativas dos casos de uso
├── analises                <- Códigos de análise e limpeza dos dados (notebooks de python)
├── scripts                 <- Rotinas auxiliares
└── docs                    <- Documentos e registros

Sobre os metadados dos reúsos

Alguns metadados sobre reúsos foram informados pelo público em geral através do formulário do CORDATA. Nesses casos, os metadados são armazenados na sua forma bruta e posteriormente passam por uma curadoria do Ceweb.br. Os dados brutos, tais quais preenchidos no formulário do CORDATA, estão disponíveis na pasta dados/brutos. Os dados curados são versões dos dados brutos manualmente corrigidas, ainda no formato CSV. Ver dados/curados.

Outros metadados são registrados diretamente pela equipe do Ceweb.br. Nesses casos, o registro é feito através do Content Management System (CMS) disponibilizado em codigo, que resulta diretamente no formato final (JSON). Nesses casos, não há versões brutas ou curadas.

A versão limpa e enriquecida dos metadados coletados através do formulário, combinada com os registrados diretamente pela equipe do Ceweb.br, está em dados/limpos. São esses os dados que aparecem no site do CORDATA.

O código que faz a limpeza dos dados coletados através do formulário encontra-se disponível na pasta analises.

Contato

Para mais informações sobre o projeto, falar com Henrique S. Xavier (https://github.com/hsxavier).

About

Dados do projeto CORDATA -Catálogo de Reúso de Dados Abertos

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors