Show Menu
Cheatography

Dados Abertos para Gestores Cheat Sheet by

Dicas para Gestores sobre Dados Abertos

Principais Conceitos

Lei de Acesso a Informação
A Lei nº 12.527­/2011, conhecida como Lei de Acesso à Informação - LAI, regula­menta o direito, previsto na Consti­tuição, de qualquer pessoa solicitar e receber dos órgãos e entidades públicos, de todos os entes e Poderes, inform­ações públicas por eles produzidas ou custod­iadas.
API
API, de Applic­ation Progra­mming Interface (em português: Interface de Progra­mação de Aplica­tivos) é um conjunto de rotinas e padrões estabe­lecidos por um software para a utilização das suas funcio­nal­idades por aplica­tivos que não pretendem envolv­er-se em detalhes da implem­entação do software, mas apenas usar seus serviços.
Arquivo Legível por Máquina
Arquivo Legível por Máquina refere-se a inform­ações ou dados que estejam em um formato que pode ser facilmente processado por um comput­ador, sem interv­enção humana, assegu­rando nenhum signif­icado semântico está perdido
EGD
Estratégia de Governança Digital. Ver governança digital.
Governança Digital
Política instituída pelo Decreto 8.638, de 15 de janeiro de 2016 e que estabelece a Estratégia de Governança Digital (EGD). Baseia-se no conceito de Governo Digital da OCDE e refere-se ao uso de tecnol­ogias digitais, como parte integrada das estrat­égias de modern­ização govern­ame­ntais, para gerar benefícios para a sociedade. A EGD tem três eixos estrut­ura­ntes: acesso à inform­ação, prestação de serviços públicos e partic­ipação social. A política de dados abertos é parte importante do eixo “acesso à inform­ação”.
INDA
A Infrae­str­utura Nacional de Dados Abertos (INDA) é uma política para garantir e facilitar o acesso pelos cidadãos, pela sociedade e, em especial, pelas diversas instâncias do setor público aos dados e inform­ações produzidas ou custod­iadas pelo Poder Executivo Federal. Ela consiste em um conjunto de padrões, tecnol­ogias, proced­imentos e mecanismos de controle necess­ários para atender às condições de dissem­inação e compar­til­hamento de dados e inform­ações públicas no modelo de Dados Abertos. Sua gestão cabe a um comitê gestor, presidido pela Secretaria de Tecnologia da Informação do Ministério do Planej­amento e composto por repres­ent­antes da sociedade civil, do setor acadêmico e de nove entes federais.
Software Livre
Software Livre é uma forma de manife­stação de um software em que, resumi­dam­ente, permite-se adaptações ou modifi­cações em seu código de forma espont­ânea, ou seja, sem que haja a necess­idade de solicitar permissão ao seu propri­etário para modifi­cá-lo.
Serviço de Inform­ações ao Cidadão
Conforme o decreto nº 7.724, que regula­menta a Lei de Acesso à Informação no âmbito do poder executivo federal, o Serviço de Inform­ações ao Cidadão tem o objetivo de: atender e orientar o público quanto ao acesso à inform­ação; informar sobre a tramitação de documentos nas unidades; e receber e registrar pedidos de acesso à inform­ação.
* Glossário completo pode ser acessado em Glossário de Dados Abertos
 

Principais Formatos*

CSV
Pode significar Comma-­Sep­arated Values (valores separados por vírgula), ou ainda, Charac­ter­-Se­parated Values (valores separados por caract­ere). É um formato para armaze­namento de dados tabulares em texto. A codifi­cação é muito simples: cada linha do arquivo representa uma linha na tabela, e as colunas são separadas por vírgula. Campos que podem conter vírgula devem ser delimi­tados por aspas. CSV é recome­ndado para repres­entação de estrutura de dados mais simples, de natureza tabular, onde não existem subpro­pri­edades ou listas, gerando um arquivo menor e mais leve para proces­sam­ento. Arquivos CSV são proces­sáveis direta­mente por editores de planilhas, como o OpenOffice e o MS Excel.
GeoJSON
É um formato aberto baseado em JSON para repres­entar inform­ações geográ­ficas. Possib­ilita repres­entar formas como pontos, linhas e polígonos com coorde­nadas geográ­ficas, juntamente com seus atributos não-es­pac­iais. O GeoJSON não é mantido por um órgão formal de padron­ização, como alguns outros formatos para inform­ações geográ­ficas. Em vez disso, ele é especi­ficado por um grupo de trabalho de desenv­olv­edores.
JSON
É um acrônimo para JavaScript Object Notation. É um padrão aberto de estrut­uração de dados baseado em texto e legível por humano. A especi­ficação é a RFC 7159. JSON ganhou maior utilização com a utilização de carga dinâmica de conteúdo em páginas web com Javascript (técnica denominada “Ajax”). A serial­ização em JSON é muito simples e resulta em uma estrutura pouco verbosa o que se mostra uma ótima altern­ativa para o XML. JSON possib­ilita serial­ização de estrutura de objetos complexos, como listas e subpro­pri­edades. JSON está se tornando o padrão mais utilizado para integração de dados entre reposi­tórios e framew­orks, também está se tornando o padrão nativo de armaze­namento em alguns bancos de dados modernos.
JSON-LD
É um formato baseado em JSON para Linked Data, também padron­izado em 2014. Traz todas as vantagens do formato JSON. A estrutura de mapeamento para IRIs pode opcion­almente ser separada em um documento JSON de contexto, o que deixa o JSON principal, onde estão os dados, essenc­ial­mente com a mesma estrutura que um documento JSON comum.
KML
Acrônimo para Keyhole Markup Language. É um formato baseado em XML, desenv­olvido origin­almente pelo Google e depois padron­izado pelo Open Geospatial Consor­tium. Pode repres­entar inform­ações geográ­ficas, tais como marcadores de local, imagens, polígonos, modelos tridim­ens­ionais ou descrições textuais, usando coorde­nadas de latitude, longitude e elevação conforme o sistema WGS84. Em alguns casos os arquivos KML são distri­buídos compac­tados no formato zip, e o arquivo compactado recebe a extensão .kmz.
ODS
Significa Open Document Spread­sheet. É um formato não propri­etário de arquivo basedo em XML, padron­izado pela ABNT sob a norma NBR ISO/IEC 26300:­2006. É comumente chamado de planilha, similar ao XLS do MS Office Excel, porém aberto, por isso deve ser utilizado em substi­tuição ao XLS. Planilhas são largamente utiliz­adas, são de fácil utilização e manipu­láveis por diversos aplica­tivos. Apesar de ser um formato estrut­urado, é muito flexível, possib­ili­tando manipu­lação e mistura de diversos tipos de dados, como imagens e textos format­ados. Para a publicação de dados abertos tabulares, é recome­ndável a utilização de CSV, pela sua simpli­cidade e padron­ização.
RDF
A família de formatos RDF baseia-se em um metamodelo de grafos para indicar os relaci­ona­mentos entre os nós, onde cada nó pode ser qualquer coisa sobre a qual queira se afirmar algo. Esse metamodelo possib­ilita estabe­lecer relações semânticas entre os dados, ao descre­vê-los conforme um modelo (vocab­ulário ou ontologia) preest­abe­lecido para aquele domínio da inform­ação. Dados conforme esse metamodelo de grafos podem ser armaze­nados em bancos de dados especi­ali­zados, chamados triple stores, ou bancos de triplas, numa referência à forma de descrever o grafo listando cada tripla nó-are­sta-nó, repres­entando sujeito, predicado e objeto. Ao gravar dados RDF em um arquivo, no entanto, é necessário escolher uma entre as múltiplas sintaxes possíveis para repres­entar o grafo como uma sequência de caract­eres: XML, N-Triples, Turtle, JSON-LD, RDFa, etc.
RDF/XML
A sintaxe original, quando o padrão RDF foi inicia­lmente estabe­lecido, foi a baseada em XML. Por ser a primeira sintaxe para RDF, o seu suporte em ferram­entas é excelente. Por outro lado, pela verbos­idade do XML e pela sua estrutura hierár­quica, os arquivos gerados são geralmente complexos e de difícil leitura.
Shapefile
Formato aberto para dados geoesp­aciais, desenv­olvido pela empresa Esri, que produz soluções de software para sistemas de inform­ações geográ­ficas (GIS). Apesar de ser mantido por uma empresa, a sua especi­ficação é aberta e é implem­entada por pratic­amente todas as ferram­entas de GIS.
Turtle
Turtle significa “Terse RDF Triple Language”, ou linguagem sucinta de triplas RDF. Foi criada como uma sintaxe simpli­ficada para leitura tanto por humanos quanto por máquinas e padron­izada em 2014. A indentação e o uso de prefixos são elementos que facilitam a leitura, assim como o agrupa­mento de triplas que possuem o mesmo sujeito ou que possuem o mesmo sujeito e mesmo predicado.
XML
XML significa Extensible Markup Language, e é uma sintaxe para codificar documentos em um formato legível por máquina. É baseado em texto e tem como alguns de seus objetivos a facilidade de uso e legibi­lidade
 

Portais de Dados Abertos

 

Comments

No comments yet. Add yours below!

Add a Comment

Your Comment

Please enter your name.

    Please enter your email address

      Please enter your Comment.