SlideShare una empresa de Scribd logo
Open Data
Datos Abierto
http://www.datos.gob.es/
Tema 05 datosabiertos
Tema 05 datosabiertos
RISP y Open Data
●
RISP (Reutilización de la Información del Sector Público)
– Poner la Información del Sector Público disponible, tal cual es (en bruto)
en formatos estándares abiertos, facilitando su acceso y permitiendo su
reutilización.
– Fuente: Directiva 2003/98/CE
– Orientación:
• Datos públicos como materia prima cuya reutilización genera riqueza en Europa
●
Open Data:
– El movimiento Open Data propone que todos los datos sean libres, en
formatos estándares y con licencias gratuitas.
– Fuente:
●
Open Government Data Principles
– Orientación:
●
Derecho de la ciudadanía a acceder a los datos generados por los entes públicos
– Los datos creados o custodiados por el sector público deben estar
disponibles de forma libre y abierta a todo el mundo, para utilizarlos, re-
utilizarlos y distribuirlos
RISP
●
Clasificación de la forma de ofrecer la información en función de sus formatos
de representación en los siguientes grupos:
– Nivel 1:
●
Publicación en cualquier formato.
– Nivel 2:
●
Publicación en formatos estructurados (por ejemplo, Excel).
– Nivel 3:
●
Publicación en formatos no propietarios (por ejemplo, CSV).
– Niveles 4 y 5:
●
Publicación mediante formatos con información semántica.
– Ley 37/2007
– Real Decreto 1495/2011, de 24 de octubre, por el que se desarrolla la Ley 37/2007,
de 16 de noviembre, sobre reutilización de la información del sector público, para el
ámbito del sector público estatal.
●
Guía de aplicación
●
Guia Aporta
Tema 05 datosabiertos
Tema 05 datosabiertos
OGD● The two main elements of open government data can be defined as follows:
– Open data is defined as material which anyone can use for any purpose, without
restrictions
– Government data or Public Sector Information (PSI) is any data and information
produced or commissioned by Public Sector Bodies (PSBs)
–
● WHY
– Transparency
– Releasing social and commercial value
– Participatory Governance
● Projects
– The Open Data Handbook
– Principles for Open Government Data
– Open Government Data Catalogues
– http://opengovernmentdata.org/
OGD
https://www.youtube.com/watch?v=4zb2Li6Nlmw
Open Government Data Principles
●
Los datos serán:
●
1. COMPLETOS:
– Todo dato público = los no sujetos a limitaciones de privacidad, seguridad o propiedad.
●
2. PRIMARIOS
– Publicar los datos originales con el nivel de granularidad más detallado Posible (Lo más
desagregados que sea posible)
●
3. ACTUALIZADOS:
– Disponibles con prontitud para preservar su valor.
●
4. ACCESIBLES:
– Disponibles para todos los usuarios y todos los propósitos.
●
5. AUTOMATIZADOS (Procesables)
– Razonablemente estructurados para permitir su procesamiento automático.
●
Los datos en formato PDF, estos no serían procesablesen, EN formato XML estructurado SI
●
6. SIN REGISTRO
– Disponibles para todos, sin requisitos de registro previo.
●
7. ABIERTOS (No propietarios)
– En formatos estándares (xml, csv, rdf, …)
●
Formato abierto sería CSV o XML, mientras que formatos propietarios serían Word, Excel
●
8. LIBRES (Copyleft)
– No sujetos a copyright, sólo limitados por la seguridad, privacidad y propiedad.
¿Qué es un Dataset (Conjunto de datos)?
●
El término “Dataset” o “Conjunto de datos” hace
referencia a la categorización de los datos públicos
en catálogos de datos.
●
Los datos en bruto se organizan en “conjuntos de
datos” o “datasets” para ser más fácilmente
indexados y localizados.
●
Se utilizan campos que definen el grupo de datos
como la descripción, la frecuencia de actualización,
el formato o la licencia de uso entre otros
¿Cómo abrir datos?
● 1 Elija el conjunto de datos
– Elija el conjunto de datos que desea hacer público.
– Tenga en cuenta que usted puede (y puede ser necesario) regresar a este paso si tiene
problemas en una etapa posterior.
● 2 Utilizar una licencia abierta
– Determine qué derechos de propiedad intelectual existen en la información.
– Aplica una licencia “abierta” adecuada que licencie todos esos derecho y soporte la
definición de apertura discutida en la sección anterior, en “Qué es Datos Abiertos”.
– NB: Si tu no puedes hacer esto, vuelve al paso 1 y prueba con un dataset diferente.
● 3 Poner a disposición la información”
– En conjunto y en un formato útil. También puedes considerar otras alternativas de hacerla
disponible, así como una API.
● 4 Hazla visible
– Publicala en la web y quizás organiza un catálogo central que enumera tus datasets
abiertos
● OPEN DATA HANDBOOK
– http://opendatahandbook.org/es/introduction/index.html
– http://opendatahandbook.org/guide/es/
– http://opendatahandbook.org/
Obra abierta● Una obra abierta debe satisfacer los siguientes requisitos cuando
se distribuye:
– 1.1 Licencia abierta
● La obra debe estar disponible bajo una licencia abierta
– Cualesquiera términos adicionales que acompañen a la obra (como términos de uso o
patentes en posesión del licenciatario) no deben contradecir los términos de la licencia.
– 1.2 Acceso
● La obra debe estar disponible como un todo y a no más de un coste razonable
de reproducción, preferiblemente descargable de manera gratuita a través de
Internet.
– Cualquier información adicional necesaria para aplicar la licencia (como los nombres de
aquellos que han contribuido en ella y que sean necesarios para cumplir los requisitos de
reconocimiento) deben acompañar también a la obra.
– 1.3 Formato abierto
● La obra debe proporcionarse en forma conveniente y modificable, de manera que
no haya obstáculos tecnológicos innecesarios para la eficaz aplicación de los
derechos otorgados por la licencia.
– Concretamente, los datos deben poder ser leídos automáticamente, estar disponibles de una
sola vez y proporcionarse en un formato abierto (es decir, un formato que tenga sus
especificaciones disponibles pública, libre y gratuitamente, que no imponga restricciones,
económicas o de otro tipo sobre su uso) o, al menos, que puedan ser procesados con una
herramienta de software libre.
Licencias abiertas
● Una licencia es abierta si sus términos satisfacen las siguientes condiciones:
● 2.1 Permisos requeridos
– La licencia debe de manera irrevocable permitir lo siguiente:
● 2.1.1 Uso
– La licencia debe permitir el uso libre de la obra licenciada.
● 2.1.2 Redistribución
– La licencia debe permitir la redistribución de la obra licenciada, incluyendo su venta, en sí misma o como parte de una colección formada por
obras de diferentes fuentes.
● 2.1.3 Modificación
– La licencia debe permitir la creación de obras derivadas de la obra licenciada y la distribución de tales derivados en los mismos términos que
la obra original licenciada.
● 2.1.4 Separación
– La licencia debe permitir que cualquier parte de la obra sea libremente usada, distribuida o modificada por separado de cualquier otra parte
de la obra o de cualquier colección de obras en la que fuera originalmente distribuida. Todas las partes que reciben una distribución de
cualquier parte de una obra en los términos de la licencia original deben tener los mismos derechos que aquellos que están garantizados en
relación a la obra original.
● 2.1.5 Compilación
– La licencia debe permitir distribuir la obra licenciada junto con otras obras distintas sin poner restricciones sobre esas otras obras.
● 2.1.6 No discriminación
– La licencia no debe discriminar a ninguna persona o grupo.
● 2.1.7 Propagación
– Los derechos ligados a la obra deben aplicarse a toda persona a quien le sea redistribuida sin necesidad de aceptar ningún término legal
adicional.
● 2.1.8 Aplicación para cualquier propósito
– La licencia debe permitir el uso, redistribución, modificación y compilación con cualquier propósito. La licencia no debe restringir a nadie
hacer uso de la obra en un campo específico de aplicación o trabajo.
●
2.1.9 Sin coste
– La licencia no debe imponer como parte de sus condiciones ningún esquema de tarifas, regalías (royalties) o cualquier otra compensación o
remuneración económica.
Condiciones aceptables● La licencia no debe limitar, hacer inciertos o disminuir los permisos requeridos en la sección 2.1 a
excepción de las siguientes condiciones:
● 2.2.1 Reconocimiento
– La licencia puede requerir que las distribuciones de la obra incluyan el reconocimiento de los que han contribuido
a ella, los propietarios de los derechos, patrocinadores y creadores mientras que tales prescripciones no sean
onerosas.
● 2.2.2 Integridad
– La licencia puede requerir que las versiones modificadas de la obra licenciada lleven un nombre o número de
versión diferente de la de la obra original, o bien que se indiquen los cambios realizados.
● 2.2.3 Compartir igual
– La licencia puede requerir que las copias u obras derivadas de la obra licenciada permanezcan bajo la misma
licencia, o una similar a la original.
● 2.2.4 Aviso
– La licencia puede requerir que se mantenga el aviso de derechos de autor (copyright) y la identificación de la
licencia originales.
● 2.2.5 Fuente
– La licencia puede requerir que las obras modificadas estén disponibles en una forma preferida para posteriores
modificaciones.
● 2.2.6 Prohibición de restricciones técnicas
– La licencia puede prohibir la distribución de la obra cuando haya condiciones técnicas que impongan restricciones
sobre el ejercicio de derechos en otro caso permitidos.
● 2.2.7 No agresión
– La licencia puede requerir a quien modifique la obra que garantice los permisos públicos adicionales (por ejemplo,
licencias de patentes) requeridos para el ejercicio de los derechos otorgados por la licencia. La licencia puede
también condicionar los permisos a la no agresión contra los titulares de la licencia con respecto al ejercicio de
cualquier derecho permitido (por ejemplo, litigios sobre patentes).
¿En qué formatos se muestran las
informaciones?
●
Generalmente, las informaciones se ofrecen en formatos estructurados con el fin
de automatizar su reutilización. Los más habituales son:
– Comma-separated values (CSV).
– Xtensible Markup Language (XML).
– Ficheros de gráficos e imágenes (DXF, DWG, IFF, JPG, LAS...).
– Ficheros geográficos (GDE, Shapefile –SHP-, ECW, GEOTIFF, XYZ…).
– Hyper Text Markup Language (HTML).
– JavaScript Object Notation (JSON).
– Microsoft Office (DOC, DOCX, XLS, XLSX…).
– Open Office (ODT).
– Really Simple Syndication (RSS).
– Resource Description Framework (RDF).
●
La publicación de los conjuntos de datos o bases de datos públicas, deben estar
en formatos estándares y deberán ser de fácil acceso.
CSV (Comma-separated values)
●
Valores separados por coma-Archivos separado por comas
●
Los ficheros CSV son un tipo de documento en formato abierto sencillo para
representar datos en formato de tabla.
●
Las columnas se separan por comas (o punto y coma) y las filas por saltos de línea.
●
Los archivos CSV pueden ser un formato útil debido a que son compactos y por lo
tanto adecuado para transferir grandes conjuntos de datos con la misma estructura.
●
El formato es tan espartano que los datos son frecuentemente inservibles sin documentación, ya que puede
ser casi imposible adivinar el significado de las diferentes columnas.
●
Es particularmente importante para los formatos separados por comas que la documentación de los
campos individuales sea precisa.
●
Es esencial que la estructura del archivo sea respetada, como una omisión única de un campo puede
perturbar la lectura de todos los datos restantes en el archivo sin ninguna posibilidad real de rectificarla,
porque no se puede determinar cómo los datos restantes deben ser interpretados.
– Más información:
●
tools.ietf.org/html/rfc4180
CSV
XML (eXtensible Markup Language)
–
● Es un metalenguaje extensible de etiquetas desarrollado
por el W3C que permite definir lenguajes para diferentes
necesidades.
● Es el estándar para el intercambio de información
estructurada entre diferentes plataformas.
● XML es un formato ampliamente utilizado para el
intercambio de datos debido a que ofrece buenas
oportunidades de mantener la estructura de los datos y
la forma en que los archivos son construidos, y permite a
los desarrolladores escribir partes de la documentación
con los datos sin interferir con la lectura de ellos.
● Más información:
– www.w3.org/standards/xml/core
JSON (JavaScript Object Notation)
– JSON
● JSON es un formato de archivo que es muy fácil de leer por cualquier
lenguaje de programación.
● Su simplicidad significa que es generalmente fácil de procesar para las
computadoras a comparación de otros, como lo es XML.
– Es un formato ligero para el intercambio de datos basado en la
notación literal de objetos de JavaScript.
– Su sintaxis es simple, por lo que facilita el tratamiento en los
navegadores.
– Además, su concisión reduce el tamaño de flujo de datos entre
cliente y servidor.
– Más información:
● json.org/json-es.html
JSON
RDF (Resource Description
Framework)
●
Es una especificación del W3C para el modelado de información y la descripción de
recursos, que se hace con la forma de sujeto-predicado-objeto.
– La combinación de RDF con otras herramientas permite añadir significado a las páginas y es una de
las tecnologías esenciales para la web semántica.
– Un formato recomendado por W3C llamado RDF permite representar datos en una forma que
facilita la combinación de información de diferentes fuentes.
– Los datos RDF pueden ser almacenados en XML y JSON, entre otras serializaciones.
– RDF promueve el uso de URLs como identificadores, lo que brinda una manera conveniente de
interconectar iniciativas de “Datos Abiertos” existentes.
– RDF todavía no se ha generalizado, pero es una tendencia entre iniciativas de Gobierno Abierto,
incluso las iniciativas de Linked Data de los gobiernos británico y español.
– El inventor de la Web, Tim Berners-Lee, propuso recientemente un esquema de puntuación de cinco
estrellas que incluye Linked Data en formato RDF como una meta a alcanzar en las iniciativas de
Datos Abiertos.
●
Más información:
– www.w3.org/standards/techs/rdf#w3c_all
CSV
PDF
Imagen
Hojas de Cálculo
● Muchas autoridades tienen información que queda en la hoja
de cálculo, por ejemplo Microsoft Excel.
– Estos datos a menudo pueden ser utilizados inmediatamente con las
descripciones correctas de lo que las distintas columnas significan.
● En algunos casos puede ser macros y fórmulas en hojas de
cálculo, las cuales pueden ser más incómodas para manipular.
– Es recomendable documentar este tipo de cálculos junto a la hoja de
cálculo, ya que generalmente es más accesible para los usuarios al
leer.
● XLS (Microsoft Office Excel)
– Microsoft Office Excel es un formato propietario de Microsoft que
muestra la información en celdas organizadas en filas y columnas, y
cada celda contiene datos o fórmulas, con referencias relativas o
absolutas a otras celdas.
– Más información: http://es.wikipedia.org/wiki/Microsoft_Excel
XLS
Formatos
● Documento de Texto
– Documentos clásicos en formatos como Word, ODF, OOXML, o PDF, puede ser suficiente para
mostrar ciertos tipos de datos, por ejemplo, listas de correo o equivalente. Puede que sea barato
para exponerlos, siempre que ese sea el formato en que la data se haya creado. El formato no da
soporte para mantener la estructura coherente, lo cual significa que a veces es difícil para introducir
datos por medios automatizados. Asegúrese de utilizar las plantillas como base de documentos en
las que se mostrarán los datos para su reutilización, por lo que es al menos posible extraer
información de los documentos.
– También se puede apoyar el uso posterior de los datos que utilice el marcador de la tipografía tanto
como sea posible para que sea más fácil para una máquina para distinguir las partidas (de cualquier
tipo) a partir del contenido y así sucesivamente. En general se recomienda no exhibir en formato de
procesamiento de texto, si hay datos en un formato diferente.
● Texto
– Documentos de texto (. Txt) son muy fáciles para leer en los ordenadores. Por lo general, no
incluyen metadatos estructurales, lo que significa que los desarrolladores necesitan para crear un
programa de análisis que pueda interpretar cada documento tal y como aparece.
– Algunos problemas pueden ser causados al cambiar archivos de texto plano entre sistemas
operativos. MS Windows, Mac OSX y otras variantes de Unix tienen su propia forma de decirle a la
computadora que se ha llegado al final de la línea.
● Imagen escaneada
– Probablemente la forma menos adecuada para la mayoría de los datos, pero ambos TIFF y JPEG
2000-al menos puede marcarlos con la documentación de lo que está en la imagen - adecuada para
marcar la imagen de un documento con contenido de texto completo del documento. Puede ser
relevante a los datos que muestran como imágenes aquellos datos que no nacen por la vía
electrónica -un ejemplo obvio es la antigua escuela de registros y el material de archivo- y una
imagen es mejor que nada
Formatos
● Formatos propietarios
– Algunos sistemas tienen sus propios formatos de datos que pueden guardar o exportar datos.
● A veces puede ser suficiente para exponer los datos en un formato - sobre todo si se espera que el uso de más estaría
en un sistema similar del que vienen.
– Sobre donde obtener más información sobre estos formatos, debe estar siempre indicado, por ejemplo,
al proporcionar un enlace a la página web del proveedor.
● En general se recomienda para mostrar los datos en formato libre, cuando sea factible.
● HTML
– Hoy en día, muchos datos se encuentran disponibles en formato HTML en varios sitios. Esto sería
suficiente, si se trata de datos estables y de alcance limitado. En algunos casos, sería preferible tener
los datos de una forma fácil para descargar y manipular, pero como es barato y fácil de hacer referencia
a una página en un sitio web, podría ser un buen punto de partida en la pantalla de datos.
– Generalmente, sería más apropiado el uso de tablas en documentos HTML para almacenar datos y, es
importante que los distintos campos de datos se muestren y sean dadas identificaciones, que hacen
más fácil encontrar y manipular los datos.
– Yahoo ha desarrollado una herramienta (http://developer.yahoo.com/yql/) que puede extraer información
estructurada de un sitio web, y ciertas herramientas que pueden hacer mucho más con los datos
siempre que se encuentren cuidadosamente etiquetados.
EXCEL
HTML
Formatos
●
RSS (Really Symple Sindication)
– Es un formato XML para la distribución de contenidos de páginas web. Facilita la
publicación de información actualizada a los usuarios suscritos a la fuente RSS sin
necesidad de usar un navegador, utilizando un software especializado en este
formato.
– Más información:
• http://es.wikipedia.org/wiki/RSS
●
SHP (Shapefile)
– Shapefile es un formato propietario estándar de datos espaciales, desarrollado por
la compañía ESRI, que almacena tanto la geometría como la información
alfanumérica.
– Este formato no está preparado para almacenar información topológica.
– Más información:
• http://es.wikipedia.org/wiki/Shapefile
Formatos
●
ODS (Operational Data Store)
– Es un contenedor de datos activos, es decir operacionales que ayudan al soporte de
decisiones y a la operación.
– Es un formato de archivo abierto y estándar para el almacenamiento de hojas de cálculo
que muestra información en celdas organizadas en filas y columnas, y cada celda
contiene datos o fórmulas, con referencias relativas o absolutas a otras celdas.
– Más información:
• http://es.wikipedia.org/wiki/ODS
●
KML (Keyhole Markup Language)
– Es una gramática XML y un formato de archivo para la creación de modelos y el
almacenamiento de funciones geográficas como puntos, líneas, imágenes, polígonos y
modelos que se mostrarán principalmente en aplicaciones de mapas.
– KML es utilizado para compartir lugares e información entre aplicaciones.
– Más información:
• http://es.wikipedia.org/wiki/KML
Otros formatos
●
DWG:
– DWG is a "de facto GIS standard" format native to Autodesk design and GIS
software. It can be consumed by a wide variety of Autodesk and non-Autodesk
software packages. Read about DWG format on WikiPedia
●
ECW:
– ECW is a format used for geo-referenced raster images that is highly
compressed. Read about ECW on WikiPedia Read about image formats on
WikiPedia
●
MrSID:
– MrSID (pronounced "Mister SID") is a format used for geo-referenced raster
images that is highly compressed. The MrSID version of the facetized
orthophotos are only about 5% of the size of their GeoTiff versions. Read about
MrSID format on WikiPedia Read about image formats on WikiPedia
●
Web feed:
– A web feed (or news feed) is a data format used for providing users with
frequently updated content. Content distributors syndicate a web feed, thereby
allowing users to subscribe to it. Read about Web feed on Wikipedia
●
Formatos de datos
– http://vancouver.ca/your-government/open-data-catalogue.aspx
Open Data. Retos y Oportunidades – Junta de Castilla y León
Tema 05 datosabiertos
El proyecto Aporta (2009)
●
Ministerio de Industria, Energía y Turismo( Red.es), y el Ministerio de
Hacienda y Administraciones Públicas
●
Como objetivos principales
– Impulsar el mercado de la reutilización de la información pública.
●
Crear las condiciones para el desarrollo del mercado de la reutilización de la
información del sector público,
– Facilitar que las administraciones acometan dicha apertura;
●
Apoyar a las unidades administrativas en las actividades técnicas y organizativas
necesarias para que publiquen la información de acceso no restringido, según la
legislación vigente, de la forma más amigable para su reutilización.
– Fomentar una cultura favorable a la apertura de datos públicos
●
Guía Aporta sobre reutilización de la información del sector público
– http://datos.gob.es/content/proyecto-aporta
Datos. Gob
Reutilización de datos
●
La reutilización de la información del sector público consiste en el uso por parte
de personas físicas o jurídicas de información generada por organismos del
sector público, con fines comerciales o no.
– La reutilización de la información del sector público contribuye al desarrollo tecnológico,
a la explotación estratégica de la información en ámbitos especialmente importantes
como el administrativo, el financiero o el jurídico, y a una mejora de la eficiencia de los
gobiernos y organismos oficiales.
– http://www.datos.gob.es/
●
Hay tres actores o agentes principales en el proceso de reutilización de la
información del sector público
– Las administraciones públicas.
●
Recogen, producen y reproducen gran cantidad de información, completa, fiable y de calidad, en el
desempeño de las funciones y de la misión de servicio público que tienen encomendadas.
– Las entidades infomediarias.
– Son responsables de desarrollar el mercado de contenidos y de añadir valor a la información del sector público
gracias un uso inteligente de la misma.
– Los usuarios finales.
●
Son los principales beneficiarios de los productos y servicios de valor añadido generados a partir de
la reutilización de los datos públicos
Clasificación de apertura de los datos
● Una estrella:
– Ofrecer los datos en cualquier formato, aunque sean difíciles de manipular, como un pdf o
una imagen escaneada.
● Dos estrellas:
– Entregar los datos de manera estructurada, como en un archivo excel con extension xls.
● Tres estrellas:
– Entregar los datos en un formato que no sea propietario, como csv en vez de excel
● Cuatro estrellas( información semántica):
– Usar URIs (que es una dirección web de un dato que sirve para enlazarlo con otros datos)
para identificar cosas y propiedades, de manera que se pueda apuntar a los datos.
– Requiere usar un estándar RDF
● Cinco estrellas (información semántica):
– Vincular sus datos con los de otras personas, dotándolos de contexto. En la práctica, a que
la información entregada también apunte a otras fuentes de datos.
● Por ejemplo, si publico información sobre un libro dentro de mis datos, enlazar descripciones del libro
que pertenezcan a otros publicadores
● Por ejemplo DBPedia o Amazon
¿Bajo qué condiciones pueden
utilizarse los recursos del portal?
●
Todos los recursos propios de datos.gob.es están
disponibles para su reutilización libre y gratuita en los
términos del “Aviso legal” del sitio web.
●
Los datos a los que da acceso el Catálogo de Información
Pública, creado a partir del directorio Bases de datos de
libre acceso difundidas por la Administración General del
Estado (junio 2008) realizado por el grupo Publidoc-UCM,
están sujetos a las condiciones que en cada caso han
determinado sus organismos gestores.
– En la ficha descriptiva que aparece asociada a los distintos
datasets se especifican esas condiciones.
Directivas
●
Directiva 2003/98/CE del Parlamento Europeo y del Consejo, de 17
de noviembre de 2003, sobre reutilización de la información del
sector público
●
Ley de Transparencia Directiva 2013/37/UE
●
Modificación de la Directiva 2003/98/CE de Reutilización de la
Información del Sector Público, aprobada recientemente por el
Consejo de la Unión Europea con fecha 15 de abril de 2013..
●
Directiva Inspire
– La normativa Inspire para regular un marco común a nivel europeo sobre
los datos geográficos como segmento más maduro del Opendata
– Regula, desde marzo de 2007, las normas para que pueda existir una
infraestructura común de información espacial en la Unión Europea
orientada a la aplicación de las políticas comunitarias de medio ambiente.
– Puede encontrarse en su propio portal de la UE
• http://inspire.ec.europa.eu/
• http://inspire-geoportal.ec.europa.eu/
Marco Legal
●
Ley 37/2007, de 16 de noviembre, sobre reutilización de la
información del sector público. Real Decreto 1671/2009, de 6 de
noviembre 36 que la desarrolla parcialmente.
– Aviso legal
●
http://datos.gob.es/?q=avisolegal_tipo
●
Real Decreto 1495/2011,, de 24 de octubre, que introduce el derecho
a la reutilización de cuanto documento tenga carácter público
●
Guía de aplicación
●
Guia Aporta
●
Memorando sobre Transparencia y Gobierno Abierto de Barak
Obama (Transparency and Open Government )
– http://www.whitehouse.gov/the_press_office/TransparencyandOpenGovernme
nt/
– http://www.data.gov/
Linked Open Data
●
En el proceso de publicación de los datos, tan útil como el propio valor
del dato o de la información es su significado.
●
Esta metainformación o metadatos completan la publicación avanzada
de información para su reutilización.
●
Las semánticas (es decir, conjuntos de metadatos) todavía no pueden
considerarse de uso generalizado en la publicación de fuentes.
●
Los estándares RDF, OWL y diversas implementaciones sobre XML,
entre otros, pueden considerarse los mecanismos más extendidos.
●
SPARQL
– Es un lenguaje de consulta de recursos online, adecuado para la utilización en
repositorios de Opendata que cumplan el estándar RDF.
●
Normalizado por el RDF Data Access Working Group (DAWG) del Word Wide Web
Consortium (W3C)
Tema 05 datosabiertos
Tema 05 datosabiertos
OPEN DATA y Transparencia
● Ejemplo de datos de gastos
– https://opendata.socrata.com/Business/Oklahoma-Lo
bbyist-Gifts-2006-2008/4cie-i6ie
Portal datos Abiertos España
● http://datos.gob.es/
Enlaces
●
Datos.gob.es
– http://datos.gob.es/
●
Junta Andalucía
– http://www.juntadeandalucia.es/datosabiertos/portal.html
●
Gobierno abierto Comunidad foral de Navarra
– http://www.gobiernoabierto.navarra.es/es/open-data
●
Junta de Castilla-León
– http://www.datosabiertos.jcyl.es/web/jcyl/RISP/es/Plantilla100/1284162109313/_/_
/
– http://www.datosabiertos.jcyl.es/
●
CTIC
– http://datos.fundacionctic.org/
●
Datos abiertos
– http://datosabiertos.com/
●
Google
– https://sites.google.com/site/fusiontablestalks/
– Datos públicos
●
http://www.google.com/publicdata/directory
Enlace iniciativas destacadas●
Zaragoza
– http://www.zaragoza.es/ciudad/risp/
●
Gijón
– http://datos.gijon.es/
●
Pais Vaco
– http://opendata.euskadi.net/w79-home/eu/
●
Cataluña
– http://dadesobertes.gencat.cat/ca
●
EEUU
– www.data.gov
●
Gran Bretaña
– www.data.gov.uk
●
8 principios de los datos abiertos
– http://opengovdata.org/
– http://gobernamos.com/
●
Dbepedia
– http://dbpedia.org
Tema 05 datosabiertos
Enlaces●
Comunidad open data
– http://linkeddata.org/
– http://www.gnoss.com/home
– http://red.gnoss.com/comunidad/OpenData
●
Enlaces a sitios de datos abiertos
– http://datos.gob.es/?q=taxonomy/term/30
– http://datos.gob.es/?q=node/237
●
Spaindata
– http://www.spainesdata.es/#
– http://www.slideshare.net/datosgob
●
Unesco, recursos open educativos
– http://www.unesco.org/new/en/communication-and-information/access-to-knowledge/open-educational-resources/
●
Pinterest Buenas practicas
– http://www.pinterest.com/pin/188658671865187956/
●
DATA GOV
– http://www.data.gov/open-gov/
●
UNDATA
– http://data.un.org/
●
OCDE
– http://www.oecd.org/
●
Banco Mundial
– http://data.worldbank.org/
– http://datos.bancomundial.org/
Tema 05 datosabiertos
Tema 05 datosabiertos
Enlaces
● OpenDataKit
– Formularios teléfonos móviles
● https://opendatakit.org/
● Open Data Institute
– http://theodi.org/
● Datos.gob.es
– http://www.slideshare.net/datosgob
● Mapa de iniciativas Open en España
– http://www.eldiario.es/turing/big_data/Mapa-iniciativas-Open-Data-Espana_0_277172540.ht
ml
● Mapa Iniciativas Mundiales
– http://datos.fundacionctic.org/sandbox/catalog/faceted/
● CTIC
– http://datos.fundacionctic.org/
Tema 05 datosabiertos
Banco Mundial
●
Concetos y ejemplos de Open Data
– http://data.worldbank.org/open-government-data-toolkit
●
Tema 05 datosabiertos

Más contenido relacionado

DOCX
Licencias en creative commons
PPTX
Que es el software libre y su historia
PDF
Gnu y software libre
ODP
Software Libre y su potencial para el Cauca
DOCX
Licencias para blog
PDF
Sistemas operativos libres
PPSX
Proyecto gnu
PPSX
Proyecto gnu
Licencias en creative commons
Que es el software libre y su historia
Gnu y software libre
Software Libre y su potencial para el Cauca
Licencias para blog
Sistemas operativos libres
Proyecto gnu
Proyecto gnu

Destacado (20)

PDF
T03 04 firmaelectronica
PDF
sistemas informaticos para la agroalimentacion
PDF
medios pago en internet
PDF
T04 05 notificaciones
PDF
publicidad en internet
PDF
PDF
Tema 08 estandares abiertos
PDF
T04 03 marcadetiempo
PDF
PDF
T03 conceptos seguridad
PDF
Redes t1 conceptos
PDF
Tema 08 gobiernoabierto
PPTX
Firma electronica
PPTX
La Firma Digital
ODP
T06 01 interoperabilidad
PDF
Redes t02 normas
PDF
T03 02 criptografia
T03 04 firmaelectronica
sistemas informaticos para la agroalimentacion
medios pago en internet
T04 05 notificaciones
publicidad en internet
Tema 08 estandares abiertos
T04 03 marcadetiempo
T03 conceptos seguridad
Redes t1 conceptos
Tema 08 gobiernoabierto
Firma electronica
La Firma Digital
T06 01 interoperabilidad
Redes t02 normas
T03 02 criptografia
Publicidad

Similar a Tema 05 datosabiertos (20)

PDF
OPEN DATA y OPEN GOVERNMENT
ODP
¿Son "libres" los geodatos "libres"?
PDF
Hackathon CCVenezuela Datos Abiertos 2024
PPT
Open Source
PPTX
La difusión estadística y la apertura de datos: un viaje de ida y vuelta
PPTX
PDF
Storyboard video Open Source
PPTX
Presentación de L.F. Ramos en Aporta 2012
PPTX
Definición Código Abierto
PPTX
Definición código abierto
PPT
Cómo desarrollar bienes y servicios públicos con datos
ODP
De la apertura de datos públicos a la reutilización de la información
PPTX
PDF
Metodologías y herramientas en datos abiertos
PPTX
Open source
PDF
Curs 1.2 Legal Open Data (11/01)
PPTX
Datos y datos abiertos: presentación foro TIC en AST
PDF
Datos abiertos, reutilización de la información y datos enlazados. Archivos y...
PDF
Open Data: Modelos de negocio basados en datos del sector público
OPEN DATA y OPEN GOVERNMENT
¿Son "libres" los geodatos "libres"?
Hackathon CCVenezuela Datos Abiertos 2024
Open Source
La difusión estadística y la apertura de datos: un viaje de ida y vuelta
Storyboard video Open Source
Presentación de L.F. Ramos en Aporta 2012
Definición Código Abierto
Definición código abierto
Cómo desarrollar bienes y servicios públicos con datos
De la apertura de datos públicos a la reutilización de la información
Metodologías y herramientas en datos abiertos
Open source
Curs 1.2 Legal Open Data (11/01)
Datos y datos abiertos: presentación foro TIC en AST
Datos abiertos, reutilización de la información y datos enlazados. Archivos y...
Open Data: Modelos de negocio basados en datos del sector público
Publicidad

Más de Manuel Fernandez Barcell (12)

PDF
T04 02 dnielectronico
PDF
T03 03 certificados_digitales
PDF
Ae t01 introduccion_ae
PDF
PDF
Analítica y metrica web
PDF
SEM, SMO marketing digital
PDF
posiciomamiento SEO
PDF
dominios y alojamientos web
PDF
conceptos de ebusiness
PDF
Tema 4: Procesamiento paralelo.
PDF
Tema 3: Procesadores VLIW y procesadores vectoriales.
T04 02 dnielectronico
T03 03 certificados_digitales
Ae t01 introduccion_ae
Analítica y metrica web
SEM, SMO marketing digital
posiciomamiento SEO
dominios y alojamientos web
conceptos de ebusiness
Tema 4: Procesamiento paralelo.
Tema 3: Procesadores VLIW y procesadores vectoriales.

Último (19)

PPTX
sitio arqueologico SILLUSTANI analisis.pptx
PDF
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
PDF
Casilla-Especial-comprimido.ine casillas
PPTX
Convenio Riesgo climático en la ciudad de Bogotá
PPTX
Escuela estructuralistaaaaaaaaaaaaa.pptx
PPTX
INFORME DE SEGUIMIENTO ICIP reporte mayo
PDF
Guía para el Examen de Oficial Judicial.pdf
PDF
La Incidencia Pública y Social Para Compartir.pdf
PDF
El Desarrollo del Pluralismo en México UACJ
PPTX
perfildeturismocomunitario-170531200827.pptx
PPTX
Apuntes Bloque de Constitucionalidad (1).pptx
PDF
#DigitalTierra nº 114 "Primer Destino: Servir".pdf
PPTX
presentación Pseudoquiste de páncreas. gastroenterología
PPTX
Copia de PRESENTACION PARA DGA_20230323.pptx
PPTX
CONFLICTOS SOCIALES EN LA SOCIEDAD PERUANA
PPTX
Inducción en seguridad y salud en el trabajo
PDF
Reglamento del minsa y rne para hospitales
PPTX
Capacitacion_Alcohol_Drogas_Tabaquismo.pptx
PPTX
Trata sobre la administración pública..pptx
sitio arqueologico SILLUSTANI analisis.pptx
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
Casilla-Especial-comprimido.ine casillas
Convenio Riesgo climático en la ciudad de Bogotá
Escuela estructuralistaaaaaaaaaaaaa.pptx
INFORME DE SEGUIMIENTO ICIP reporte mayo
Guía para el Examen de Oficial Judicial.pdf
La Incidencia Pública y Social Para Compartir.pdf
El Desarrollo del Pluralismo en México UACJ
perfildeturismocomunitario-170531200827.pptx
Apuntes Bloque de Constitucionalidad (1).pptx
#DigitalTierra nº 114 "Primer Destino: Servir".pdf
presentación Pseudoquiste de páncreas. gastroenterología
Copia de PRESENTACION PARA DGA_20230323.pptx
CONFLICTOS SOCIALES EN LA SOCIEDAD PERUANA
Inducción en seguridad y salud en el trabajo
Reglamento del minsa y rne para hospitales
Capacitacion_Alcohol_Drogas_Tabaquismo.pptx
Trata sobre la administración pública..pptx

Tema 05 datosabiertos

  • 4. RISP y Open Data ● RISP (Reutilización de la Información del Sector Público) – Poner la Información del Sector Público disponible, tal cual es (en bruto) en formatos estándares abiertos, facilitando su acceso y permitiendo su reutilización. – Fuente: Directiva 2003/98/CE – Orientación: • Datos públicos como materia prima cuya reutilización genera riqueza en Europa ● Open Data: – El movimiento Open Data propone que todos los datos sean libres, en formatos estándares y con licencias gratuitas. – Fuente: ● Open Government Data Principles – Orientación: ● Derecho de la ciudadanía a acceder a los datos generados por los entes públicos – Los datos creados o custodiados por el sector público deben estar disponibles de forma libre y abierta a todo el mundo, para utilizarlos, re- utilizarlos y distribuirlos
  • 5. RISP ● Clasificación de la forma de ofrecer la información en función de sus formatos de representación en los siguientes grupos: – Nivel 1: ● Publicación en cualquier formato. – Nivel 2: ● Publicación en formatos estructurados (por ejemplo, Excel). – Nivel 3: ● Publicación en formatos no propietarios (por ejemplo, CSV). – Niveles 4 y 5: ● Publicación mediante formatos con información semántica. – Ley 37/2007 – Real Decreto 1495/2011, de 24 de octubre, por el que se desarrolla la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público, para el ámbito del sector público estatal. ● Guía de aplicación ● Guia Aporta
  • 8. OGD● The two main elements of open government data can be defined as follows: – Open data is defined as material which anyone can use for any purpose, without restrictions – Government data or Public Sector Information (PSI) is any data and information produced or commissioned by Public Sector Bodies (PSBs) – ● WHY – Transparency – Releasing social and commercial value – Participatory Governance ● Projects – The Open Data Handbook – Principles for Open Government Data – Open Government Data Catalogues – http://opengovernmentdata.org/
  • 10. Open Government Data Principles ● Los datos serán: ● 1. COMPLETOS: – Todo dato público = los no sujetos a limitaciones de privacidad, seguridad o propiedad. ● 2. PRIMARIOS – Publicar los datos originales con el nivel de granularidad más detallado Posible (Lo más desagregados que sea posible) ● 3. ACTUALIZADOS: – Disponibles con prontitud para preservar su valor. ● 4. ACCESIBLES: – Disponibles para todos los usuarios y todos los propósitos. ● 5. AUTOMATIZADOS (Procesables) – Razonablemente estructurados para permitir su procesamiento automático. ● Los datos en formato PDF, estos no serían procesablesen, EN formato XML estructurado SI ● 6. SIN REGISTRO – Disponibles para todos, sin requisitos de registro previo. ● 7. ABIERTOS (No propietarios) – En formatos estándares (xml, csv, rdf, …) ● Formato abierto sería CSV o XML, mientras que formatos propietarios serían Word, Excel ● 8. LIBRES (Copyleft) – No sujetos a copyright, sólo limitados por la seguridad, privacidad y propiedad.
  • 11. ¿Qué es un Dataset (Conjunto de datos)? ● El término “Dataset” o “Conjunto de datos” hace referencia a la categorización de los datos públicos en catálogos de datos. ● Los datos en bruto se organizan en “conjuntos de datos” o “datasets” para ser más fácilmente indexados y localizados. ● Se utilizan campos que definen el grupo de datos como la descripción, la frecuencia de actualización, el formato o la licencia de uso entre otros
  • 12. ¿Cómo abrir datos? ● 1 Elija el conjunto de datos – Elija el conjunto de datos que desea hacer público. – Tenga en cuenta que usted puede (y puede ser necesario) regresar a este paso si tiene problemas en una etapa posterior. ● 2 Utilizar una licencia abierta – Determine qué derechos de propiedad intelectual existen en la información. – Aplica una licencia “abierta” adecuada que licencie todos esos derecho y soporte la definición de apertura discutida en la sección anterior, en “Qué es Datos Abiertos”. – NB: Si tu no puedes hacer esto, vuelve al paso 1 y prueba con un dataset diferente. ● 3 Poner a disposición la información” – En conjunto y en un formato útil. También puedes considerar otras alternativas de hacerla disponible, así como una API. ● 4 Hazla visible – Publicala en la web y quizás organiza un catálogo central que enumera tus datasets abiertos ● OPEN DATA HANDBOOK – http://opendatahandbook.org/es/introduction/index.html – http://opendatahandbook.org/guide/es/ – http://opendatahandbook.org/
  • 13. Obra abierta● Una obra abierta debe satisfacer los siguientes requisitos cuando se distribuye: – 1.1 Licencia abierta ● La obra debe estar disponible bajo una licencia abierta – Cualesquiera términos adicionales que acompañen a la obra (como términos de uso o patentes en posesión del licenciatario) no deben contradecir los términos de la licencia. – 1.2 Acceso ● La obra debe estar disponible como un todo y a no más de un coste razonable de reproducción, preferiblemente descargable de manera gratuita a través de Internet. – Cualquier información adicional necesaria para aplicar la licencia (como los nombres de aquellos que han contribuido en ella y que sean necesarios para cumplir los requisitos de reconocimiento) deben acompañar también a la obra. – 1.3 Formato abierto ● La obra debe proporcionarse en forma conveniente y modificable, de manera que no haya obstáculos tecnológicos innecesarios para la eficaz aplicación de los derechos otorgados por la licencia. – Concretamente, los datos deben poder ser leídos automáticamente, estar disponibles de una sola vez y proporcionarse en un formato abierto (es decir, un formato que tenga sus especificaciones disponibles pública, libre y gratuitamente, que no imponga restricciones, económicas o de otro tipo sobre su uso) o, al menos, que puedan ser procesados con una herramienta de software libre.
  • 14. Licencias abiertas ● Una licencia es abierta si sus términos satisfacen las siguientes condiciones: ● 2.1 Permisos requeridos – La licencia debe de manera irrevocable permitir lo siguiente: ● 2.1.1 Uso – La licencia debe permitir el uso libre de la obra licenciada. ● 2.1.2 Redistribución – La licencia debe permitir la redistribución de la obra licenciada, incluyendo su venta, en sí misma o como parte de una colección formada por obras de diferentes fuentes. ● 2.1.3 Modificación – La licencia debe permitir la creación de obras derivadas de la obra licenciada y la distribución de tales derivados en los mismos términos que la obra original licenciada. ● 2.1.4 Separación – La licencia debe permitir que cualquier parte de la obra sea libremente usada, distribuida o modificada por separado de cualquier otra parte de la obra o de cualquier colección de obras en la que fuera originalmente distribuida. Todas las partes que reciben una distribución de cualquier parte de una obra en los términos de la licencia original deben tener los mismos derechos que aquellos que están garantizados en relación a la obra original. ● 2.1.5 Compilación – La licencia debe permitir distribuir la obra licenciada junto con otras obras distintas sin poner restricciones sobre esas otras obras. ● 2.1.6 No discriminación – La licencia no debe discriminar a ninguna persona o grupo. ● 2.1.7 Propagación – Los derechos ligados a la obra deben aplicarse a toda persona a quien le sea redistribuida sin necesidad de aceptar ningún término legal adicional. ● 2.1.8 Aplicación para cualquier propósito – La licencia debe permitir el uso, redistribución, modificación y compilación con cualquier propósito. La licencia no debe restringir a nadie hacer uso de la obra en un campo específico de aplicación o trabajo. ● 2.1.9 Sin coste – La licencia no debe imponer como parte de sus condiciones ningún esquema de tarifas, regalías (royalties) o cualquier otra compensación o remuneración económica.
  • 15. Condiciones aceptables● La licencia no debe limitar, hacer inciertos o disminuir los permisos requeridos en la sección 2.1 a excepción de las siguientes condiciones: ● 2.2.1 Reconocimiento – La licencia puede requerir que las distribuciones de la obra incluyan el reconocimiento de los que han contribuido a ella, los propietarios de los derechos, patrocinadores y creadores mientras que tales prescripciones no sean onerosas. ● 2.2.2 Integridad – La licencia puede requerir que las versiones modificadas de la obra licenciada lleven un nombre o número de versión diferente de la de la obra original, o bien que se indiquen los cambios realizados. ● 2.2.3 Compartir igual – La licencia puede requerir que las copias u obras derivadas de la obra licenciada permanezcan bajo la misma licencia, o una similar a la original. ● 2.2.4 Aviso – La licencia puede requerir que se mantenga el aviso de derechos de autor (copyright) y la identificación de la licencia originales. ● 2.2.5 Fuente – La licencia puede requerir que las obras modificadas estén disponibles en una forma preferida para posteriores modificaciones. ● 2.2.6 Prohibición de restricciones técnicas – La licencia puede prohibir la distribución de la obra cuando haya condiciones técnicas que impongan restricciones sobre el ejercicio de derechos en otro caso permitidos. ● 2.2.7 No agresión – La licencia puede requerir a quien modifique la obra que garantice los permisos públicos adicionales (por ejemplo, licencias de patentes) requeridos para el ejercicio de los derechos otorgados por la licencia. La licencia puede también condicionar los permisos a la no agresión contra los titulares de la licencia con respecto al ejercicio de cualquier derecho permitido (por ejemplo, litigios sobre patentes).
  • 16. ¿En qué formatos se muestran las informaciones? ● Generalmente, las informaciones se ofrecen en formatos estructurados con el fin de automatizar su reutilización. Los más habituales son: – Comma-separated values (CSV). – Xtensible Markup Language (XML). – Ficheros de gráficos e imágenes (DXF, DWG, IFF, JPG, LAS...). – Ficheros geográficos (GDE, Shapefile –SHP-, ECW, GEOTIFF, XYZ…). – Hyper Text Markup Language (HTML). – JavaScript Object Notation (JSON). – Microsoft Office (DOC, DOCX, XLS, XLSX…). – Open Office (ODT). – Really Simple Syndication (RSS). – Resource Description Framework (RDF). ● La publicación de los conjuntos de datos o bases de datos públicas, deben estar en formatos estándares y deberán ser de fácil acceso.
  • 17. CSV (Comma-separated values) ● Valores separados por coma-Archivos separado por comas ● Los ficheros CSV son un tipo de documento en formato abierto sencillo para representar datos en formato de tabla. ● Las columnas se separan por comas (o punto y coma) y las filas por saltos de línea. ● Los archivos CSV pueden ser un formato útil debido a que son compactos y por lo tanto adecuado para transferir grandes conjuntos de datos con la misma estructura. ● El formato es tan espartano que los datos son frecuentemente inservibles sin documentación, ya que puede ser casi imposible adivinar el significado de las diferentes columnas. ● Es particularmente importante para los formatos separados por comas que la documentación de los campos individuales sea precisa. ● Es esencial que la estructura del archivo sea respetada, como una omisión única de un campo puede perturbar la lectura de todos los datos restantes en el archivo sin ninguna posibilidad real de rectificarla, porque no se puede determinar cómo los datos restantes deben ser interpretados. – Más información: ● tools.ietf.org/html/rfc4180
  • 18. CSV
  • 19. XML (eXtensible Markup Language) – ● Es un metalenguaje extensible de etiquetas desarrollado por el W3C que permite definir lenguajes para diferentes necesidades. ● Es el estándar para el intercambio de información estructurada entre diferentes plataformas. ● XML es un formato ampliamente utilizado para el intercambio de datos debido a que ofrece buenas oportunidades de mantener la estructura de los datos y la forma en que los archivos son construidos, y permite a los desarrolladores escribir partes de la documentación con los datos sin interferir con la lectura de ellos. ● Más información: – www.w3.org/standards/xml/core
  • 20. JSON (JavaScript Object Notation) – JSON ● JSON es un formato de archivo que es muy fácil de leer por cualquier lenguaje de programación. ● Su simplicidad significa que es generalmente fácil de procesar para las computadoras a comparación de otros, como lo es XML. – Es un formato ligero para el intercambio de datos basado en la notación literal de objetos de JavaScript. – Su sintaxis es simple, por lo que facilita el tratamiento en los navegadores. – Además, su concisión reduce el tamaño de flujo de datos entre cliente y servidor. – Más información: ● json.org/json-es.html
  • 21. JSON
  • 22. RDF (Resource Description Framework) ● Es una especificación del W3C para el modelado de información y la descripción de recursos, que se hace con la forma de sujeto-predicado-objeto. – La combinación de RDF con otras herramientas permite añadir significado a las páginas y es una de las tecnologías esenciales para la web semántica. – Un formato recomendado por W3C llamado RDF permite representar datos en una forma que facilita la combinación de información de diferentes fuentes. – Los datos RDF pueden ser almacenados en XML y JSON, entre otras serializaciones. – RDF promueve el uso de URLs como identificadores, lo que brinda una manera conveniente de interconectar iniciativas de “Datos Abiertos” existentes. – RDF todavía no se ha generalizado, pero es una tendencia entre iniciativas de Gobierno Abierto, incluso las iniciativas de Linked Data de los gobiernos británico y español. – El inventor de la Web, Tim Berners-Lee, propuso recientemente un esquema de puntuación de cinco estrellas que incluye Linked Data en formato RDF como una meta a alcanzar en las iniciativas de Datos Abiertos. ● Más información: – www.w3.org/standards/techs/rdf#w3c_all
  • 24. Hojas de Cálculo ● Muchas autoridades tienen información que queda en la hoja de cálculo, por ejemplo Microsoft Excel. – Estos datos a menudo pueden ser utilizados inmediatamente con las descripciones correctas de lo que las distintas columnas significan. ● En algunos casos puede ser macros y fórmulas en hojas de cálculo, las cuales pueden ser más incómodas para manipular. – Es recomendable documentar este tipo de cálculos junto a la hoja de cálculo, ya que generalmente es más accesible para los usuarios al leer. ● XLS (Microsoft Office Excel) – Microsoft Office Excel es un formato propietario de Microsoft que muestra la información en celdas organizadas en filas y columnas, y cada celda contiene datos o fórmulas, con referencias relativas o absolutas a otras celdas. – Más información: http://es.wikipedia.org/wiki/Microsoft_Excel
  • 25. XLS
  • 26. Formatos ● Documento de Texto – Documentos clásicos en formatos como Word, ODF, OOXML, o PDF, puede ser suficiente para mostrar ciertos tipos de datos, por ejemplo, listas de correo o equivalente. Puede que sea barato para exponerlos, siempre que ese sea el formato en que la data se haya creado. El formato no da soporte para mantener la estructura coherente, lo cual significa que a veces es difícil para introducir datos por medios automatizados. Asegúrese de utilizar las plantillas como base de documentos en las que se mostrarán los datos para su reutilización, por lo que es al menos posible extraer información de los documentos. – También se puede apoyar el uso posterior de los datos que utilice el marcador de la tipografía tanto como sea posible para que sea más fácil para una máquina para distinguir las partidas (de cualquier tipo) a partir del contenido y así sucesivamente. En general se recomienda no exhibir en formato de procesamiento de texto, si hay datos en un formato diferente. ● Texto – Documentos de texto (. Txt) son muy fáciles para leer en los ordenadores. Por lo general, no incluyen metadatos estructurales, lo que significa que los desarrolladores necesitan para crear un programa de análisis que pueda interpretar cada documento tal y como aparece. – Algunos problemas pueden ser causados al cambiar archivos de texto plano entre sistemas operativos. MS Windows, Mac OSX y otras variantes de Unix tienen su propia forma de decirle a la computadora que se ha llegado al final de la línea. ● Imagen escaneada – Probablemente la forma menos adecuada para la mayoría de los datos, pero ambos TIFF y JPEG 2000-al menos puede marcarlos con la documentación de lo que está en la imagen - adecuada para marcar la imagen de un documento con contenido de texto completo del documento. Puede ser relevante a los datos que muestran como imágenes aquellos datos que no nacen por la vía electrónica -un ejemplo obvio es la antigua escuela de registros y el material de archivo- y una imagen es mejor que nada
  • 27. Formatos ● Formatos propietarios – Algunos sistemas tienen sus propios formatos de datos que pueden guardar o exportar datos. ● A veces puede ser suficiente para exponer los datos en un formato - sobre todo si se espera que el uso de más estaría en un sistema similar del que vienen. – Sobre donde obtener más información sobre estos formatos, debe estar siempre indicado, por ejemplo, al proporcionar un enlace a la página web del proveedor. ● En general se recomienda para mostrar los datos en formato libre, cuando sea factible. ● HTML – Hoy en día, muchos datos se encuentran disponibles en formato HTML en varios sitios. Esto sería suficiente, si se trata de datos estables y de alcance limitado. En algunos casos, sería preferible tener los datos de una forma fácil para descargar y manipular, pero como es barato y fácil de hacer referencia a una página en un sitio web, podría ser un buen punto de partida en la pantalla de datos. – Generalmente, sería más apropiado el uso de tablas en documentos HTML para almacenar datos y, es importante que los distintos campos de datos se muestren y sean dadas identificaciones, que hacen más fácil encontrar y manipular los datos. – Yahoo ha desarrollado una herramienta (http://developer.yahoo.com/yql/) que puede extraer información estructurada de un sitio web, y ciertas herramientas que pueden hacer mucho más con los datos siempre que se encuentren cuidadosamente etiquetados.
  • 29. Formatos ● RSS (Really Symple Sindication) – Es un formato XML para la distribución de contenidos de páginas web. Facilita la publicación de información actualizada a los usuarios suscritos a la fuente RSS sin necesidad de usar un navegador, utilizando un software especializado en este formato. – Más información: • http://es.wikipedia.org/wiki/RSS ● SHP (Shapefile) – Shapefile es un formato propietario estándar de datos espaciales, desarrollado por la compañía ESRI, que almacena tanto la geometría como la información alfanumérica. – Este formato no está preparado para almacenar información topológica. – Más información: • http://es.wikipedia.org/wiki/Shapefile
  • 30. Formatos ● ODS (Operational Data Store) – Es un contenedor de datos activos, es decir operacionales que ayudan al soporte de decisiones y a la operación. – Es un formato de archivo abierto y estándar para el almacenamiento de hojas de cálculo que muestra información en celdas organizadas en filas y columnas, y cada celda contiene datos o fórmulas, con referencias relativas o absolutas a otras celdas. – Más información: • http://es.wikipedia.org/wiki/ODS ● KML (Keyhole Markup Language) – Es una gramática XML y un formato de archivo para la creación de modelos y el almacenamiento de funciones geográficas como puntos, líneas, imágenes, polígonos y modelos que se mostrarán principalmente en aplicaciones de mapas. – KML es utilizado para compartir lugares e información entre aplicaciones. – Más información: • http://es.wikipedia.org/wiki/KML
  • 31. Otros formatos ● DWG: – DWG is a "de facto GIS standard" format native to Autodesk design and GIS software. It can be consumed by a wide variety of Autodesk and non-Autodesk software packages. Read about DWG format on WikiPedia ● ECW: – ECW is a format used for geo-referenced raster images that is highly compressed. Read about ECW on WikiPedia Read about image formats on WikiPedia ● MrSID: – MrSID (pronounced "Mister SID") is a format used for geo-referenced raster images that is highly compressed. The MrSID version of the facetized orthophotos are only about 5% of the size of their GeoTiff versions. Read about MrSID format on WikiPedia Read about image formats on WikiPedia ● Web feed: – A web feed (or news feed) is a data format used for providing users with frequently updated content. Content distributors syndicate a web feed, thereby allowing users to subscribe to it. Read about Web feed on Wikipedia ● Formatos de datos – http://vancouver.ca/your-government/open-data-catalogue.aspx
  • 32. Open Data. Retos y Oportunidades – Junta de Castilla y León
  • 34. El proyecto Aporta (2009) ● Ministerio de Industria, Energía y Turismo( Red.es), y el Ministerio de Hacienda y Administraciones Públicas ● Como objetivos principales – Impulsar el mercado de la reutilización de la información pública. ● Crear las condiciones para el desarrollo del mercado de la reutilización de la información del sector público, – Facilitar que las administraciones acometan dicha apertura; ● Apoyar a las unidades administrativas en las actividades técnicas y organizativas necesarias para que publiquen la información de acceso no restringido, según la legislación vigente, de la forma más amigable para su reutilización. – Fomentar una cultura favorable a la apertura de datos públicos ● Guía Aporta sobre reutilización de la información del sector público – http://datos.gob.es/content/proyecto-aporta
  • 35. Datos. Gob Reutilización de datos ● La reutilización de la información del sector público consiste en el uso por parte de personas físicas o jurídicas de información generada por organismos del sector público, con fines comerciales o no. – La reutilización de la información del sector público contribuye al desarrollo tecnológico, a la explotación estratégica de la información en ámbitos especialmente importantes como el administrativo, el financiero o el jurídico, y a una mejora de la eficiencia de los gobiernos y organismos oficiales. – http://www.datos.gob.es/ ● Hay tres actores o agentes principales en el proceso de reutilización de la información del sector público – Las administraciones públicas. ● Recogen, producen y reproducen gran cantidad de información, completa, fiable y de calidad, en el desempeño de las funciones y de la misión de servicio público que tienen encomendadas. – Las entidades infomediarias. – Son responsables de desarrollar el mercado de contenidos y de añadir valor a la información del sector público gracias un uso inteligente de la misma. – Los usuarios finales. ● Son los principales beneficiarios de los productos y servicios de valor añadido generados a partir de la reutilización de los datos públicos
  • 36. Clasificación de apertura de los datos ● Una estrella: – Ofrecer los datos en cualquier formato, aunque sean difíciles de manipular, como un pdf o una imagen escaneada. ● Dos estrellas: – Entregar los datos de manera estructurada, como en un archivo excel con extension xls. ● Tres estrellas: – Entregar los datos en un formato que no sea propietario, como csv en vez de excel ● Cuatro estrellas( información semántica): – Usar URIs (que es una dirección web de un dato que sirve para enlazarlo con otros datos) para identificar cosas y propiedades, de manera que se pueda apuntar a los datos. – Requiere usar un estándar RDF ● Cinco estrellas (información semántica): – Vincular sus datos con los de otras personas, dotándolos de contexto. En la práctica, a que la información entregada también apunte a otras fuentes de datos. ● Por ejemplo, si publico información sobre un libro dentro de mis datos, enlazar descripciones del libro que pertenezcan a otros publicadores ● Por ejemplo DBPedia o Amazon
  • 37. ¿Bajo qué condiciones pueden utilizarse los recursos del portal? ● Todos los recursos propios de datos.gob.es están disponibles para su reutilización libre y gratuita en los términos del “Aviso legal” del sitio web. ● Los datos a los que da acceso el Catálogo de Información Pública, creado a partir del directorio Bases de datos de libre acceso difundidas por la Administración General del Estado (junio 2008) realizado por el grupo Publidoc-UCM, están sujetos a las condiciones que en cada caso han determinado sus organismos gestores. – En la ficha descriptiva que aparece asociada a los distintos datasets se especifican esas condiciones.
  • 38. Directivas ● Directiva 2003/98/CE del Parlamento Europeo y del Consejo, de 17 de noviembre de 2003, sobre reutilización de la información del sector público ● Ley de Transparencia Directiva 2013/37/UE ● Modificación de la Directiva 2003/98/CE de Reutilización de la Información del Sector Público, aprobada recientemente por el Consejo de la Unión Europea con fecha 15 de abril de 2013.. ● Directiva Inspire – La normativa Inspire para regular un marco común a nivel europeo sobre los datos geográficos como segmento más maduro del Opendata – Regula, desde marzo de 2007, las normas para que pueda existir una infraestructura común de información espacial en la Unión Europea orientada a la aplicación de las políticas comunitarias de medio ambiente. – Puede encontrarse en su propio portal de la UE • http://inspire.ec.europa.eu/ • http://inspire-geoportal.ec.europa.eu/
  • 39. Marco Legal ● Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público. Real Decreto 1671/2009, de 6 de noviembre 36 que la desarrolla parcialmente. – Aviso legal ● http://datos.gob.es/?q=avisolegal_tipo ● Real Decreto 1495/2011,, de 24 de octubre, que introduce el derecho a la reutilización de cuanto documento tenga carácter público ● Guía de aplicación ● Guia Aporta ● Memorando sobre Transparencia y Gobierno Abierto de Barak Obama (Transparency and Open Government ) – http://www.whitehouse.gov/the_press_office/TransparencyandOpenGovernme nt/ – http://www.data.gov/
  • 40. Linked Open Data ● En el proceso de publicación de los datos, tan útil como el propio valor del dato o de la información es su significado. ● Esta metainformación o metadatos completan la publicación avanzada de información para su reutilización. ● Las semánticas (es decir, conjuntos de metadatos) todavía no pueden considerarse de uso generalizado en la publicación de fuentes. ● Los estándares RDF, OWL y diversas implementaciones sobre XML, entre otros, pueden considerarse los mecanismos más extendidos. ● SPARQL – Es un lenguaje de consulta de recursos online, adecuado para la utilización en repositorios de Opendata que cumplan el estándar RDF. ● Normalizado por el RDF Data Access Working Group (DAWG) del Word Wide Web Consortium (W3C)
  • 43. OPEN DATA y Transparencia ● Ejemplo de datos de gastos – https://opendata.socrata.com/Business/Oklahoma-Lo bbyist-Gifts-2006-2008/4cie-i6ie
  • 44. Portal datos Abiertos España ● http://datos.gob.es/
  • 45. Enlaces ● Datos.gob.es – http://datos.gob.es/ ● Junta Andalucía – http://www.juntadeandalucia.es/datosabiertos/portal.html ● Gobierno abierto Comunidad foral de Navarra – http://www.gobiernoabierto.navarra.es/es/open-data ● Junta de Castilla-León – http://www.datosabiertos.jcyl.es/web/jcyl/RISP/es/Plantilla100/1284162109313/_/_ / – http://www.datosabiertos.jcyl.es/ ● CTIC – http://datos.fundacionctic.org/ ● Datos abiertos – http://datosabiertos.com/ ● Google – https://sites.google.com/site/fusiontablestalks/ – Datos públicos ● http://www.google.com/publicdata/directory
  • 46. Enlace iniciativas destacadas● Zaragoza – http://www.zaragoza.es/ciudad/risp/ ● Gijón – http://datos.gijon.es/ ● Pais Vaco – http://opendata.euskadi.net/w79-home/eu/ ● Cataluña – http://dadesobertes.gencat.cat/ca ● EEUU – www.data.gov ● Gran Bretaña – www.data.gov.uk ● 8 principios de los datos abiertos – http://opengovdata.org/ – http://gobernamos.com/ ● Dbepedia – http://dbpedia.org
  • 48. Enlaces● Comunidad open data – http://linkeddata.org/ – http://www.gnoss.com/home – http://red.gnoss.com/comunidad/OpenData ● Enlaces a sitios de datos abiertos – http://datos.gob.es/?q=taxonomy/term/30 – http://datos.gob.es/?q=node/237 ● Spaindata – http://www.spainesdata.es/# – http://www.slideshare.net/datosgob ● Unesco, recursos open educativos – http://www.unesco.org/new/en/communication-and-information/access-to-knowledge/open-educational-resources/ ● Pinterest Buenas practicas – http://www.pinterest.com/pin/188658671865187956/ ● DATA GOV – http://www.data.gov/open-gov/ ● UNDATA – http://data.un.org/ ● OCDE – http://www.oecd.org/ ● Banco Mundial – http://data.worldbank.org/ – http://datos.bancomundial.org/
  • 51. Enlaces ● OpenDataKit – Formularios teléfonos móviles ● https://opendatakit.org/ ● Open Data Institute – http://theodi.org/ ● Datos.gob.es – http://www.slideshare.net/datosgob ● Mapa de iniciativas Open en España – http://www.eldiario.es/turing/big_data/Mapa-iniciativas-Open-Data-Espana_0_277172540.ht ml ● Mapa Iniciativas Mundiales – http://datos.fundacionctic.org/sandbox/catalog/faceted/ ● CTIC – http://datos.fundacionctic.org/
  • 53. Banco Mundial ● Concetos y ejemplos de Open Data – http://data.worldbank.org/open-government-data-toolkit ●