SlideShare una empresa de Scribd logo
ARCHIVOS XML,
TEXT ENCODING
INITIATIVE (TEI)
POR:
DARIANA SALAS LUNA
ROSA ANGULO MENDOZA
LAURA TORRES TORRES
ARCHIVOS XML
• El tipo de archivo XML, creado como un formato de datos de texto,. XML es un
lenguaje multiplataforma diseñado para almacenar varios tipos de datos Destaca
por su simplicidad, usabilidad y generabilidad
PARA QUE SIRVE XML
• Representar información estructurada en la web (todos documentos), de modo
que esta información pueda ser almacenada, transmitida, procesada, visualizada e
impresa, por muy diversos tipos de aplicaciones y dispositivos
VENTAJAS DE XML
• Fácilmente procesable
• Separa radicalmente el contenido y el formato de presentación
• Diseñado para cualquier lenguaje y alfabeto. (encoding)
APLICACIONES DE XML
• Publicar e intercambiar contenidos de bases de datos.
• Formatos de mensaje para comunicación entre aplicaciones (B2B)
• Descripción de metacontenidos.
DOCUMENTO XML
• Conjunto de datos con sus respectivas etiquetas de marcado XML.
• Se almacena como texto en archivo con extensión .xml.
• Un documento XML puede incluir cualquier flujo de datos basado en texto: un
articulo de una revista, un resumen de cotizaciones de bolsa, un conjunto de
registros de una base de datos, etc..
¿QUÉ ES?
• Un estándar para codificar textos en el ámbito de las humanidades digitales.
• La TEI se encarga de desarrollar un estándar para representar textos en formato
digital, basado en el metalenguaje XML.
Objetivo:
• encontrar un esquema de codificación común para estructuras textuales
complejas, que permitiese reducir la diversidad de prácticas existentes en aquel
momento por lo que respecta a la codificación de textos digitales.
¿EN QUÉ CONSISTE?
• “La práctica de crear textos legibles por máquina para apoyar la investigación en
humanidades.” Renear (2004)
• Permite recuperar información contenida en documentos, a los cuales puede
acceder de manera sistemática.
LOS MÓDULOS
• El esquema de codificación TEI se encuentra formado por 21 módulos
independientes en los que se declaran los diferentes elementos y atributos XML
disponibles. Pueden combinarse de cualquier forma, pero existen 4 módulos
obligatorios que deben estar presentes en cualquier combinación:
• Tei: Contiene las declaraciones de todos los tipos de datos.
• Core: Se trata de un conjunto de elementos básicos disponibles para la
codificación de cualquier tipo de texto
• Header: Proporciona metadatos descriptivos sobre el recurso codificado.
• textStructure: Contiene la estructura de alto nivel por defecto de cualquier
documento TEI.
OTROS MÓDULOS
• Analysis.
• Certainty.
• Corpus.
• Dictionaries.
• Drama.
• Figures.
• Gaiji.
• Header.
• Iso-fs.
• Linking.
• Msdescription.
• Namesdates.
• Nets.
• Spoken.
• Tagdocs.
• Textcrit.
• Transcr.
• Verse.

Más contenido relacionado

PPTX
Lenguajes de Marcas en EntornosWeb
PPTX
Presentacion
PPTX
Dn13 u3 a28_hhc
PPTX
Dn13 u3 a28_mtf
PPTX
SISTEMAS DE INFORMACIÓN CORPORATIVOS. INTRANET VERSUS INTERNET:
PDF
1° Trabajo de Investigación
PPTX
Proyecto final de metodología de investigación
PPTX
Myrian añarumba 2a3
Lenguajes de Marcas en EntornosWeb
Presentacion
Dn13 u3 a28_hhc
Dn13 u3 a28_mtf
SISTEMAS DE INFORMACIÓN CORPORATIVOS. INTRANET VERSUS INTERNET:
1° Trabajo de Investigación
Proyecto final de metodología de investigación
Myrian añarumba 2a3

La actualidad más candente (16)

PPTX
Presentación1
DOCX
Terminologia
DOCX
Terminologia
PPTX
paginas web e internet
PPTX
Conceptos básicos
PPTX
Dn13 u3 a4_thy
PDF
Hl7 para Iot
PPTX
Alamacenamiento en dropbox
PPTX
Ejercicio de hipervínculo
PPTX
Herramientas de la web 3.0
ODP
Qué es una red
DOCX
Computacion nico
PPT
Base de datos
PPTX
Herramienta interactiva slideshare claudia verjel 10 g
PDF
Scribd, issuu y docstoc
Presentación1
Terminologia
Terminologia
paginas web e internet
Conceptos básicos
Dn13 u3 a4_thy
Hl7 para Iot
Alamacenamiento en dropbox
Ejercicio de hipervínculo
Herramientas de la web 3.0
Qué es una red
Computacion nico
Base de datos
Herramienta interactiva slideshare claudia verjel 10 g
Scribd, issuu y docstoc
Publicidad

Similar a Parseo de xml y TEI (20)

PPTX
PPT
Edición Digital: Lenguajes de marcado
PPTX
PPT
Lenguajes de marcado
PDF
Web semántica
PPTX
Datos semiestructurados Xml
PPTX
unidad 7
PPTX
Xml 3a6 jairon rodriguez
PPTX
Lenguajes de marcas
PDF
Introducción a la edición digital académica
PPT
Dn11 u3 a26_avd
PPTX
Presentación1 bricio vera
PPTX
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
PDF
Explotación y visualización de datos de investigación en Humanidades Digitale...
PDF
"Android de la A a la Z" -- Unidad 5
PPTX
Xml presentacin
PPTX
Html y xml
PPTX
tema:E-LEARNING Y XML
PPTX
Presentación1 viviana
Edición Digital: Lenguajes de marcado
Lenguajes de marcado
Web semántica
Datos semiestructurados Xml
unidad 7
Xml 3a6 jairon rodriguez
Lenguajes de marcas
Introducción a la edición digital académica
Dn11 u3 a26_avd
Presentación1 bricio vera
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
Explotación y visualización de datos de investigación en Humanidades Digitale...
"Android de la A a la Z" -- Unidad 5
Xml presentacin
Html y xml
tema:E-LEARNING Y XML
Presentación1 viviana
Publicidad

Último (20)

PDF
Rendición_Pública_de_Cuentas_Inicial_2019.pdf
PDF
Presentación_rendición_de_cuentas_2020_26-FEB-2021.pdf
PPTX
Grupo 008_Equipo 3_Evidencia 4_ATDI.pptx
PPTX
EPCE_EXCEL 365 CURSO DE ENTRENAMIENTO.pptx
PDF
docsity-diapositivas-de-la-salud-mental.pdf
PPTX
EXPOSICIÓN 2021.pptxhgdfshdghsdgshdghsds
PPTX
Sistema Cardiovascular, funciones, partes
PPTX
Las buenas costumbres en la familiaaaaaaa
PDF
REPORTE DE INCIDENCIA DELICTIVA IRAPUATO 1ER SEMESTRE 2025
PPT
2010_06 FSI_ASBA Pruebas de Stress de Riesgo de Crédito El Caso Peruano MLUY_...
PDF
S01_s1_Sesión 1_pptx.pdf SEMANA 1 TALLER V
PPTX
DICTÁMENES MÉDICO-PSIQUIÁTRICOS Y PSICOLÓGICOS FORENSES 6.pptx
PPTX
DIAPOSITIVA DE ADELA CORTINA - RAMOS ALANIA ANA MARIA.pptx
PDF
Actualización en el uso de uterotónico.pdf
PDF
MOVIMIENTO DE TIERRA Y ASFALTO.pdf 2025A
PPTX
Diapos.pptxcscscscscscscscscscscscscscscsc
PDF
Proyecto Bootcamp - Entregables y Documentación.pdf
PPTX
Tratados-de-Paz-entre-Chile-y-Peru.pptxx
PDF
Principios d. Anatomía y no se que más poner jaja
PDF
Laboratorio#1 Nariz, Boca y Faringe, Subgrupo 1A.pdf
Rendición_Pública_de_Cuentas_Inicial_2019.pdf
Presentación_rendición_de_cuentas_2020_26-FEB-2021.pdf
Grupo 008_Equipo 3_Evidencia 4_ATDI.pptx
EPCE_EXCEL 365 CURSO DE ENTRENAMIENTO.pptx
docsity-diapositivas-de-la-salud-mental.pdf
EXPOSICIÓN 2021.pptxhgdfshdghsdgshdghsds
Sistema Cardiovascular, funciones, partes
Las buenas costumbres en la familiaaaaaaa
REPORTE DE INCIDENCIA DELICTIVA IRAPUATO 1ER SEMESTRE 2025
2010_06 FSI_ASBA Pruebas de Stress de Riesgo de Crédito El Caso Peruano MLUY_...
S01_s1_Sesión 1_pptx.pdf SEMANA 1 TALLER V
DICTÁMENES MÉDICO-PSIQUIÁTRICOS Y PSICOLÓGICOS FORENSES 6.pptx
DIAPOSITIVA DE ADELA CORTINA - RAMOS ALANIA ANA MARIA.pptx
Actualización en el uso de uterotónico.pdf
MOVIMIENTO DE TIERRA Y ASFALTO.pdf 2025A
Diapos.pptxcscscscscscscscscscscscscscscsc
Proyecto Bootcamp - Entregables y Documentación.pdf
Tratados-de-Paz-entre-Chile-y-Peru.pptxx
Principios d. Anatomía y no se que más poner jaja
Laboratorio#1 Nariz, Boca y Faringe, Subgrupo 1A.pdf

Parseo de xml y TEI

  • 1. ARCHIVOS XML, TEXT ENCODING INITIATIVE (TEI) POR: DARIANA SALAS LUNA ROSA ANGULO MENDOZA LAURA TORRES TORRES
  • 2. ARCHIVOS XML • El tipo de archivo XML, creado como un formato de datos de texto,. XML es un lenguaje multiplataforma diseñado para almacenar varios tipos de datos Destaca por su simplicidad, usabilidad y generabilidad PARA QUE SIRVE XML • Representar información estructurada en la web (todos documentos), de modo que esta información pueda ser almacenada, transmitida, procesada, visualizada e impresa, por muy diversos tipos de aplicaciones y dispositivos
  • 3. VENTAJAS DE XML • Fácilmente procesable • Separa radicalmente el contenido y el formato de presentación • Diseñado para cualquier lenguaje y alfabeto. (encoding) APLICACIONES DE XML • Publicar e intercambiar contenidos de bases de datos. • Formatos de mensaje para comunicación entre aplicaciones (B2B) • Descripción de metacontenidos.
  • 4. DOCUMENTO XML • Conjunto de datos con sus respectivas etiquetas de marcado XML. • Se almacena como texto en archivo con extensión .xml. • Un documento XML puede incluir cualquier flujo de datos basado en texto: un articulo de una revista, un resumen de cotizaciones de bolsa, un conjunto de registros de una base de datos, etc..
  • 5. ¿QUÉ ES? • Un estándar para codificar textos en el ámbito de las humanidades digitales. • La TEI se encarga de desarrollar un estándar para representar textos en formato digital, basado en el metalenguaje XML. Objetivo: • encontrar un esquema de codificación común para estructuras textuales complejas, que permitiese reducir la diversidad de prácticas existentes en aquel momento por lo que respecta a la codificación de textos digitales.
  • 6. ¿EN QUÉ CONSISTE? • “La práctica de crear textos legibles por máquina para apoyar la investigación en humanidades.” Renear (2004) • Permite recuperar información contenida en documentos, a los cuales puede acceder de manera sistemática.
  • 7. LOS MÓDULOS • El esquema de codificación TEI se encuentra formado por 21 módulos independientes en los que se declaran los diferentes elementos y atributos XML disponibles. Pueden combinarse de cualquier forma, pero existen 4 módulos obligatorios que deben estar presentes en cualquier combinación: • Tei: Contiene las declaraciones de todos los tipos de datos. • Core: Se trata de un conjunto de elementos básicos disponibles para la codificación de cualquier tipo de texto • Header: Proporciona metadatos descriptivos sobre el recurso codificado. • textStructure: Contiene la estructura de alto nivel por defecto de cualquier documento TEI.
  • 8. OTROS MÓDULOS • Analysis. • Certainty. • Corpus. • Dictionaries. • Drama. • Figures. • Gaiji. • Header. • Iso-fs. • Linking. • Msdescription. • Namesdates. • Nets. • Spoken. • Tagdocs. • Textcrit. • Transcr. • Verse.