Se usó la API de Cloud Translation para traducir esta página.

Infotipos y detectores de Infotipos

Sensitive Data Protection usa tipos de información, o Infotipos, para definir lo que busca. Un Infotipo es un tipo de dato sensible, como un nombre, una dirección de correo electrónico, un número de teléfono, un número de identificación, un número de tarjeta de crédito, etcétera. Un detector de Infotipo es el mecanismo de detección correspondiente que coincide con los criterios de coincidencia de un Infotipo.

Prácticas recomendadas para seleccionar infoTypes

Comprender tus datos es uno de los primeros pasos fundamentales para protegerlos. Como práctica recomendada, debes recopilar, almacenar y procesar solo la información que necesites para tu negocio. Si identificas los datos que manejas, puedes tomar decisiones fundamentadas para tu empresa, los usuarios y la postura de seguridad y privacidad de los datos.

Algunos de tus casos de uso empresarial pueden requerir cierta información sensible, mientras que otros no. No existe una solución única que admita todos los casos de uso. Por este motivo, Sensitive Data Protection ofrece un control flexible sobre los tipos de datos que se deben analizar. Si usas infoTypes para la desidentificación o el enmascaramiento, también tienes control sobre cuándo y cómo se transforman los datos.

Lineamientos generales

Ten en cuenta los siguientes lineamientos generales cuando selecciones infotipos.

Usa infotipos generales en lugar de infotipos específicos

Si no necesitas que los resultados del análisis muestren los Infotipos específicos que se detectaron, considera usar Infotipos generales en lugar de Infotipos específicos en tus configuraciones de inspección. Para obtener información sobre las ventajas de usar detectores de Infotipo generales en tus solicitudes, consulta Detectores de Infotipos generales y específicos en esta página.

Para obtener una lista completa de los Infotipos generales y los Infotipos específicos que incluyen, consulta Infotipos generales.

Información sensible que no necesitas recopilar

Cada servicio de tu empresa debe recopilar solo los datos que necesita. Por ejemplo, ciertos servicios de tu empresa no necesitan recopilar información financiera. En el caso de esos servicios, considera habilitar detectores de Infotipo como CREDIT_CARD_NUMBER, FINANCIAL_ACCOUNT_NUMBER y otros Infotipos en la categoría de la industria FINANCE.

Es posible que haya casos de uso válidos para recopilar información personal, pero no debes compartirla de forma generalizada con tu equipo. Por ejemplo, un cliente que presenta un ticket de asistencia puede proporcionarte su información de contacto para que puedas comunicarte con él y resolver cualquier problema. No quieres que todos los miembros del equipo que vean el ticket vean la información de identificación personal (PII). Considera habilitar detectores de Infotipo, como PHONE_NUMBER, EMAIL_ADDRESS y otros Infotipos en la categoría de tipo PII.

Categorías de datos sensibles que están sujetas a reglamentaciones de la industria, de privacidad de datos o jurisdiccionales

Ciertos tipos de información se consideran sensibles debido a cómo se emiten o para qué se pueden usar. En otros casos, la información contextual y demográfica se considera una categoría protegida. Estos tipos de información pueden tener restricciones adicionales sobre cómo se recopilan, usan y administran. Considera habilitar los detectores de Infotipo en las siguientes categorías:

Categoría de tipo SPII, GOVERNMENT_ID y DEMOGRAPHIC
Categoría de la industria HEALTH

Cómo elegir entre Infotipos similares

Ten en cuenta lo siguiente cuando elijas entre detectores de Infotipo similares.

Pasaportes

Si no necesitas buscar identificadores de pasaportes de un país específico, elige el detector generalizado: PASSPORT.

Hay disponibles detectores de pasaportes específicos para ciertos países, como UK_PASSPORT. Sin embargo, algunos detectores de pasaportes específicos de cada país solo pueden identificar pasaportes con formatos específicos o con la presencia de pistas contextuales.

Nombres de personas

Cuando busques nombres de personas, usa PERSON_NAME para la mayoría de los casos de uso en lugar de FIRST_NAME o LAST_NAME.

PERSON_NAME es un detector de nombres de personas. Incluye nombres de una sola palabra y nombres completos. Este detector intenta detectar, por ejemplo, nombres como Juana, Juana Pérez y Juana María Pérez con diversas tecnologías, incluido el procesamiento del lenguaje natural. FIRST_NAME y LAST_NAME son subconjuntos de este detector que intentan identificar partes de un nombre. Los resultados de estos detectores siempre son subconjuntos de los resultados de PERSON_NAME.

Fechas y horas

Si no necesitas analizar todas las fechas, considera usar un detector de fechas específico, como DATE_OF_BIRTH. Este detector intenta identificar el contexto que indica que la fecha está relacionada con el nacimiento de una persona.

El detector DATE intenta encontrar todas las fechas, independientemente del contexto. También marca fechas relativas, como hoy o ayer. Del mismo modo, TIME intenta encontrar todas las marcas de tiempo.

Ubicaciones

Si no necesitas buscar todas las ubicaciones, considera usar STREET_ADDRESS en lugar del detector LOCATION. El detector de STREET_ADDRESS intenta encontrar direcciones completas, que suelen ser más precisas que las ubicaciones genéricas y se pueden considerar más sensibles.

El detector de Infotipo LOCATION intenta encontrar cualquier ubicación, independientemente del contexto (por ejemplo, París o Canadá).

Detectores de Infotipo que requieren contexto

Muchos detectores de Infotipo requieren que haya pistas contextuales presentes antes de identificar una coincidencia. Si un detector de Infotipo integrado no marca los elementos que esperas que se marquen porque no hay pistas contextuales cerca de esos elementos, considera usar GENERIC_ID o un detector de Infotipo personalizado.

Tipos de información que no tienen una definición común en la industria

Algunos tipos de información no tienen una definición común en la industria. Algunos ejemplos son los números de historias clínicas, los números de cuenta, los PIN y los códigos de seguridad. Para estos tipos, considera usar infoTypes como GENERIC_ID, FINANCIAL_ACCOUNT_NUMBER y MEDICAL_RECORD_NUMBER. Estos detectores usan una combinación de detección de entidades y contexto para encontrar elementos potencialmente sensibles.

Detectores de Infotipo con mayor latencia

Evita habilitar detectores de Infotipo que no necesites. Si bien los siguientes son útiles en ciertas situaciones, estos infoTypes pueden hacer que las solicitudes se ejecuten mucho más lentamente que las solicitudes que no los incluyen:
- PERSON_NAME
- FEMALE_NAME
- MALE_NAME
- FIRST_NAME
- LAST_NAME
- DATE_OF_BIRTH
- LOCATION
- STREET_ADDRESS
- ORGANIZATION_NAME
Siempre especifica los detectores de Infotipo de forma explícita. No uses una lista de infoTypes vacía.

Cómo usar Infotipos

Sensitive Data Protection usa los detectores de Infotipo en la configuración de sus análisis para determinar qué inspeccionar y cómo transformar los resultados. Los nombres de Infotipo también se usan cuando se muestran o informan resultados de análisis.

Por ejemplo, si deseas buscar direcciones de correo electrónico en un bloque de texto, debes especificar el detector de Infotipo EMAIL_ADDRESS en la configuración de inspección. Si deseas ocultar las direcciones de correo electrónico del bloque de texto, debes especificar EMAIL_ADDRESS en la configuración de inspección y en la de desidentificación para indicar cómo ocultar o transformar ese tipo.

Además, puedes usar una combinación de detectores de Infotipos integrados y personalizados para excluir un subconjunto de direcciones de correo electrónico de los resultados del análisis. Primero, crea un Infotipo personalizado llamado INTERNAL_EMAIL_ADDRESS y configúralo para que se excluyan las direcciones de correo electrónico de prueba internas. Luego, puedes configurar tu análisis con el fin de que incluya resultados para EMAIL_ADDRESS, pero incluye una regla de exclusión que omita cualquier resultado que coincida con INTERNAL_EMAIL_ADDRESS. Si deseas obtener más información sobre las reglas de exclusión y otras funciones de los detectores de Infotipos personalizados, consulta Crea detectores de Infotipos personalizados.

La Protección de datos sensibles proporciona un conjunto de detectores de Infotipo integrados que especificas por nombre, cada uno de los cuales aparece en la referencia del detector de Infotipos. Estos detectores usan una variedad de técnicas para encontrar y clasificar cada tipo. Por ejemplo, algunos tipos requerirán una coincidencia de patrones, algunos pueden tener sumas de verificación matemáticas, algunos tienen restricciones de dígitos especiales y otros pueden tener prefijos específicos o contexto alrededor de los resultados.

Ejemplos

Cuando configuras Sensitive Data Protection para que analice tu contenido, debes incluir los detectores de Infotipo que usarás en la configuración de análisis.

Por ejemplo, en los siguientes JSON y muestras de código, se muestra una solicitud de análisis simple a la API de DLP. Ten en cuenta que el detector PHONE_NUMBER se especifica en inspectConfig, lo que le indica a Sensitive Data Protection que analice la cadena dada en busca de un número de teléfono.