Preprocesamiento de datos

Esta característica garantiza que los datos confidenciales se procesen en el lado del cliente antes de transmitirse al lago de datos, protegiéndolos de la exposición a entidades externas no autorizadas.

Para obtener los mejores resultados de aprendizaje automático (ML) en la identificación automática de procesos de agentes, mantenga esta función desactivada (configuración predeterminada). Esto permite que el ML analice más datos, lo que da como resultado un mejor análisis automático de procesos. Habilite esta función solo si debe aplicar hash o enmascarar los datos en la base de datos del lago de datos.

  1. En su sistema cliente, vaya a %appdata%\\Nice_Systems\\CXDiscovery y abra el archivo CXDClientConfig.json.

  2. Para habilitar esta función, agregue la siguiente sección de configuración en DataCollection en el archivo CXDClientConfig.json. Establezca la propiedad Preprocesamiento "habilitado" en verdadero para habilitar el preprocesamiento

    "Preprocesamiento":

    {

    "habilitado": "verdadero",

    "emailToken": "_correo electrónico_",

    "phoneNumberToken": "_teléfono_",

    "dateTimeToken": "_fecha y hora_",

    "IPToken": "_ip_",

    "FirstNameToken": "_nombre_",

    "SurnameToken": "_apellido_",

    "AirportToken": "_aeropuerto_",

    "CityToken": "_ciudad_",

    "CountryToken": "_país_",

    "alphanumericToken": "_alfanumérico_",

    "numericToken": "_num_",

    "customCharacterTokens": "",

    "maxKeepingInvalidMessageDays": "30"

    }

    Para que esta característica funcione correctamente, asegúrese de que la propiedad DataCollection esté habilitada en el archivoCXDClientConfig.json. Todos los atributos son opcionales y utilizarán sus valores predeterminados si no se especifican.

    Cada atributo le permite personalizar cómo se representan o gestionan los datos confidenciales o estructurados en la configuración de su cliente.

    Por ejemplo:

    Texto de entrada: John Doe, cuyo correo electrónico es john.doe@example.com y número de teléfono es +1-555-1234, vive en Nueva York, EE. UU.

    Después de la generalización:

    Texto de entrada: _name_, cuyo correo electrónico es _email_ y número de teléfono es _phone_number_, vive en _city_, _country_.

  3. Enmascaramiento de datos: Se enmascararán todos los datos excepto las palabras clave especificadas anteriormente. Por ejemplo:

    Antes de enmascarar:

    Texto de entrada: _nombre_, cuyo correo electrónico es _email_ y número de teléfono es _phone_number_, vive en _ciudad_, _país_.

    Después del enmascaramiento:

    Texto de entrada enmascarado: _nombre_, CCCC CCCCC CC _correo electrónico_ CCC CCCCC CCCCC CC _número_de_teléfono_, CCCCC CC _ciudad_, _país_

  4. Hash de los datos: Todos los datos, excepto las palabras clave especificadas anteriormente, se convertirán en hash y se asignarán a estos campos:

    • controlIdentifierHashed

    • texto hash

    • procesoTítuloHashed

    Por ejemplo:

    Antes del hash:

    _name_, cuyo correo electrónico es _email_ y número de teléfono es _phone_number_, vive en _city_, _country_

    Después del hash:

    _nombre_d883601c7ec91e2457a40e870755151d96019c7f60e1c7de8efec2a0bbd0db53_correo electrónico_e1e4485e020ef85beab9c356edcf1846d40d2d12b5ad14f8e502eae357a6ce3a_teléfono_n número_98698d73a9b09f7c6fe3cda57f1034f9be5c630765cba3df38579262275b26a0_ciudad_315f5bdb76d078c43b8ac0064e4a01646a5f0b8f9e4e0fbb2a6a6b9e826dd4b8_país_

La siguiente tabla describe los atributos de configuración.

Atributo

Descripción

activado

Este atributo determina si la función de preprocesamiento está habilitada o deshabilitada.
De forma predeterminada, está configurado comofalso(deshabilitado). Cuando está habilitado, reemplaza los campos de datos confidenciales mencionados a continuación en processTitle, url, textMasked y controlIdentifier con los tokens configurados.

token de correo electrónico

Este es el marcador de posición para las direcciones de correo electrónico en los mensajes.

Valor predeterminado: _email_

token de número de teléfono

Este es el marcador de posición para los números de teléfono en los mensajes.

Valor predeterminado: _phone_

token de fecha y hora

Este es el marcador de posición para los valores de fecha y hora.

Valor predeterminado: _datetime_

Token IP

Este es el marcador de posición para direcciones IP.

Valor predeterminado: _ip_

Token de nombre

Este es el marcador de posición para los nombres en los mensajes.

Valor predeterminado: _firstname_

ApellidoToken

Este es el marcador de posición para los apellidos en los mensajes.

Valor predeterminado: _surname_

Token de aeropuerto

Este es el marcador de posición para los nombres o códigos de aeropuertos.

Valor predeterminado: _airport_

Token de ciudad

Este es el marcador de posición para los nombres de las ciudades.

Valor predeterminado: _city_

CountryToken

Este es el marcador de posición para los nombres de países.

Valor predeterminado: _country_

token alfanumérico

Este es el marcador de posición para cadenas alfanuméricas.

Valor predeterminado: _alphanumeric_

token numérico

Este es el marcador de posición para valores numéricos.

Valor predeterminado: _num_

tokens de personaje personalizados Esto especifica los caracteres especiales que desea reemplazar con un asterisco (*) durante el preprocesamiento. El valor predeterminado está vacío.
MaxMantenerMensajeInválidoDías

Esto indica el número máximo de días para conservar los mensajes no válidos.

Valor predeterminado: 30 (días)

Limitaciones

  • Alcance del reconocimiento de nombres: Solo se reconocerán y tokenizarán las coincidencias exactas de nombres (incluidos nombres, apellidos, aeropuertos, ciudades y países) en la base de datos. No se detectarán variaciones ni errores ortográficos.

  • Falsos positivos en la detección de nombres: Debido al alto volumen de nombres, algunas palabras que no son nombres pueden identificarse incorrectamente como nombres.

  • Categorías de nombres superpuestas: Ciertos nombres pueden pertenecer a múltiples categorías (por ejemplo, "Georgia" y "Chad" pueden ser nombres de pila, apellidos o nombres de países). La tokenización depende de la categoría en la base de datos y sigue esta secuencia: Nombre > Apellido > Nombre del aeropuerto > Nombre de la ciudad > Nombre del país.