Preprocesamiento de datos
Esta característica garantiza que los datos confidenciales se procesen en el lado del cliente antes de transmitirse al lago de datos, protegiéndolos de la exposición a entidades externas no autorizadas.
Para obtener los mejores resultados de aprendizaje automático (ML) en la identificación automática de procesos de agentes, mantenga esta función desactivada (configuración predeterminada). Esto permite que el ML analice más datos, lo que da como resultado un mejor análisis automático de procesos. Habilite esta función solo si debe aplicar hash o enmascarar los datos en la base de datos del lago de datos.
-
En su sistema cliente, vaya a %appdata%\\Nice_Systems\\CXDiscovery y abra el archivo CXDClientConfig.json.
-
Para habilitar esta función, agregue la siguiente sección de configuración en DataCollection en el archivo CXDClientConfig.json. Establezca la propiedad Preprocesamiento "habilitado" en verdadero para habilitar el preprocesamiento
"Preprocesamiento":
{
"habilitado": "verdadero",
"emailToken": "_correo electrónico_",
"phoneNumberToken": "_teléfono_",
"dateTimeToken": "_fecha y hora_",
"IPToken": "_ip_",
"FirstNameToken": "_nombre_",
"SurnameToken": "_apellido_",
"AirportToken": "_aeropuerto_",
"CityToken": "_ciudad_",
"CountryToken": "_país_",
"alphanumericToken": "_alfanumérico_",
"numericToken": "_num_",
"customCharacterTokens": "",
"maxKeepingInvalidMessageDays": "30"
}
Para que esta característica funcione correctamente, asegúrese de que la propiedad DataCollection esté habilitada en el archivoCXDClientConfig.json. Todos los atributos son opcionales y utilizarán sus valores predeterminados si no se especifican.
Cada atributo le permite personalizar cómo se representan o gestionan los datos confidenciales o estructurados en la configuración de su cliente.Por ejemplo:
Texto de entrada: John Doe, cuyo correo electrónico es john.doe@example.com y número de teléfono es +1-555-1234, vive en Nueva York, EE. UU.
Después de la generalización:
Texto de entrada: _name_, cuyo correo electrónico es _email_ y número de teléfono es _phone_number_, vive en _city_, _country_.
-
Enmascaramiento de datos: Se enmascararán todos los datos excepto las palabras clave especificadas anteriormente. Por ejemplo:
Antes de enmascarar:
Texto de entrada: _nombre_, cuyo correo electrónico es _email_ y número de teléfono es _phone_number_, vive en _ciudad_, _país_.
Después del enmascaramiento:
Texto de entrada enmascarado: _nombre_, CCCC CCCCC CC _correo electrónico_ CCC CCCCC CCCCC CC _número_de_teléfono_, CCCCC CC _ciudad_, _país_
-
Hash de los datos: Todos los datos, excepto las palabras clave especificadas anteriormente, se convertirán en hash y se asignarán a estos campos:
-
controlIdentifierHashed
-
texto hash
-
procesoTítuloHashed
Por ejemplo:
Antes del hash:
_name_, cuyo correo electrónico es _email_ y número de teléfono es _phone_number_, vive en _city_, _country_
Después del hash:
_nombre_d883601c7ec91e2457a40e870755151d96019c7f60e1c7de8efec2a0bbd0db53_correo electrónico_e1e4485e020ef85beab9c356edcf1846d40d2d12b5ad14f8e502eae357a6ce3a_teléfono_n número_98698d73a9b09f7c6fe3cda57f1034f9be5c630765cba3df38579262275b26a0_ciudad_315f5bdb76d078c43b8ac0064e4a01646a5f0b8f9e4e0fbb2a6a6b9e826dd4b8_país_
-
La siguiente tabla describe los atributos de configuración.
Atributo |
Descripción |
---|---|
activado |
Este atributo determina si la función de preprocesamiento está habilitada o deshabilitada. |
token de correo electrónico |
Este es el marcador de posición para las direcciones de correo electrónico en los mensajes. Valor predeterminado: _email_ |
token de número de teléfono |
Este es el marcador de posición para los números de teléfono en los mensajes. Valor predeterminado: _phone_ |
token de fecha y hora |
Este es el marcador de posición para los valores de fecha y hora. Valor predeterminado: _datetime_ |
Token IP |
Este es el marcador de posición para direcciones IP. Valor predeterminado: _ip_ |
Token de nombre |
Este es el marcador de posición para los nombres en los mensajes. Valor predeterminado: _firstname_ |
ApellidoToken |
Este es el marcador de posición para los apellidos en los mensajes. Valor predeterminado: _surname_ |
Token de aeropuerto |
Este es el marcador de posición para los nombres o códigos de aeropuertos. Valor predeterminado: _airport_ |
Token de ciudad |
Este es el marcador de posición para los nombres de las ciudades. Valor predeterminado: _city_ |
CountryToken |
Este es el marcador de posición para los nombres de países. Valor predeterminado: _country_ |
token alfanumérico |
Este es el marcador de posición para cadenas alfanuméricas. Valor predeterminado: _alphanumeric_ |
token numérico |
Este es el marcador de posición para valores numéricos. Valor predeterminado: _num_ |
tokens de personaje personalizados | Esto especifica los caracteres especiales que desea reemplazar con un asterisco (*) durante el preprocesamiento. El valor predeterminado está vacío. |
MaxMantenerMensajeInválidoDías |
Esto indica el número máximo de días para conservar los mensajes no válidos. Valor predeterminado: 30 (días) |
Limitaciones
-
Alcance del reconocimiento de nombres: Solo se reconocerán y tokenizarán las coincidencias exactas de nombres (incluidos nombres, apellidos, aeropuertos, ciudades y países) en la base de datos. No se detectarán variaciones ni errores ortográficos.
-
Falsos positivos en la detección de nombres: Debido al alto volumen de nombres, algunas palabras que no son nombres pueden identificarse incorrectamente como nombres.
-
Categorías de nombres superpuestas: Ciertos nombres pueden pertenecer a múltiples categorías (por ejemplo, "Georgia" y "Chad" pueden ser nombres de pila, apellidos o nombres de países). La tokenización depende de la categoría en la base de datos y sigue esta secuencia: Nombre > Apellido > Nombre del aeropuerto > Nombre de la ciudad > Nombre del país.