Pré-processamento de dados
Esse recurso garante que os dados confidenciais sejam processados no lado do cliente antes de serem transmitidos ao data lake, protegendo-os da exposição a entidades externas não autorizadas.
Para obter os melhores resultados de Machine Learning (ML) na identificação automática do processo do agente, mantenha esse recurso desativado (configuração padrão). Isso permite que o ML analise mais dados, resultando em uma melhor análise automática do processo. Habilite esse recurso somente se você precisar fazer hash ou mascarar os dados no banco de dados do data lake.
-
No sistema do cliente, vá para %appdata%\Nice_Systems\CXDiscovery e abra o arquivo CXDClientConfig.json.
-
Para habilitar esse recurso, adicione a seção de configuração a seguir em DataCollection no arquivo CXDClientConfig.json. Defina a propriedade PreProcessing "enabled" como true para habilitar o pré-processamento
"Pré-processamento":
{
"habilitado": "verdadeiro",
"emailToken": "_email_",
"phoneNumberToken": "_telefone_",
"dateTimeToken": "_datetime_",
"IPToken": "_ip_",
"FirstNameToken": "_nome_",
"SurnameToken": "_sobrenome_",
"AirportToken": "_aeroporto_",
"CityToken": "_cidade_",
"CountryToken": "_país_",
"alphanumericToken": "_alfanumérico_",
"numericToken": "_num_",
"customCharacterTokens": "",
"maxKeepingInvalidMessageDays": "30"
}
Para que esse recurso funcione corretamente, certifique-se de que a propriedade DataCollection esteja habilitada no arquivoCXDClientConfig.json. Todos os atributos são opcionais e usarão seus valores padrão se não forem especificados.
Cada atributo permite personalizar como os dados confidenciais ou estruturados são representados ou gerenciados na configuração do cliente.Por exemplo:
Entrada de texto: John Doe, cujo e-mail é john.doe@example.com e o número de telefone é +1-555-1234, mora em Nova York, EUA.
Após a generalização:
Entrada de texto: _name_, cujo email é _email_ e o número de telefone é _phone_number_, mora em _city_, _country_.
-
Mascarando os dados: Todos os dados, exceto as palavras-chave especificadas acima, serão mascarados. Por exemplo:
Antes de mascarar:
Entrada de texto: _nome_, cujo e-mail é _email_ e número de telefone é _phone_number_, mora em _cidade_, _país_.
Após o mascaramento:
Mascarado Entrada de texto: _nome_, CCCC CCCCCC CC _email_ CCC CCCCC CCCC CC _phone_number_, CCCCC CC _cidade_, _país_
-
Hash dos dados: Todos os dados, exceto as palavras-chave especificadas acima, serão hash e atribuídos a estes campos:
-
controlIdentifierHashed
-
textHashed
-
processTitleHashed
Por exemplo:
Antes do hash:
_nome_, cujo e-mail é _email_ e número de telefone é _phone_number_, mora em _cidade_, _país_
Após o hashing:
_nome_d883601c7ec91e2457a40e870755151d96019c7f60e1c7de8efec2a0bbd0db53_email_e1e4485e020ef85beab9c356edcf1846d40d2d12b5ad14f8e502eae357a6ce3a_phone_number_98 698d73a9b09f7c6fe3cda57f1034f9be5c630765cba3df38579262275b26a0_cidade_315f5bdb76d078c43b8ac0064e4a01646a5f0b8f9e4e0fbb2a6a6b9e826dd4b8_country_
-
A tabela abaixo descreve os atributos de configuração.
Atributo |
Descrição |
---|---|
Habilitado |
Esse atributo determina se o recurso de pré-processamento está habilitado ou desabilitado. |
emailToken |
Esse é o espaço reservado para endereços de e-mail em mensagens. Valor padrão: _email_ |
phoneNumberToken |
Esse é o espaço reservado para números de telefone em mensagens. Valor padrão: _phone_ |
dateTimeToken |
Esse é o espaço reservado para valores de data e hora. Valor padrão: _datetime_ |
IPToken |
Este é o espaço reservado para endereços IP. Valor padrão: _ip_ |
Token de Primeiro Nome |
Esse é o espaço reservado para os nomes nas mensagens. Valor padrão: _nome_ |
Token de Sobrenome |
Este é o espaço reservado para sobrenomes (sobrenomes) em mensagens. Valor padrão: _sobrenome_ |
AirportToken |
Este é o espaço reservado para nomes ou códigos de aeroportos. Valor padrão: _aeroporto_ |
Token da cidade |
Este é o espaço reservado para nomes de cidades. Valor padrão: _cidade_ |
Símbolo do país |
Este é o espaço reservado para nomes de países. Valor padrão: _country_ |
alphanumericToken |
Este é o espaço reservado para strings alfanuméricas. Valor padrão: _alfanumérico_ |
numericToken |
Esse é o espaço reservado para valores numéricos. Valor padrão: _núm_ |
customCharacterTokens | Isso especifica caracteres especiais que você deseja substituir por um asterisco (*) durante o pré-processamento. O valor padrão é vazio. |
maxKeepingInvalidMessageDays |
Isso indica o número máximo de dias para manter mensagens inválidas. Valor padrão: 30 (dias) |
Limitações
-
Escopo de reconhecimento de nome: Somente correspondências exatas de nomes (incluindo nomes, sobrenomes, aeroportos, cidades e países) no banco de dados serão reconhecidas e tokenizadas. Variações ou erros ortográficos não serão detectados.
-
Falsos positivos na detecção de nomes: Devido ao alto volume de nomes, algumas palavras sem nome podem ser identificadas incorretamente como nomes.
-
Categorias de nomes sobrepostas: certos nomes podem pertencer a várias categorias (por exemplo, "Geórgia" e "Chade" podem ser nomes, sobrenomes ou nomes de países). A geração de tokens depende da categoria no banco de dados e segue esta sequência: Nome próprio > Sobrenome > Nome do aeroporto > Nome da cidade > País nome.