Pré-processamento de dados

Esse recurso garante que os dados confidenciais sejam processados no lado do cliente antes de serem transmitidos ao data lake, protegendo-os da exposição a entidades externas não autorizadas.

Para obter os melhores resultados de Machine Learning (ML) na identificação automática do processo do agente, mantenha esse recurso desativado (configuração padrão). Isso permite que o ML analise mais dados, resultando em uma melhor análise automática do processo. Habilite esse recurso somente se você precisar fazer hash ou mascarar os dados no banco de dados do data lake.

No sistema do cliente, vá para %appdata%\Nice_Systems\CXDiscovery e abra o arquivo CXDClientConfig.json.
Para habilitar esse recurso, adicione a seção de configuração a seguir em DataCollection no arquivo CXDClientConfig.json. Defina a propriedade PreProcessing "enabled" como true para habilitar o pré-processamento

"Pré-processamento":

{

"habilitado": "verdadeiro",

"emailToken": "_email_",

"phoneNumberToken": "_telefone_",

"dateTimeToken": "_datetime_",

"IPToken": "_ip_",

"FirstNameToken": "_nome_",

"SurnameToken": "_sobrenome_",

"AirportToken": "_aeroporto_",

"CityToken": "_cidade_",

"CountryToken": "_país_",

"alphanumericToken": "_alfanumérico_",

"numericToken": "_num_",

"customCharacterTokens": "",

"maxKeepingInvalidMessageDays": "30"

}

Para que esse recurso funcione corretamente, certifique-se de que a propriedade DataCollection esteja habilitada no arquivoCXDClientConfig.json. Todos os atributos são opcionais e usarão seus valores padrão se não forem especificados.

Cada atributo permite personalizar como os dados confidenciais ou estruturados são representados ou gerenciados na configuração do cliente.

Por exemplo:

Entrada de texto: John Doe, cujo e-mail é john.doe@example.com e o número de telefone é +1-555-1234, mora em Nova York, EUA.

Após a generalização:

Entrada de texto: _name_, cujo email é _email_ e o número de telefone é _phone_number_, mora em _city_, _country_.
Mascarando os dados: Todos os dados, exceto as palavras-chave especificadas acima, serão mascarados. Por exemplo:

Antes de mascarar:

Entrada de texto: _nome_, cujo e-mail é _email_ e número de telefone é _phone_number_, mora em _cidade_, _país_.

Após o mascaramento:

Mascarado Entrada de texto: _nome_, CCCC CCCCCC CC _email_ CCC CCCCC CCCC CC _phone_number_, CCCCC CC _cidade_, _país_
Hash dos dados: Todos os dados, exceto as palavras-chave especificadas acima, serão hash e atribuídos a estes campos:
- controlIdentifierHashed
- textHashed
- processTitleHashed
Por exemplo:

Antes do hash:

_nome_, cujo e-mail é _email_ e número de telefone é _phone_number_, mora em _cidade_, _país_

Após o hashing:

_nome_d883601c7ec91e2457a40e870755151d96019c7f60e1c7de8efec2a0bbd0db53_email_e1e4485e020ef85beab9c356edcf1846d40d2d12b5ad14f8e502eae357a6ce3a_phone_number_98 698d73a9b09f7c6fe3cda57f1034f9be5c630765cba3df38579262275b26a0_cidade_315f5bdb76d078c43b8ac0064e4a01646a5f0b8f9e4e0fbb2a6a6b9e826dd4b8_country_

A tabela abaixo descreve os atributos de configuração.

Atributo	Descrição
Habilitado	Esse atributo determina se o recurso de pré-processamento está habilitado ou desabilitado. Por padrão, ele é definido comofalse(desabilitado). Quando ativado, ele substitui os campos de dados confidenciais mencionados abaixo em processTitle, url, textMask e controlIdentifier pelos tokens configurados.
emailToken	Esse é o espaço reservado para endereços de e-mail em mensagens. Valor padrão: _email_
phoneNumberToken	Esse é o espaço reservado para números de telefone em mensagens. Valor padrão: _phone_
dateTimeToken	Esse é o espaço reservado para valores de data e hora. Valor padrão: _datetime_
IPToken	Este é o espaço reservado para endereços IP. Valor padrão: _ip_
Token de Primeiro Nome	Esse é o espaço reservado para os nomes nas mensagens. Valor padrão: _nome_
Token de Sobrenome	Este é o espaço reservado para sobrenomes (sobrenomes) em mensagens. Valor padrão: _sobrenome_
AirportToken	Este é o espaço reservado para nomes ou códigos de aeroportos. Valor padrão: _aeroporto_
Token da cidade	Este é o espaço reservado para nomes de cidades. Valor padrão: _cidade_
Símbolo do país	Este é o espaço reservado para nomes de países. Valor padrão: _country_
alphanumericToken	Este é o espaço reservado para strings alfanuméricas. Valor padrão: _alfanumérico_
numericToken	Esse é o espaço reservado para valores numéricos. Valor padrão: _núm_
customCharacterTokens	Isso especifica caracteres especiais que você deseja substituir por um asterisco (*) durante o pré-processamento. O valor padrão é vazio.
maxKeepingInvalidMessageDays	Isso indica o número máximo de dias para manter mensagens inválidas. Valor padrão: 30 (dias)

Limitações

Escopo de reconhecimento de nome: Somente correspondências exatas de nomes (incluindo nomes, sobrenomes, aeroportos, cidades e países) no banco de dados serão reconhecidas e tokenizadas. Variações ou erros ortográficos não serão detectados.
Falsos positivos na detecção de nomes: Devido ao alto volume de nomes, algumas palavras sem nome podem ser identificadas incorretamente como nomes.
Categorias de nomes sobrepostas: certos nomes podem pertencer a várias categorias (por exemplo, "Geórgia" e "Chade" podem ser nomes, sobrenomes ou nomes de países). A geração de tokens depende da categoria no banco de dados e segue esta sequência: Nome próprio > Sobrenome > Nome do aeroporto > Nome da cidade > País nome.