Pré-processamento de dados

Esse recurso garante que os dados confidenciais sejam processados no lado do cliente antes de serem transmitidos ao data lake, protegendo-os da exposição a entidades externas não autorizadas.

Para obter os melhores resultados de Machine Learning (ML) na identificação automática do processo do agente, mantenha esse recurso desativado (configuração padrão). Isso permite que o ML analise mais dados, resultando em uma melhor análise automática do processo. Habilite esse recurso somente se você precisar fazer hash ou mascarar os dados no banco de dados do data lake.

  1. No sistema do cliente, vá para %appdata%\Nice_Systems\CXDiscovery e abra o arquivo CXDClientConfig.json.

  2. Para habilitar esse recurso, adicione a seção de configuração a seguir em DataCollection no arquivo CXDClientConfig.json. Defina a propriedade PreProcessing "enabled" como true para habilitar o pré-processamento

    "Pré-processamento":

    {

    "habilitado": "verdadeiro",

    "emailToken": "_email_",

    "phoneNumberToken": "_telefone_",

    "dateTimeToken": "_datetime_",

    "IPToken": "_ip_",

    "FirstNameToken": "_nome_",

    "SurnameToken": "_sobrenome_",

    "AirportToken": "_aeroporto_",

    "CityToken": "_cidade_",

    "CountryToken": "_país_",

    "alphanumericToken": "_alfanumérico_",

    "numericToken": "_num_",

    "customCharacterTokens": "",

    "maxKeepingInvalidMessageDays": "30"

    }

    Para que esse recurso funcione corretamente, certifique-se de que a propriedade DataCollection esteja habilitada no arquivoCXDClientConfig.json. Todos os atributos são opcionais e usarão seus valores padrão se não forem especificados.

    Cada atributo permite personalizar como os dados confidenciais ou estruturados são representados ou gerenciados na configuração do cliente.

    Por exemplo:

    Entrada de texto: John Doe, cujo e-mail é john.doe@example.com e o número de telefone é +1-555-1234, mora em Nova York, EUA.

    Após a generalização:

    Entrada de texto: _name_, cujo email é _email_ e o número de telefone é _phone_number_, mora em _city_, _country_.

  3. Mascarando os dados: Todos os dados, exceto as palavras-chave especificadas acima, serão mascarados. Por exemplo:

    Antes de mascarar:

    Entrada de texto: _nome_, cujo e-mail é _email_ e número de telefone é _phone_number_, mora em _cidade_, _país_.

    Após o mascaramento:

    Mascarado Entrada de texto: _nome_, CCCC CCCCCC CC _email_ CCC CCCCC CCCC CC _phone_number_, CCCCC CC _cidade_, _país_

  4. Hash dos dados: Todos os dados, exceto as palavras-chave especificadas acima, serão hash e atribuídos a estes campos:

    • controlIdentifierHashed

    • textHashed

    • processTitleHashed

    Por exemplo:

    Antes do hash:

    _nome_, cujo e-mail é _email_ e número de telefone é _phone_number_, mora em _cidade_, _país_

    Após o hashing:

    _nome_d883601c7ec91e2457a40e870755151d96019c7f60e1c7de8efec2a0bbd0db53_email_e1e4485e020ef85beab9c356edcf1846d40d2d12b5ad14f8e502eae357a6ce3a_phone_number_98 698d73a9b09f7c6fe3cda57f1034f9be5c630765cba3df38579262275b26a0_cidade_315f5bdb76d078c43b8ac0064e4a01646a5f0b8f9e4e0fbb2a6a6b9e826dd4b8_country_

A tabela abaixo descreve os atributos de configuração.

Atributo

Descrição

Habilitado

Esse atributo determina se o recurso de pré-processamento está habilitado ou desabilitado.
Por padrão, ele é definido comofalse(desabilitado). Quando ativado, ele substitui os campos de dados confidenciais mencionados abaixo em processTitle, url, textMask e controlIdentifier pelos tokens configurados.

emailToken

Esse é o espaço reservado para endereços de e-mail em mensagens.

Valor padrão: _email_

phoneNumberToken

Esse é o espaço reservado para números de telefone em mensagens.

Valor padrão: _phone_

dateTimeToken

Esse é o espaço reservado para valores de data e hora.

Valor padrão: _datetime_

IPToken

Este é o espaço reservado para endereços IP.

Valor padrão: _ip_

Token de Primeiro Nome

Esse é o espaço reservado para os nomes nas mensagens.

Valor padrão: _nome_

Token de Sobrenome

Este é o espaço reservado para sobrenomes (sobrenomes) em mensagens.

Valor padrão: _sobrenome_

AirportToken

Este é o espaço reservado para nomes ou códigos de aeroportos.

Valor padrão: _aeroporto_

Token da cidade

Este é o espaço reservado para nomes de cidades.

Valor padrão: _cidade_

Símbolo do país

Este é o espaço reservado para nomes de países.

Valor padrão: _country_

alphanumericToken

Este é o espaço reservado para strings alfanuméricas.

Valor padrão: _alfanumérico_

numericToken

Esse é o espaço reservado para valores numéricos.

Valor padrão: _núm_

customCharacterTokens Isso especifica caracteres especiais que você deseja substituir por um asterisco (*) durante o pré-processamento. O valor padrão é vazio.
maxKeepingInvalidMessageDays

Isso indica o número máximo de dias para manter mensagens inválidas.

Valor padrão: 30 (dias)

Limitações

  • Escopo de reconhecimento de nome: Somente correspondências exatas de nomes (incluindo nomes, sobrenomes, aeroportos, cidades e países) no banco de dados serão reconhecidas e tokenizadas. Variações ou erros ortográficos não serão detectados.

  • Falsos positivos na detecção de nomes: Devido ao alto volume de nomes, algumas palavras sem nome podem ser identificadas incorretamente como nomes.

  • Categorias de nomes sobrepostas: certos nomes podem pertencer a várias categorias (por exemplo, "Geórgia" e "Chade" podem ser nomes, sobrenomes ou nomes de países). A geração de tokens depende da categoria no banco de dados e segue esta sequência: Nome próprio > Sobrenome > Nome do aeroporto > Nome da cidade > País nome.