Voorverwerking van gegevens

Deze functie zorgt ervoor dat gevoelige gegevens aan de clientzijde worden verwerkt voordat ze naar het data lake worden verzonden. Zo worden de gegevens beschermd tegen blootstelling aan ongeautoriseerde externe instanties.

Voor de beste resultaten met Machine Learning (ML) bij automatische identificatie van agentprocessen moet u deze functie uitgeschakeld houden (standaardinstelling). Hierdoor kan ML meer data analyseren, wat resulteert in betere automatische procesanalyses. Schakel deze functie alleen in als u de gegevens in de data lake-database moet hashen of maskeren.

  1. Ga op uw clientsysteem naar %appdata%\\Nice_Systems\\CXDiscovery en open het bestand CXDClientConfig.json.

  2. Om deze functie in te schakelen, voegt u de volgende configuratiesectie toe onder DataCollection in het bestand CXDClientConfig.json. Stel de eigenschap PreProcessing "enabled" in op true om preprocessing in te schakelen

    "Voorverwerking":

    {

    "ingeschakeld": "waar",

    "emailToken": "_e-mail_",

    "telefoonNummerToken": "_telefoon_",

    "dateTimeToken": "_datumtijd_",

    "IPToken": "_ip_",

    "VoornaamToken": "_voornaam_",

    "AchternaamToken": "_achternaam_",

    "AirportToken": "_luchthaven_",

    "CityToken": "_stad_",

    "LandToken": "_land_",

    "alfanumeriekeToken": "_alfanumeriek_",

    "numeriekToken": "_num_",

    "aangepasteKarakterTokens": "",

    "maxKeepingInvalidMessageDays": "30"

    }

    Om deze functie goed te laten werken, moet u ervoor zorgen dat de eigenschap DataCollection is ingeschakeld in het bestandCXDClientConfig.json. Alle kenmerken zijn optioneel en gebruiken hun standaardwaarden als ze niet worden opgegeven.

    Met elk kenmerk kunt u aanpassen hoe gevoelige of gestructureerde gegevens worden weergegeven of beheerd in uw clientconfiguratie.

    Voorbeeld:

    Invoertekst: John Doe, e-mailadres john.doe@example.com en telefoonnummer +1-555-1234, woont in New York, VS.

    Na generalisatie:

    Invoertekst: _naam_, met e-mailadres _e-mail_ en telefoonnummer _telefoonnummer_, woont in _stad_, _land_.

  3. De gegevens maskeren: Alle gegevens, behalve de hierboven gespecificeerde trefwoorden, worden gemaskeerd. Bijvoorbeeld:

    Voor het maskeren:

    Invoertekst: _name_, met e-mailadres _email_ en telefoonnummer _phone_number_, woont in _city_, _country_.

    Na het maskeren:

    Gemaskeerde invoertekst: _naam_, CCCC CCCCC CC _e-mail_ CCC CCCCC CCCCC CC _telefoonnummer_, CCCCC CC _stad_, _land_

  4. Hashing van de gegevens: Alle gegevens, behalve de hierboven gespecificeerde trefwoorden, worden gehasht en toegewezen aan deze velden:

    • controlIdentifierHashed

    • tekstHashed

    • procesTitelHashed

    Bijvoorbeeld:

    Vóór het hashen:

    _name_, wiens e-mailadres _email_ is en telefoonnummer _phone_number_, woont in _city_, _country_

    Na het hashen:

    _naam_d883601c7ec91e2457a40e870755151d96019c7f60e1c7de8efec2a0bbd0db53_e-mailadres_e1e4485e020ef85beab9c356edcf1846d40d2d12b5ad14f8e502eae357a6ce3a_telefoon_n umber_98698d73a9b09f7c6fe3cda57f1034f9be5c630765cba3df38579262275b26a0_stad_315f5bdb76d078c43b8ac0064e4a01646a5f0b8f9e4e0fbb2a6a6b9e826dd4b8_land_

De onderstaande tabel beschrijft de configuratiekenmerken.

Attribuut

Beschrijving

ingeschakeld

Dit kenmerk bepaalt of de voorverwerkingsfunctie is in- of uitgeschakeld.
Standaard staat deze opfalse(uitgeschakeld). Wanneer ingeschakeld, worden de gevoelige gegevensvelden die hieronder worden genoemd in processTitle, url, textMasked en controlIdentifier vervangen door de geconfigureerde tokens.

e-mailToken

Dit is de tijdelijke aanduiding voor e-mailadressen in berichten.

Standaardwaarde: _email_

telefoonnummerToken

Dit is de tijdelijke aanduiding voor telefoonnummers in berichten.

Standaardwaarde: _phone_

datumTijdToken

Dit is de tijdelijke aanduiding voor datum- en tijdwaarden.

Standaardwaarde: _datetime_

IPToken

Dit is de tijdelijke aanduiding voor IP-adressen.

Standaardwaarde: _ip_

VoornaamToken

Dit is de tijdelijke aanduiding voor voornamen in berichten.

Standaardwaarde: _voornaam_

AchternaamToken

Dit is de tijdelijke aanduiding voor achternamen in berichten.

Standaardwaarde: _achternaam_

LuchthavenToken

Dit is de tijdelijke aanduiding voor luchthavennamen of -codes.

Standaardwaarde: _luchthaven_

CityToken

Dit is de tijdelijke aanduiding voor stadsnamen.

Standaardwaarde: _stad_

LandToken

Dit is de tijdelijke aanduiding voor landnamen.

Standaardwaarde: _land_

alfanumeriek token

Dit is de tijdelijke aanduiding voor alfanumerieke tekenreeksen.

Standaardwaarde: _alfanumeriek_

numeriekToken

Dit is de tijdelijke aanduiding voor numerieke waarden.

Standaardwaarde: _num_

aangepasteKarakterTokens Hiermee geeft u de speciale tekens op die u tijdens de voorverwerking wilt vervangen door een asterisk (*). De standaardwaarde is leeg.
maxKeepingInvalidMessageDays

Dit geeft het maximale aantal dagen aan dat ongeldige berichten bewaard moeten blijven.

Standaardwaarde: 30 (dagen)

Beperkingen

  • Naamherkenningsbereik: Alleen exacte overeenkomsten van namen (inclusief voornamen, achternamen, luchthavens, steden en landen) in de database worden herkend en getokeniseerd. Variaties of spelfouten worden niet gedetecteerd.

  • Vals-positieve resultaten bij naamdetectie: Vanwege het grote aantal namen kunnen sommige niet-naamwoorden ten onrechte als namen worden geïdentificeerd.

  • Overlappende naamcategorieën: Bepaalde namen kunnen tot meerdere categorieën behoren (bijvoorbeeld "Georgia" en "Chad" kunnen voornamen, achternamen of landnamen zijn). Tokenisatie is afhankelijk van de categorie in de database en verloopt volgens deze volgorde: Voornaam > Achternaam > Luchthavennaam > Plaatsnaam > Landnaam.