Која е технологијата и решението за маскирање податоци во брокерот за мрежни пакети?

1. Концептот на маскирање на податоци

Маскирањето на податоците е познато и како маскирање на податоци. Тоа е технички метод за конвертирање, менување или покривање чувствителни податоци како што се број на мобилен телефон, број на банкарска картичка и други информации кога сме дале правила и политики за маскирање. Оваа техника првенствено се користи за да се спречи директно користење на чувствителни податоци во несигурни средини.

Принцип на маскирање на податоци: Маскирањето на податоците треба да ги одржува оригиналните карактеристики на податоците, деловните правила и релевантноста на податоците за да се осигура дека последователниот развој, тестирање и анализа на податоците нема да бидат засегнати од маскирањето. Обезбедете конзистентност и валидност на податоците пред и по маскирањето.

2. Класификација за маскирање на податоци

Маскирањето на податоците може да се подели на статичко маскирање на податоци (SDM) и динамично маскирање на податоци (DDM).

Статичко маскирање на податоци (SDM): Статичкото маскирање на податоците бара воспоставување нова база на податоци за непроизводна средина за изолација од производната средина. Чувствителните податоци се извлекуваат од производствената база на податоци, а потоа се складираат во непроизводната база на податоци. На овој начин, десензибилизираните податоци се изолираат од производствената средина, со што се задоволуваат деловните потреби и се обезбедува сигурност на податоците за производството.

СДМ

Динамичко маскирање на податоци (DDM): Генерално се користи во производствената средина за десензибилизација на чувствителните податоци во реално време. Понекогаш, потребни се различни нивоа на маскирање за да се прочитаат истите чувствителни податоци во различни ситуации. На пример, различни улоги и дозволи може да имплементираат различни шеми за маскирање.

ДДМ

Апликација за пријавување податоци и маскирање на производи на податоци

Ваквите сценарија главно вклучуваат производи или билборд за внатрешен мониторинг на податоци, производи со податоци за надворешни услуги и извештаи засновани на анализа на податоци, како што се деловни извештаи и преглед на проекти.

маскирање на производот за известување за податоци

3. Решение за маскирање податоци

Вообичаените шеми за маскирање на податоци вклучуваат: неважење, случајна вредност, замена на податоци, симетрично шифрирање, просечна вредност, поместување и заокружување итн.

Поништување: Неважењето се однесува на шифрирање, скратување или криење на чувствителни податоци. Оваа шема обично ги заменува вистинските податоци со специјални симболи (како *). Операцијата е едноставна, но корисниците не можат да го знаат форматот на оригиналните податоци, што може да влијае на последователните апликации за податоци.

Случајна вредност: Случајната вредност се однесува на случајна замена на чувствителни податоци (броевите ги заменуваат цифрите, буквите ги заменуваат буквите, а знаците ги заменуваат знаците). Овој метод на маскирање до одреден степен ќе обезбеди формат на чувствителни податоци и ќе ја олесни последователната примена на податоците. Можеби ќе бидат потребни речници за маскирање за некои значајни зборови, како што се имиња на луѓе и места.

Замена на податоци: Замената на податоците е слична на маскирањето на нула и случајни вредности, освен што наместо да се користат специјални знаци или случајни вредности, податоците за маскирање се заменуваат со одредена вредност.

Симетрично шифрирање: Симетричното шифрирање е специјален реверзибилен метод на маскирање. Ги шифрира чувствителните податоци преку клучеви за шифрирање и алгоритми. Форматот на шифриран текст е конзистентен со оригиналните податоци во логичките правила.

Просечна: Просечната шема често се користи во статистички сценарија. За нумерички податоци, прво ја пресметуваме нивната средина, а потоа случајно ги дистрибуираме десензибилизираните вредности околу средната вредност, со што збирот на податоците останува константен.

Офсет и заокружување: Овој метод ги менува дигиталните податоци со случајно поместување. Офсетното заокружување обезбедува приближна автентичност на опсегот додека ја одржува безбедноста на податоците, што е поблиску до реалните податоци од претходните шеми и има големо значење во сценариото за анализа на големи податоци.

ML-NPB-5660-数据脱敏

Препорачај модел“ML-NPB-5660“ за маскирање на податоци

4. Најчесто користени техники за маскирање на податоци

(1). Статистички техники

Земање примероци на податоци и собирање податоци

- Земање примероци на податоци: Анализата и евалуацијата на оригиналниот сет на податоци со избирање на репрезентативно подмножество од множеството податоци е важен метод за подобрување на ефективноста на техниките за деидентификација.

- Агрегација на податоци: Како збирка статистички техники (како што се собирање, броење, просек, максимум и минимум) применети на атрибутите во микроподатоци, резултатот е репрезентативен за сите записи во оригиналниот сет на податоци.

(2). Криптографија

Криптографијата е вообичаен метод за десензибилизација или подобрување на ефективноста на десензибилизацијата. Различни видови алгоритми за шифрирање можат да постигнат различни ефекти на десензибилизација.

- Детерминистичко шифрирање: неслучајно симетрично шифрирање. Обично ги обработува податоците за ID и може да го дешифрира и да го врати шифрениот текст на оригиналниот ID кога е потребно, но клучот треба да биде соодветно заштитен.

- Неповратно шифрирање: Функцијата за хаш се користи за обработка на податоци, што обично се користи за податоци за ID. Не може директно да се дешифрира и врската со мапирањето мора да се зачува. Покрај тоа, поради карактеристиката на функцијата хаш, може да дојде до судир на податоци.

- Хомоморфно шифрирање: Се користи хомоморфниот алгоритам на шифриран текст. Неговата карактеристика е што резултатот од операцијата на шифриран текст е ист како оној на операцијата со обичен текст по дешифрирањето. Затоа, најчесто се користи за обработка на нумерички полиња, но не е широко користен поради перформанси.

(3). Системска технологија

Технологијата за сузбивање ги брише или заштитува податочните ставки што не ја исполнуваат заштитата на приватноста, но не ги објавува.

- Маскирање: се однесува на најчестиот метод на десензибилизација за маскирање на вредноста на атрибутот, како што е бројот на противникот, личната карта е означена со ѕвездичка или адресата е скратена.

- Локално сузбивање: се однесува на процесот на бришење на специфични вредности на атрибути (колони), отстранување на несуштинските полиња со податоци;

- Потиснување на записи: се однесува на процес на бришење на одредени записи (редови), бришење записи на несуштински податоци.

(4). Псевдоним Технологија

Псевдоманинг е техника за деидентификација која користи псевдоним за замена на директен идентификатор (или друг чувствителен идентификатор). Техниките на псевдоними создаваат единствени идентификатори за секој поединечен информативен субјект, наместо директни или чувствителни идентификатори.

- Може самостојно да генерира случајни вредности за да одговараат на оригиналниот ID, да ја зачува табелата за мапирање и строго да го контролира пристапот до табелата за мапирање.

- Можете исто така да користите шифрирање за производство на псевдоними, но треба правилно да го чувате клучот за дешифрирање;

Оваа технологија е широко користена во случај на голем број независни корисници на податоци, како што е OpenID во сценариото на отворена платформа, каде што различни програмери добиваат различни Openids за ист корисник.

(5). Техники на генерализација

Техниката на генерализација се однесува на техника за деидентификација која ја намалува грануларноста на избраните атрибути во множеството податоци и обезбедува поопшт и апстрактен опис на податоците. Технологијата за генерализација е лесна за имплементација и може да ја заштити автентичноста на податоците на ниво на рекорд. Најчесто се користи во податочни производи или извештаи за податоци.

- Заокружување: вклучува избор на основа за заокружување за избраниот атрибут, како што е форензиката нагоре или надолу, давајќи резултати 100, 500, 1K и 10K

- Техники за кодирање на врвот и на дното: заменете ги вредностите над (или под) прагот со праг што го претставува горното (или дното) ниво, што дава резултат „над X“ или „под X“

(6). Техники за рандомизација

Како еден вид техника за деидентификација, технологијата на рандомизација се однесува на менување на вредноста на атрибутот преку рандомизација, така што вредноста по рандомизацијата е различна од оригиналната реална вредност. Овој процес ја намалува способноста на напаѓачот да изведе вредност на атрибутот од други вредности на атрибутот во истиот податочен запис, но влијае на автентичноста на добиените податоци, што е вообичаено со податоците од тестот за производство.


Време на објавување: 27-септември 2022 година