Која е технологијата и решението за маскирање на податоци во мрежниот пакетен брокер?

1. Концептот на маскирање на податоци

Маскирањето на податоци е познато и како маскирање на податоци. Тоа е технички метод за конвертирање, модифицирање или прикривање на чувствителни податоци како што се број на мобилен телефон, број на банкарска картичка и други информации кога сме дале правила и политики за маскирање. Оваа техника првенствено се користи за да се спречи директно користење на чувствителни податоци во несигурни средини.

Принцип на маскирање на податоци: Маскирањето на податоците треба да ги задржи оригиналните карактеристики на податоците, деловните правила и релевантноста на податоците за да се осигури дека последователниот развој, тестирање и анализа на податоците нема да бидат засегнати од маскирањето. Обезбедете конзистентност и валидност на податоците пред и по маскирањето.

2. Класификација на маскирање на податоци

Маскирањето на податоци може да се подели на статичко маскирање на податоци (SDM) и динамичко маскирање на податоци (DDM).

Статичко маскирање на податоци (SDM)Статичкото маскирање на податоци бара воспоставување нова база на податоци во непроизводствената средина за изолација од продукциската средина. Чувствителните податоци се извлекуваат од продукциската база на податоци, а потоа се складираат во непроизводствената база на податоци. На овој начин, десензибилизираните податоци се изолираат од продукциската средина, што ги задоволува деловните потреби и ја обезбедува безбедноста на продукциските податоци.

СДМ

Динамичко маскирање на податоци (DDM)Генерално се користи во производствената средина за десензитизација на чувствителните податоци во реално време. Понекогаш, потребни се различни нивоа на маскирање за читање на истите чувствителни податоци во различни ситуации. На пример, различни улоги и дозволи може да имплементираат различни шеми за маскирање.

ДДМ

Апликација за пријавување податоци и маскирање на производи од податоци

Ваквите сценарија главно вклучуваат производи или билборди за следење на внатрешни податоци, производи за податоци за надворешни услуги и извештаи засновани на анализа на податоци, како што се деловни извештаи и преглед на проекти.

маскирање на производот за известување за податоци

3. Решение за маскирање на податоци

Вообичаените шеми за маскирање на податоци вклучуваат: невалидност, случајна вредност, замена на податоци, симетрично криптирање, просечна вредност, поместување и заокружување итн.

НевалидацијаНевалидација: Се однесува на енкрипција, скратување или криење на чувствителни податоци. Оваа шема обично ги заменува вистинските податоци со специјални симболи (како што е *). Операцијата е едноставна, но корисниците не можат да го знаат форматот на оригиналните податоци, што може да влијае на последователните апликации за податоци.

Случајна вредностСлучајната вредност се однесува на случајната замена на чувствителни податоци (броевите ги заменуваат цифрите, буквите ги заменуваат буквите, а знаците ги заменуваат знаците). Овој метод на маскирање ќе го обезбеди форматот на чувствителните податоци до одреден степен и ќе ја олесни последователната примена на податоците. Речници за маскирање може да бидат потребни за некои значајни зборови, како што се имиња на луѓе и места.

Замена на податоциЗамената на податоци е слична на маскирањето на нулти и случајни вредности, освен што наместо да се користат специјални знаци или случајни вредности, податоците за маскирање се заменуваат со специфична вредност.

Симетрично енкрипцијаСиметричното енкрипција е посебен метод на реверзибилно маскирање. Ги енкриптира чувствителните податоци преку клучеви за енкрипција и алгоритми. Форматот на шифрираниот текст е во согласност со оригиналните податоци во логичките правила.

ПросекПросечната шема често се користи во статистички сценарија. За нумерички податоци, прво ја пресметуваме нивната средна вредност, а потоа случајно ги распределуваме десензибилизираните вредности околу средната вредност, со што збирот на податоците останува константен.

Поместување и заокружувањеОвој метод ги менува дигиталните податоци со случајно поместување. Заокружувањето на офсетот обезбедува приближна автентичност на опсегот, а воедно ја одржува безбедноста на податоците, што е поблиску до реалните податоци отколку претходните шеми и има големо значење во сценариото за анализа на големи податоци.

ML-NPB-5660-数据脱敏

Препорачан модел "ML-NPB-5660„за маскирање на податоци“

4. Најчесто користени техники за маскирање на податоци

(1). Статистички техники

Семплирање на податоци и агрегација на податоци

- Земање примероци од податоци: Анализата и евалуацијата на оригиналниот збир на податоци со избирање на репрезентативен подмножество од збирот на податоци е важен метод за подобрување на ефикасноста на техниките за деидентификација.

- Агрегација на податоци: Како збир на статистички техники (како што се сумирање, броење, усреднување, максимум и минимум) применети на атрибути во микроподатоците, резултатот е репрезентативен за сите записи во оригиналниот збир на податоци.

(2). Криптографија

Криптографијата е вообичаен метод за десензитизација или подобрување на ефикасноста на десензитизацијата. Различни видови алгоритми за енкрипција можат да постигнат различни ефекти на десензитизација.

- Детерминистичко енкрипција: Неслучајно симетрично енкрипција. Обично обработува податоци за идентификација и може да го дешифрира и врати шифрираниот текст во оригиналниот идентификациски број кога е потребно, но клучот треба да биде правилно заштитен.

- Неповратно енкрипција: Хеш функцијата се користи за обработка на податоци, што обично се користи за податоци за идентификација. Не може директно да се дешифрира и односот на мапирање мора да се зачува. Покрај тоа, поради карактеристиката на хеш функцијата, може да се појави судир на податоци.

- Хомоморфно енкрипција: Се користи хомоморфниот алгоритам на шифриран текст. Неговата карактеристика е што резултатот од операцијата на шифриран текст е ист како и од операцијата на обичен текст по дешифрирањето. Затоа, најчесто се користи за обработка на нумерички полиња, но не е широко користен од причини поврзани со перформансите.

(3). Системска технологија

Технологијата за потиснување ги брише или штити податочните ставки што не ги исполнуваат барањата за заштита на приватноста, но не ги објавува.

- Маскирање: се однесува на најчестиот метод на десензитизација за маскирање на вредноста на атрибутот, како што е бројот на противникот, личната карта е означена со ѕвездичка или адресата е скратена.

- Локално потиснување: се однесува на процесот на бришење на специфични вредности на атрибутите (колони), отстранување на непотребни полиња за податоци;

- Потиснување на записи: се однесува на процесот на бришење на специфични записи (редови), бришење на небитни записи со податоци.

(4). Технологија на псевдоними

Псевдоманирањето е техника за деидентификација која користи псевдоним за да го замени директниот идентификатор (или друг чувствителен идентификатор). Техниките на псевдоним создаваат уникатни идентификатори за секој поединечен субјект на информации, наместо директни или чувствителни идентификатори.

- Може независно да генерира случајни вредности за да одговараат на оригиналниот ID, да ја зачува табелата за мапирање и строго да го контролира пристапот до табелата за мапирање.

- Можете исто така да користите енкрипција за да создадете псевдоними, но треба правилно да го чувате клучот за дешифрирање;

Оваа технологија е широко користена во случај на голем број независни корисници на податоци, како што е OpenID во сценариото со отворена платформа, каде што различни развивачи добиваат различни Openid за истиот корисник.

(5). Техники на генерализација

Техниката на генерализација се однесува на техника на деидентификација што ја намалува грануларноста на избраните атрибути во збир на податоци и обезбедува поопшт и апстрактен опис на податоците. Технологијата на генерализација е лесна за имплементација и може да ја заштити автентичноста на податоците на ниво на запис. Најчесто се користи во производи за податоци или извештаи за податоци.

- Заокружување: вклучува избор на основа за заокружување за избраниот атрибут, како што е нагорна или надолу форензика, што дава резултати 100, 500, 1K и 10K

- Техники за кодирање од горе и долу: Заменете ги вредностите над (или под) прагот со праг што го претставува горното (или долното) ниво, давајќи резултат „над X“ или „под X“

(6). Техники на рандомизација

Како еден вид техника за деидентификација, технологијата на рандомизација се однесува на модифицирање на вредноста на атрибутот преку рандомизација, така што вредноста по рандомизацијата е различна од оригиналната реална вредност. Овој процес ја намалува способноста на напаѓачот да изведе вредност на атрибут од други вредности на атрибутот во истиот запис за податоци, но влијае на автентичноста на добиените податоци, што е вообичаено кај податоците од тестот за производство.


Време на објавување: 27 септември 2022 година