1. Концептот на маскирање на податоци
Маскирањето со податоци е исто така познато како маскирање на податоци. Тоа е технички метод за конвертирање, модификација или покривање на чувствителни податоци, како што се број на мобилен телефон, број на банкарска картичка и други информации кога дадовме правила и политики за маскирање. Оваа техника првенствено се користи за да се спречи чувствителните податоци да се користат директно во несигурни околини.
Принцип за маскирање на податоци: Маскирањето на податоците треба да ги одржи оригиналните карактеристики на податоците, деловните правила и релевантноста на податоците за да се обезбеди дека последователниот развој, тестирањето и анализата на податоците нема да биде засегната од маскирање. Обезбедете конзистентност и валидност на податоците пред и по маскирањето.
2 Класификација на маскирање на податоци
Маскирањето на податоците може да се подели на статички маскирање на податоци (SDM) и динамично маскирање на податоци (DDM).
Статички маскирање на податоци (SDM): Статичко маскирање на податоци бара воспоставување на нова база на податоци за не-продукција на животната средина за изолација од производството на животната средина. Чувствителните податоци се извлечени од базата на податоци за производство и потоа се чуваат во базата на податоци за непродукција. На овој начин, десензибилизираните податоци се изолирани од производството на животната средина, што ги задоволува деловните потреби и обезбедува безбедност на податоците за производство.
Динамично маскирање на податоци (ДДМ): Општо се користи во производството на животната средина за да се десензибилизираат чувствителните податоци во реално време. Понекогаш, потребни се различни нивоа на маскирање за да се прочитаат истите чувствителни податоци во различни ситуации. На пример, различни улоги и дозволи можат да спроведат различни шеми за маскирање.
Апликација за известување за податоци и производи за маскирање на податоци
Ваквите сценарија главно вклучуваат производи за мониторинг на внатрешни податоци или Билборд, производи за надворешни услуги за услуги и извештаи засновани на анализа на податоци, како што се деловни извештаи и преглед на проекти.
3 решение за маскирање на податоци
Шемите за маскирање на вообичаени податоци вклучуваат: невалидност, случајна вредност, замена на податоците, симетрично криптирање, просечна вредност, неутрализирање и заокружување, итн.
Невалидација: Невалидацијата се однесува на криптирање, скратување или криење на чувствителни податоци. Оваа шема обично ги заменува вистинските податоци со посебни симболи (како што е *). Операцијата е едноставна, но корисниците не можат да го знаат форматот на оригиналните податоци, што може да влијае на последователните апликации за податоци.
Случајна вредност: Случајната вредност се однесува на случајната замена на чувствителните податоци (броевите заменуваат цифри, буквите заменуваат букви и знаците ги заменуваат знаците). Овој метод за маскирање ќе обезбеди формат на чувствителни податоци во одреден степен и ќе ја олесни последователната апликација за податоци. Може да бидат потребни речници за маскирање за некои значајни зборови, како што се имиња на луѓе и места.
Замена на податоците: Замената на податоците е слична на маскирањето на нула и случајни вредности, освен тоа што наместо да користите специјални знаци или случајни вредности, податоците за маскирање се заменуваат со одредена вредност.
Симетрично криптирање: Симетрично криптирање е посебен метод за реверзибилна маскирање. Ги криптира чувствителните податоци преку копчињата за криптирање и алгоритмите. Форматот CipherText е во согласност со оригиналните податоци во логичките правила.
Просек: Просечната шема често се користи во статистичките сценарија. За нумерички податоци, прво ги пресметуваме нивните средства, а потоа случајно ги дистрибуираме десензибилизираните вредности околу средната вредност, со што се одржува збирот на константните податоци.
Офсет и заокружување: Овој метод ги менува дигиталните податоци со случајна смена. Заокружувањето на неутрализирање обезбедува приближна автентичност на опсегот, додека ја одржува безбедноста на податоците, што е поблизу до реалните податоци од претходните шеми и има големо значење во сценариото на голема анализа на податоците.
Препорачаниот модел “ML-NPB-5660„За маскирање на податоците
4. Најчесто користени техники за маскирање на податоци
(1). Статистички техники
Земање примероци на податоци и агрегација на податоци
- Земање на податоци: Анализата и евалуацијата на оригиналните податоци поставени со избирање на репрезентативен подмножество на сетот на податоци е важен метод за подобрување на ефективноста на техниките за деидентификација.
- Агрегација на податоци: Како збирка на статистички техники (како што се сумирање, броење, просек, максимум и минимум) применети на атрибути во Microdata, резултатот е репрезентативен на сите записи во оригиналниот сет на податоци.
(2). Криптографија
Криптографијата е вообичаен метод за десензибилизација или подобрување на ефективноста на десензибилизацијата. Различни видови алгоритми за криптирање можат да постигнат различни ефекти на десензибилизација.
- Детерминистичко криптирање: не-случајно симетрично криптирање. Обично ги обработува податоците за лична карта и може да ги декриптира и да го врати шифрираниот текст на оригиналната лична карта кога е потребно, но клучот треба да биде правилно заштитено.
- Неповратно криптирање: Функцијата за хаш се користи за обработка на податоците, што обично се користи за податоци за лична карта. Не може директно да се декриптира и односот со мапирање мора да се зачува. Покрај тоа, поради карактеристиката на функцијата на хаш, може да се случи судир на податоци.
- Хомоморфна шифрирање: Се користи химоморфниот алгоритам на шифри. Неговата карактеристика е дека резултатот од операцијата на шифри на шифри е ист како оној на обичен текст по декрипција. Затоа, најчесто се користи за обработка на нумерички полиња, но не се користи широко од причини за изведба.
(3). Системска технологија
Технологијата за задушување ги брише или штити податоците што не ја исполнуваат заштитата на приватноста, но не ги објавува.
- Маскирање: Се однесува на најчестиот метод на десензибилизација за да се маскира вредноста на атрибутот, како што е бројот на противникот, личната карта е обележана со terвездичка, или адресата е скратена.
- Локално потиснување: се однесува на процесот на бришење на специфични вредности на атрибути (колони), отстранување на полињата за несуштински податоци;
- Запишување на евиденција: се однесува на процесот на бришење на специфични записи (редови), бришење на несуштински записи за податоци.
(4). Технологија на псевдоним
Pseudomanning е техника на деидентификација која користи псевдоним за замена на директен идентификатор (или друг чувствителен идентификатор). Техниките за псевдоним создаваат уникатни идентификатори за секој поединечен предмет на информации, наместо директни или чувствителни идентификатори.
- Може да генерира случајни вредности независно за да одговара на оригиналната лична карта, да ја зачува табелата за мапирање и строго да го контролира пристапот до табелата за мапирање.
- Може да користите и криптирање за производство на псевдоними, но треба правилно да го одржувате клучот за декрипција;
Оваа технологија е широко користена во случај на голем број на независни корисници на податоци, како што е OpenID во сценариото на отворена платформа, каде различни развивачи добиваат различни отвори за истиот корисник.
(5). Техники за генерализација
Техниката за генерализација се однесува на техника на деидентификација што ја намалува грануларноста на избраните атрибути во сет на податоци и обезбедува поопшт и апстрактен опис на податоците. Технологијата за генерализација е лесна за спроведување и може да ја заштити автентичноста на податоците на ниво на евиденција. Најчесто се користи во производи за податоци или извештаи за податоци.
- Заокружување: Вклучува избор на заокружувачка база за избраниот атрибут, како што се нагорна или надолна форензика, давање резултати 100, 500, 1K и 10K
- Техники за кодирање на горниот и долниот дел: Заменете ги вредностите погоре (или подолу) Прагот со праг што го претставува горниот (или дното) ниво, давајќи резултат на „над x“ или „под x“
(6). Техники за рандомизација
Како еден вид техника на деидентификација, технологијата за рандомизација се однесува на модифицирање на вредноста на атрибутот преку рандомизација, така што вредноста по рандомизацијата е различна од оригиналната реална вредност. Овој процес ја намалува можноста на напаѓачот да извлече вредност на атрибут од други вредности на атрибути во истиот запис за податоци, но влијае на автентичноста на добиените податоци, што е вообичаено со податоците за тестот за производство.
Време на објавување: Сеп-27-2022