1. Konsep Data Masking
Data masking ogé katelah data masking. Éta mangrupikeun metode téknis pikeun ngarobih, ngarobih atanapi nutupan data sénsitip sapertos nomer telepon sélulér, nomer kartu bank sareng inpormasi anu sanés nalika kami parantos masihan aturan sareng kawijakan masking. Téhnik ieu utamana dipaké pikeun nyegah data sénsitip tina dipaké langsung dina lingkungan teu bisa dipercaya.
Prinsip Masking Data: Masking data kedah ngajaga ciri data asli, aturan bisnis, sareng relevansi data pikeun mastikeun yén pamekaran, uji, sareng analisa data anu salajengna moal kapangaruhan ku masking. Mastikeun konsistensi jeung validitas data saméméh jeung sanggeus masking.
2. Klasifikasi Masking Data
Data masking bisa dibagi kana statik data masking (SDM) jeung dinamis data masking (DDM).
Masker data statik (SDM): Masker data statik merlukeun ngadegna database lingkungan non-produksi anyar pikeun isolasi tina lingkungan produksi. Data sénsitip diekstrak tina pangkalan data produksi teras disimpen dina pangkalan data non-produksi. Ku cara kieu, data desensitized diisolasi tina lingkungan produksi, anu nyumponan kabutuhan bisnis sareng ngajamin kaamanan data produksi.
Masker Data Dinamis (DDM): Ieu umumna dipaké dina lingkungan produksi pikeun desensitize data sénsitip sacara real waktu. Sakapeung, tingkat masking anu béda-béda diperyogikeun pikeun maca data sénsitip anu sami dina kaayaan anu béda. Contona, peran jeung idin béda bisa nerapkeun skéma masking béda.
Pelaporan data sareng aplikasi masking produk data
Skenario sapertos kitu utamina kalebet produk ngawaskeun data internal atanapi papan iklan, produk data jasa éksternal, sareng laporan dumasar kana analisa data, sapertos laporan bisnis sareng tinjauan proyék.
3. Data Masking Solusi
Skéma masking data umum ngawengku: invalidation, nilai acak, ngagantian data, enkripsi simetris, nilai rata, offset na rounding, jsb.
Invalidation: Invalidation nujul kana énkripsi, truncation, atawa nyumputkeun data sénsitip. Skéma ieu biasana ngagentos data nyata sareng simbol khusus (sapertos *). Operasina basajan, tapi pangguna henteu tiasa terang format data asli, anu tiasa mangaruhan aplikasi data anu salajengna.
Nilai acak: Nilai acak nujul kana ngagantian acak data sénsitip (angka ngagantikeun digit, hurup ngaganti hurup, sarta karakter ngaganti karakter). Metoda masking ieu bakal mastikeun format data sénsitip ka extent tangtu jeung mempermudah aplikasi data saterusna. Kamus masking bisa jadi diperlukeun pikeun sababaraha kecap bermakna, kayaning ngaran jalma jeung tempat.
Ngaganti Data: ngagantian Data téh sarupa jeung masking tina nilai null na acak, iwal ti ngagunakeun karakter husus atawa nilai acak, data masking diganti ku nilai husus.
Énkripsi simetris: Énkripsi simetris nyaéta métode masking malik husus. Éta énkripsi data sénsitip ngaliwatan konci énkripsi sareng algoritma. Format ciphertext konsisten sareng data asli dina aturan logis.
Rata-rata: Skéma rata mindeng dipaké dina skenario statistik. Pikeun data numerik, urang mimiti ngitung mean maranéhanana, lajeng ngadistribusikaeun sacara acak nilai desensitized sabudeureun mean, sahingga ngajaga jumlah data konstan.
Offset jeung Rounding: Metoda ieu ngarobah data digital ku shift acak. The offset rounding ensures kaaslian perkiraan rentang bari ngajaga kaamanan data, nu ngadeukeutan ka data nyata ti schemes saméméhna, sarta ngabogaan significance hébat dina skenario analisis data badag.
Model anu Disarankeun"ML-NPB-5660"pikeun Data Masking
4. Téhnik Masking Data anu biasa digunakeun
(1). Téhnik Statistik
Sampling data jeung aggregation data
- Sampling data: Analisis jeung evaluasi susunan data aslina ku milih sawaréh wakil tina susunan data mangrupa métode penting pikeun ngaronjatkeun efektivitas téhnik de-idéntifikasi.
- Aggregation Data: Salaku kumpulan téhnik statistik (kayaning summation, cacah, averaging, maksimum sarta minimum) dilarapkeun ka atribut dina microdata, hasilna mangrupakeun wawakil sadaya rékaman dina susunan data aslina.
(2). Kriptografi
Kriptografi mangrupikeun metode umum pikeun ngadesensitisasi atanapi ningkatkeun efektivitas desensitisasi. Rupa-rupa algoritma énkripsi tiasa ngahontal épék desensitisasi anu béda.
- Énkripsi deterministik: Énkripsi simetris non-acak. Biasana ngolah data ID sareng tiasa ngadekrip sareng malikkeun ciphertext ka ID aslina upami diperyogikeun, tapi koncina kedah dijagi leres.
- Enkripsi teu bisa balik: Fungsi hash dipaké pikeun ngolah data, nu biasana dipaké pikeun data ID. Teu tiasa langsung didekripsi sareng hubungan pemetaan kedah disimpen. Salaku tambahan, kusabab fitur fungsi hash, tabrakan data tiasa kajantenan.
- Enkripsi Homomorphic: Algoritma homomorphic ciphertext dipaké. Karakteristikna nyaéta yén hasil operasi ciphertext sami sareng operasi plaintext saatos dekripsi. Ku alatan éta, éta ilahar dipaké pikeun ngolah widang numerik, tapi teu loba dipaké pikeun alesan kinerja.
(3). Téhnologi Sistim
Téknologi suprési ngahapus atanapi ngalindungan item data anu henteu nyayogikeun panyalindungan privasi, tapi henteu nyebarkeunana.
- Masking: nujul kana métode desensitization paling umum pikeun mask nilai atribut, kayaning nomer lawan, KTP ditandaan tanda bintang, atawa alamatna truncated.
- suprési Lokal: nujul kana prosés mupus nilai atribut husus (kolom), nyoplokkeun widang data non-ésénsial;
- Rékam suprési: nujul kana prosés mupus rékaman husus (baris), mupus rékaman data non-ésénsial.
(4). Téhnologi Pseudonym
Pseudomanning mangrupakeun téhnik de-idéntifikasi anu ngagunakeun pseudonym pikeun ngaganti hiji identifier langsung (atawa identifier sénsitip séjén). Téhnik pseudonym nyieun identifier unik pikeun tiap subyek informasi individu, tinimbang identifier langsung atawa sénsitip.
- Bisa ngahasilkeun nilai acak bebas pikeun pakait jeung ID aslina, simpen tabel pemetaan, tur mastikeun ngadalikeun aksés ka tabel pemetaan.
- Anjeun oge bisa make enkripsi pikeun ngahasilkeun pseudonyms, tapi kudu ngajaga konci dekripsi bener;
Téknologi ieu loba dipaké dina kasus angka nu gede ngarupakeun pamaké data bebas, kayaning OpenID dina skenario platform kabuka, dimana pamekar béda ménta Openids béda pikeun pamaké sarua.
(5). Téhnik Generalisasi
Téhnik generalisasi nujul kana téhnik de-idéntifikasi anu ngurangan granularity atribut dipilih dina susunan data sarta nyadiakeun déskripsi data nu leuwih umum tur abstrak. Téknologi generalisasi gampang dilaksanakeun sareng tiasa ngajagi kaaslian data tingkat catetan. Biasana dianggo dina produk data atanapi laporan data.
- Rounding: ngalibatkeun milih dasar rounding pikeun atribut dipilih, kayaning forensik luhur atawa handap, ngahasilkeun hasil 100, 500, 1K, jeung 10K
- Téhnik coding luhur sareng handap: Ganti nilai di luhur (atanapi di handap) ambang ku ambang anu ngagambarkeun tingkat luhur (atanapi handap), ngahasilkeun hasil "luhureun X" atanapi "handapeun X"
(6). Téhnik Randomization
Salaku jenis téhnik de-idéntifikasi, téhnologi randomization nujul kana ngaropéa nilai hiji atribut ngaliwatan randomization, ku kituna nilai sanggeus randomization béda ti nilai nyata aslina. Proses ieu ngirangan kamampuan panyerang pikeun nurunkeun nilai atribut tina nilai atribut anu sanés dina catetan data anu sami, tapi mangaruhan kaaslian data anu hasilna, anu umum sareng data uji produksi.
waktos pos: Sep-27-2022