1. డేటా మాస్కింగ్ యొక్క భావన
డేటా మాస్కింగ్ డేటా మాస్కింగ్ అని కూడా అంటారు. మేము మాస్కింగ్ నియమాలు మరియు విధానాలను ఇచ్చినప్పుడు మొబైల్ ఫోన్ నంబర్, బ్యాంక్ కార్డ్ నంబర్ మరియు ఇతర సమాచారం వంటి సున్నితమైన డేటాను మార్చడానికి, సవరించడానికి లేదా కవర్ చేయడానికి ఇది సాంకేతిక పద్ధతి. ఈ సాంకేతికత ప్రధానంగా సున్నితమైన డేటాను నేరుగా నమ్మదగని పరిసరాలలో ఉపయోగించకుండా నిరోధించడానికి ఉపయోగించబడుతుంది.
డేటా మాస్కింగ్ సూత్రం: డేటా మాస్కింగ్ మాస్కింగ్ ద్వారా తదుపరి అభివృద్ధి, పరీక్ష మరియు డేటా విశ్లేషణ ప్రభావితం కాదని నిర్ధారించడానికి అసలు డేటా లక్షణాలు, వ్యాపార నియమాలు మరియు డేటా v చిత్యాన్ని నిర్వహించాలి. మాస్కింగ్ ముందు మరియు తరువాత డేటా స్థిరత్వం మరియు ప్రామాణికతను నిర్ధారించుకోండి.
2. డేటా మాస్కింగ్ వర్గీకరణ
డేటా మాస్కింగ్ను స్టాటిక్ డేటా మాస్కింగ్ (SDM) మరియు డైనమిక్ డేటా మాస్కింగ్ (DDM) గా విభజించవచ్చు.
స్టాటిక్ డేటా మాస్కింగ్ (SDM): స్టాటిక్ డేటా మాస్కింగ్కు ఉత్పత్తి వాతావరణం నుండి వేరుచేయడానికి కొత్త ప్రొడక్షన్ కాని పర్యావరణ డేటాబేస్ స్థాపన అవసరం. సున్నితమైన డేటా ఉత్పత్తి డేటాబేస్ నుండి సేకరించబడుతుంది మరియు తరువాత ఉత్పత్తి కాని డేటాబేస్లో నిల్వ చేయబడుతుంది. ఈ విధంగా, డీసెన్సిటైజ్డ్ డేటా ఉత్పత్తి వాతావరణం నుండి వేరుచేయబడుతుంది, ఇది వ్యాపార అవసరాలను తీర్చగలదు మరియు ఉత్పత్తి డేటా యొక్క భద్రతను నిర్ధారిస్తుంది.
డైనమిక్ డేటా మాస్కింగ్ (DDM): ఇది సాధారణంగా ఉత్పత్తి వాతావరణంలో సున్నితమైన డేటాను నిజ సమయంలో డీసెన్సిటైజ్ చేయడానికి ఉపయోగిస్తారు. కొన్నిసార్లు, వేర్వేరు పరిస్థితులలో ఒకే సున్నితమైన డేటాను చదవడానికి వివిధ స్థాయిల మాస్కింగ్ అవసరం. ఉదాహరణకు, వేర్వేరు పాత్రలు మరియు అనుమతులు వేర్వేరు మాస్కింగ్ పథకాలను అమలు చేయవచ్చు.
డేటా రిపోర్టింగ్ మరియు డేటా ఉత్పత్తులు మాస్కింగ్ అప్లికేషన్
ఇటువంటి దృశ్యాలు ప్రధానంగా అంతర్గత డేటా పర్యవేక్షణ ఉత్పత్తులు లేదా బిల్బోర్డ్, బాహ్య సేవా డేటా ఉత్పత్తులు మరియు వ్యాపార నివేదికలు మరియు ప్రాజెక్ట్ సమీక్ష వంటి డేటా విశ్లేషణ ఆధారంగా నివేదికలు.
3. డేటా మాస్కింగ్ పరిష్కారం
సాధారణ డేటా మాస్కింగ్ పథకాలు: చెల్లనివి, యాదృచ్ఛిక విలువ, డేటా పున ment స్థాపన, సిమెట్రిక్ ఎన్క్రిప్షన్, సగటు విలువ, ఆఫ్సెట్ మరియు రౌండింగ్ మొదలైనవి.
చెల్లనిది: చెల్లనిది ఎన్క్రిప్షన్, కత్తిరించడం లేదా సున్నితమైన డేటాను దాచడం. ఈ పథకం సాధారణంగా నిజమైన డేటాను ప్రత్యేక చిహ్నాలతో ( *వంటివి) భర్తీ చేస్తుంది. ఆపరేషన్ చాలా సులభం, కానీ వినియోగదారులు అసలు డేటా యొక్క ఆకృతిని తెలుసుకోలేరు, ఇది తదుపరి డేటా అనువర్తనాలను ప్రభావితం చేస్తుంది.
యాదృచ్ఛిక విలువ: యాదృచ్ఛిక విలువ సున్నితమైన డేటా యొక్క యాదృచ్ఛిక పున ment స్థాపనను సూచిస్తుంది (సంఖ్యలు అంకెలను భర్తీ చేస్తాయి, అక్షరాలు అక్షరాలను భర్తీ చేస్తాయి మరియు అక్షరాలు అక్షరాలను భర్తీ చేస్తాయి). ఈ మాస్కింగ్ పద్ధతి సున్నితమైన డేటా యొక్క ఆకృతిని కొంతవరకు నిర్ధారిస్తుంది మరియు తదుపరి డేటా అనువర్తనాన్ని సులభతరం చేస్తుంది. వ్యక్తుల పేర్లు మరియు ప్రదేశాలు వంటి కొన్ని అర్ధవంతమైన పదాలకు మాస్కింగ్ డిక్షనరీలు అవసరం కావచ్చు.
డేటా పున ment స్థాపన: డేటా పున ment స్థాపన శూన్య మరియు యాదృచ్ఛిక విలువల మాస్కింగ్ మాదిరిగానే ఉంటుంది, ప్రత్యేక అక్షరాలు లేదా యాదృచ్ఛిక విలువలను ఉపయోగించటానికి బదులుగా, మాస్కింగ్ డేటా నిర్దిష్ట విలువతో భర్తీ చేయబడుతుంది.
సిమెట్రిక్ ఎన్క్రిప్షన్: సిమెట్రిక్ ఎన్క్రిప్షన్ ఒక ప్రత్యేక రివర్సిబుల్ మాస్కింగ్ పద్ధతి. ఇది ఎన్క్రిప్షన్ కీలు మరియు అల్గోరిథంల ద్వారా సున్నితమైన డేటాను గుప్తీకరిస్తుంది. సాంకేతికలిపి ఆకృతి తార్కిక నియమాలలో అసలు డేటాకు అనుగుణంగా ఉంటుంది.
సగటు: సగటు పథకం తరచుగా గణాంక దృశ్యాలలో ఉపయోగించబడుతుంది. సంఖ్యా డేటా కోసం, మేము మొదట వాటి సగటును లెక్కిస్తాము, ఆపై యాదృచ్చికంగా సగటు చుట్టూ డీసెన్సిటైజ్డ్ విలువలను పంపిణీ చేస్తాము, తద్వారా డేటా మొత్తాన్ని స్థిరంగా ఉంచుతుంది.
ఆఫ్సెట్ మరియు రౌండింగ్: ఈ పద్ధతి యాదృచ్ఛిక షిఫ్ట్ ద్వారా డిజిటల్ డేటాను మారుస్తుంది. ఆఫ్సెట్ రౌండింగ్ డేటా యొక్క భద్రతను కొనసాగిస్తూ పరిధి యొక్క సుమారు ప్రామాణికతను నిర్ధారిస్తుంది, ఇది మునుపటి పథకాల కంటే నిజమైన డేటాకు దగ్గరగా ఉంటుంది మరియు పెద్ద డేటా విశ్లేషణ యొక్క దృష్టాంతంలో గొప్ప ప్రాముఖ్యతను కలిగి ఉంది.
సిఫార్సు మోడల్ "ML-NPB-5660"డేటా మాస్కింగ్ కోసం
4. సాధారణంగా ఉపయోగించే డేటా మాస్కింగ్ పద్ధతులు
(1). గణాంక పద్ధతులు
డేటా నమూనా మరియు డేటా అగ్రిగేషన్
- డేటా నమూనా: డేటా సెట్ యొక్క ప్రతినిధి ఉపసమితిని ఎంచుకోవడం ద్వారా అసలు డేటా సెట్ యొక్క విశ్లేషణ మరియు మూల్యాంకనం డి-ఐడెంటిఫికేషన్ టెక్నిక్స్ యొక్క ప్రభావాన్ని మెరుగుపరచడానికి ఒక ముఖ్యమైన పద్ధతి.
- డేటా అగ్రిగేషన్: మైక్రోడేటాలోని లక్షణాలకు వర్తించే గణాంక పద్ధతుల సేకరణగా (సమ్మషన్, లెక్కింపు, సగటు, గరిష్ట మరియు కనిష్టం వంటివి), ఫలితం అసలు డేటా సెట్లోని అన్ని రికార్డులకు ప్రతినిధి.
(2). క్రిప్టోగ్రఫీ
క్రిప్టోగ్రఫీ అనేది డీసెన్సిటైజేషన్ యొక్క ప్రభావాన్ని డీసెన్సిటైజ్ చేయడానికి లేదా పెంచడానికి ఒక సాధారణ పద్ధతి. వివిధ రకాల గుప్తీకరణ అల్గోరిథంలు వేర్వేరు డీసెన్సిటైజేషన్ ప్రభావాలను సాధించగలవు.
- నిర్ణయాత్మక గుప్తీకరణ: యాదృచ్ఛికం కాని సుష్ట ఎన్క్రిప్షన్. ఇది సాధారణంగా ఐడి డేటాను ప్రాసెస్ చేస్తుంది మరియు అవసరమైనప్పుడు సాంకేతికలిపిని డీక్రిప్ట్ చేసి అసలు ఐడికి పునరుద్ధరించగలదు, కాని కీని సరిగ్గా రక్షించాల్సిన అవసరం ఉంది.
- కోలుకోలేని గుప్తీకరణ: డేటాను ప్రాసెస్ చేయడానికి హాష్ ఫంక్షన్ ఉపయోగించబడుతుంది, ఇది సాధారణంగా ID డేటా కోసం ఉపయోగించబడుతుంది. ఇది నేరుగా డీక్రిప్ట్ చేయబడదు మరియు మ్యాపింగ్ సంబంధం సేవ్ చేయాలి. అదనంగా, హాష్ ఫంక్షన్ యొక్క లక్షణం కారణంగా, డేటా తాకిడి సంభవించవచ్చు.
- హోమోమార్ఫిక్ ఎన్క్రిప్షన్: సాంకేతికలిపి హోమోమోర్ఫిక్ అల్గోరిథం ఉపయోగించబడుతుంది. దాని లక్షణం ఏమిటంటే, సాంకేతికలిపి ఆపరేషన్ యొక్క ఫలితం డిక్రిప్షన్ తర్వాత సాదాపాఠం ఆపరేషన్ మాదిరిగానే ఉంటుంది. అందువల్ల, ఇది సాధారణంగా సంఖ్యా క్షేత్రాలను ప్రాసెస్ చేయడానికి ఉపయోగించబడుతుంది, అయితే ఇది పనితీరు కారణాల వల్ల విస్తృతంగా ఉపయోగించబడదు.
(3). సిస్టమ్ టెక్నాలజీ
అణచివేత సాంకేతికత గోప్యతా రక్షణను తీర్చని డేటా అంశాలను తొలగిస్తుంది లేదా కవచం చేస్తుంది, కానీ వాటిని ప్రచురించదు.
.
- స్థానిక అణచివేత: నిర్దిష్ట లక్షణ విలువలను (నిలువు వరుసలు) తొలగించే ప్రక్రియను సూచిస్తుంది, అనవసరమైన డేటా ఫీల్డ్లను తొలగిస్తుంది;
- రికార్డ్ అణచివేత: నిర్దిష్ట రికార్డులను (వరుసలు) తొలగించే ప్రక్రియను సూచిస్తుంది, అనవసరమైన డేటా రికార్డులను తొలగిస్తుంది.
(4). మారుపేరు సాంకేతికత
సూడోమన్నింగ్ అనేది డి-ఐడెంటిఫికేషన్ టెక్నిక్, ఇది ప్రత్యక్ష ఐడెంటిఫైయర్ (లేదా ఇతర సున్నితమైన ఐడెంటిఫైయర్) ను భర్తీ చేయడానికి మారుపేరును ఉపయోగిస్తుంది. మారుపేరు పద్ధతులు ప్రత్యక్ష లేదా సున్నితమైన ఐడెంటిఫైయర్లకు బదులుగా ప్రతి వ్యక్తి సమాచార విషయానికి ప్రత్యేకమైన ఐడెంటిఫైయర్లను సృష్టిస్తాయి.
- ఇది అసలు ID కి అనుగుణంగా యాదృచ్ఛిక విలువలను స్వతంత్రంగా ఉత్పత్తి చేస్తుంది, మ్యాపింగ్ పట్టికను సేవ్ చేస్తుంది మరియు మ్యాపింగ్ పట్టికకు ప్రాప్యతను ఖచ్చితంగా నియంత్రించగలదు.
- మీరు మారుపేర్లను ఉత్పత్తి చేయడానికి ఎన్క్రిప్షన్ను కూడా ఉపయోగించవచ్చు, కాని డిక్రిప్షన్ కీని సరిగ్గా ఉంచాలి;
ఓపెన్ ప్లాట్ఫాం దృష్టాంతంలో ఓపెన్ఐడి వంటి పెద్ద సంఖ్యలో స్వతంత్ర డేటా వినియోగదారుల విషయంలో ఈ సాంకేతికత విస్తృతంగా ఉపయోగించబడుతుంది, ఇక్కడ వేర్వేరు డెవలపర్లు ఒకే వినియోగదారు కోసం వేర్వేరు ఓపెనిడ్లను పొందుతారు.
(5). సాధారణీకరణ పద్ధతులు
జనరలైజేషన్ టెక్నిక్ అనేది డేటా సెట్లో ఎంచుకున్న లక్షణాల యొక్క గ్రాన్యులారిటీని తగ్గించే డి-ఐడెంటిఫికేషన్ టెక్నిక్ను సూచిస్తుంది మరియు డేటా యొక్క మరింత సాధారణ మరియు నైరూప్య వివరణను అందిస్తుంది. జనరలైజేషన్ టెక్నాలజీ అమలు చేయడం సులభం మరియు రికార్డ్-స్థాయి డేటా యొక్క ప్రామాణికతను రక్షించగలదు. ఇది సాధారణంగా డేటా ఉత్పత్తులు లేదా డేటా నివేదికలలో ఉపయోగించబడుతుంది.
.
.
(6). రాండమైజేషన్ పద్ధతులు
ఒక రకమైన డి-ఐడెంటిఫికేషన్ టెక్నిక్గా, రాండమైజేషన్ టెక్నాలజీ అనేది రాండమైజేషన్ ద్వారా లక్షణం యొక్క విలువను సవరించడాన్ని సూచిస్తుంది, తద్వారా రాండమైజేషన్ తర్వాత విలువ అసలు నిజమైన విలువకు భిన్నంగా ఉంటుంది. ఈ ప్రక్రియ అదే డేటా రికార్డ్లోని ఇతర లక్షణ విలువల నుండి లక్షణ విలువను పొందే దాడి చేసేవారి సామర్థ్యాన్ని తగ్గిస్తుంది, అయితే ఫలిత డేటా యొక్క ప్రామాణికతను ప్రభావితం చేస్తుంది, ఇది ఉత్పత్తి పరీక్ష డేటాతో సాధారణం.
పోస్ట్ సమయం: సెప్టెంబర్ -27-2022