నెట్‌వర్క్ ప్యాకెట్ బ్రోకర్‌లో డేటా మాస్కింగ్ టెక్నాలజీ మరియు సొల్యూషన్ ఏమిటి?

1. డేటా మాస్కింగ్ భావన

డేటా మాస్కింగ్‌ని డేటా మాస్కింగ్ అని కూడా అంటారు.మేము మాస్కింగ్ నియమాలు మరియు విధానాలను అందించినప్పుడు మొబైల్ ఫోన్ నంబర్, బ్యాంక్ కార్డ్ నంబర్ మరియు ఇతర సమాచారం వంటి సున్నితమైన డేటాను మార్చడం, సవరించడం లేదా కవర్ చేయడం సాంకేతిక పద్ధతి.ఈ సాంకేతికత ప్రాథమికంగా సున్నితమైన డేటాను విశ్వసనీయత లేని పరిసరాలలో నేరుగా ఉపయోగించకుండా నిరోధించడానికి ఉపయోగించబడుతుంది.

డేటా మాస్కింగ్ సూత్రం: డేటా మాస్కింగ్ అనేది మాస్కింగ్ ద్వారా తదుపరి అభివృద్ధి, పరీక్ష మరియు డేటా విశ్లేషణ ప్రభావితం కాదని నిర్ధారించడానికి అసలు డేటా లక్షణాలు, వ్యాపార నియమాలు మరియు డేటా ఔచిత్యాన్ని నిర్వహించాలి.మాస్కింగ్‌కు ముందు మరియు తర్వాత డేటా స్థిరత్వం మరియు చెల్లుబాటును నిర్ధారించుకోండి.

2. డేటా మాస్కింగ్ వర్గీకరణ

డేటా మాస్కింగ్‌ను స్టాటిక్ డేటా మాస్కింగ్ (SDM) మరియు డైనమిక్ డేటా మాస్కింగ్ (DDM)గా విభజించవచ్చు.

స్టాటిక్ డేటా మాస్కింగ్ (SDM): స్టాటిక్ డేటా మాస్కింగ్‌కు ఉత్పత్తి వాతావరణం నుండి వేరుచేయడం కోసం కొత్త ఉత్పత్తియేతర పర్యావరణ డేటాబేస్ ఏర్పాటు అవసరం.ఉత్పాదక డేటాబేస్ నుండి సున్నితమైన డేటా సంగ్రహించబడుతుంది మరియు ఉత్పత్తియేతర డేటాబేస్లో నిల్వ చేయబడుతుంది.ఈ విధంగా, డీసెన్సిటైజ్ చేయబడిన డేటా ఉత్పత్తి వాతావరణం నుండి వేరు చేయబడుతుంది, ఇది వ్యాపార అవసరాలను తీరుస్తుంది మరియు ఉత్పత్తి డేటా యొక్క భద్రతను నిర్ధారిస్తుంది.

SDM

డైనమిక్ డేటా మాస్కింగ్ (DDM): ఇది సాధారణంగా సెన్సిటివ్ డేటాను నిజ సమయంలో డీసెన్సిటైజ్ చేయడానికి ఉత్పత్తి వాతావరణంలో ఉపయోగించబడుతుంది.కొన్నిసార్లు, వేర్వేరు పరిస్థితులలో ఒకే సున్నితమైన డేటాను చదవడానికి వివిధ స్థాయిల మాస్కింగ్ అవసరం.ఉదాహరణకు, విభిన్న పాత్రలు మరియు అనుమతులు వేర్వేరు మాస్కింగ్ పథకాలను అమలు చేయవచ్చు.

DDM

డేటా రిపోర్టింగ్ మరియు డేటా ఉత్పత్తుల మాస్కింగ్ అప్లికేషన్

ఇటువంటి దృశ్యాలలో ప్రధానంగా అంతర్గత డేటా పర్యవేక్షణ ఉత్పత్తులు లేదా బిల్‌బోర్డ్, బాహ్య సేవా డేటా ఉత్పత్తులు మరియు వ్యాపార నివేదికలు మరియు ప్రాజెక్ట్ సమీక్ష వంటి డేటా విశ్లేషణ ఆధారంగా నివేదికలు ఉంటాయి.

డేటా రిపోర్టింగ్ ఉత్పత్తి మాస్కింగ్

3. డేటా మాస్కింగ్ సొల్యూషన్

సాధారణ డేటా మాస్కింగ్ పథకాలు: చెల్లుబాటు, యాదృచ్ఛిక విలువ, డేటా రీప్లేస్‌మెంట్, సిమెట్రిక్ ఎన్‌క్రిప్షన్, సగటు విలువ, ఆఫ్‌సెట్ మరియు రౌండింగ్ మొదలైనవి.

చెల్లుబాటు కాదు: చెల్లుబాటు అనేది సున్నితమైన డేటా యొక్క గుప్తీకరణ, కత్తిరించడం లేదా దాచడాన్ని సూచిస్తుంది.ఈ పథకం సాధారణంగా నిజమైన డేటాను ప్రత్యేక చిహ్నాలతో భర్తీ చేస్తుంది (* వంటివి).ఆపరేషన్ చాలా సులభం, కానీ వినియోగదారులు అసలు డేటా యొక్క ఆకృతిని తెలుసుకోలేరు, ఇది తదుపరి డేటా అప్లికేషన్‌లను ప్రభావితం చేయవచ్చు.

యాదృచ్ఛిక విలువ: యాదృచ్ఛిక విలువ అనేది సున్నితమైన డేటా యొక్క యాదృచ్ఛిక భర్తీని సూచిస్తుంది (సంఖ్యలు అంకెలను భర్తీ చేస్తాయి, అక్షరాలు అక్షరాలను భర్తీ చేస్తాయి మరియు అక్షరాలు అక్షరాలను భర్తీ చేస్తాయి).ఈ మాస్కింగ్ పద్ధతి కొంత వరకు సున్నితమైన డేటా యొక్క ఆకృతిని నిర్ధారిస్తుంది మరియు తదుపరి డేటా అప్లికేషన్‌ను సులభతరం చేస్తుంది.వ్యక్తులు మరియు స్థలాల పేర్లు వంటి కొన్ని అర్థవంతమైన పదాల కోసం మాస్కింగ్ డిక్షనరీలు అవసరం కావచ్చు.

డేటా భర్తీ: డేటా రీప్లేస్‌మెంట్ అనేది శూన్య మరియు యాదృచ్ఛిక విలువల మాస్కింగ్ మాదిరిగానే ఉంటుంది, ప్రత్యేక అక్షరాలు లేదా యాదృచ్ఛిక విలువలను ఉపయోగించకుండా, మాస్కింగ్ డేటా నిర్దిష్ట విలువతో భర్తీ చేయబడుతుంది.

సిమెట్రిక్ ఎన్క్రిప్షన్: సిమెట్రిక్ ఎన్క్రిప్షన్ అనేది ఒక ప్రత్యేక రివర్సిబుల్ మాస్కింగ్ పద్ధతి.ఇది ఎన్‌క్రిప్షన్ కీలు మరియు అల్గారిథమ్‌ల ద్వారా సున్నితమైన డేటాను ఎన్‌క్రిప్ట్ చేస్తుంది.సైఫర్‌టెక్స్ట్ ఫార్మాట్ లాజికల్ రూల్స్‌లోని ఒరిజినల్ డేటాకు అనుగుణంగా ఉంటుంది.

సగటు: సగటు పథకం తరచుగా గణాంక దృశ్యాలలో ఉపయోగించబడుతుంది.సంఖ్యా డేటా కోసం, మేము మొదట వాటి సగటును గణిస్తాము, ఆపై సగటు చుట్టూ డీసెన్సిటైజ్ చేయబడిన విలువలను యాదృచ్ఛికంగా పంపిణీ చేస్తాము, తద్వారా డేటా మొత్తాన్ని స్థిరంగా ఉంచుతాము.

ఆఫ్‌సెట్ మరియు రౌండింగ్: ఈ పద్ధతి యాదృచ్ఛిక షిఫ్ట్ ద్వారా డిజిటల్ డేటాను మారుస్తుంది.ఆఫ్‌సెట్ రౌండింగ్ అనేది డేటా యొక్క భద్రతను కొనసాగించేటప్పుడు పరిధి యొక్క ఉజ్జాయింపు ప్రామాణికతను నిర్ధారిస్తుంది, ఇది మునుపటి స్కీమ్‌ల కంటే వాస్తవ డేటాకు దగ్గరగా ఉంటుంది మరియు పెద్ద డేటా విశ్లేషణ యొక్క దృష్టాంతంలో గొప్ప ప్రాముఖ్యతను కలిగి ఉంటుంది.

ML-NPB-5660-数据脱敏

సిఫార్సు మోడల్ "ML-NPB-5660"డేటా మాస్కింగ్ కోసం

4. సాధారణంగా ఉపయోగించే డేటా మాస్కింగ్ టెక్నిక్స్

(1)స్టాటిస్టికల్ టెక్నిక్స్

డేటా నమూనా మరియు డేటా అగ్రిగేషన్

- డేటా నమూనా: డేటా సెట్ యొక్క ప్రతినిధి ఉపసమితిని ఎంచుకోవడం ద్వారా అసలైన డేటా సెట్ యొక్క విశ్లేషణ మరియు మూల్యాంకనం డి-ఐడెంటిఫికేషన్ టెక్నిక్‌ల ప్రభావాన్ని మెరుగుపరచడానికి ఒక ముఖ్యమైన పద్ధతి.

- డేటా అగ్రిగేషన్: మైక్రోడేటాలోని అట్రిబ్యూట్‌లకు వర్తింపజేయబడిన గణాంక పద్ధతుల (సమ్మషన్, లెక్కింపు, సగటు, గరిష్ట మరియు కనిష్టం వంటివి) సమాహారంగా, ఫలితం అసలైన డేటా సెట్‌లోని అన్ని రికార్డ్‌లకు ప్రాతినిధ్యం వహిస్తుంది.

(2)క్రిప్టోగ్రఫీ

క్రిప్టోగ్రఫీ అనేది డీసెన్సిటైజేషన్ యొక్క ప్రభావాన్ని డీసెన్సిటైజ్ చేయడానికి లేదా మెరుగుపరచడానికి ఒక సాధారణ పద్ధతి.వివిధ రకాల ఎన్‌క్రిప్షన్ అల్గారిథమ్‌లు విభిన్న డీసెన్సిటైజేషన్ ప్రభావాలను సాధించగలవు.

- డిటర్మినిస్టిక్ ఎన్‌క్రిప్షన్: యాదృచ్ఛికం కాని సిమెట్రిక్ ఎన్‌క్రిప్షన్.ఇది సాధారణంగా ID డేటాను ప్రాసెస్ చేస్తుంది మరియు అవసరమైనప్పుడు సాంకేతికలిపిని అసలు IDకి డీక్రిప్ట్ చేయవచ్చు మరియు పునరుద్ధరించవచ్చు, అయితే కీ సరిగ్గా రక్షించబడాలి.

- ఇర్రివర్సిబుల్ ఎన్‌క్రిప్షన్: డేటాను ప్రాసెస్ చేయడానికి హాష్ ఫంక్షన్ ఉపయోగించబడుతుంది, ఇది సాధారణంగా ID డేటా కోసం ఉపయోగించబడుతుంది.ఇది నేరుగా డీక్రిప్ట్ చేయబడదు మరియు మ్యాపింగ్ సంబంధాన్ని తప్పనిసరిగా సేవ్ చేయాలి.అదనంగా, హాష్ ఫంక్షన్ యొక్క లక్షణం కారణంగా, డేటా తాకిడి సంభవించవచ్చు.

- హోమోమార్ఫిక్ ఎన్‌క్రిప్షన్: సైఫర్‌టెక్స్ట్ హోమోమోర్ఫిక్ అల్గోరిథం ఉపయోగించబడుతుంది.దీని విశిష్టత ఏమిటంటే సైఫర్‌టెక్స్ట్ ఆపరేషన్ ఫలితం డిక్రిప్షన్ తర్వాత సాదాపాఠం ఆపరేషన్‌కు సమానంగా ఉంటుంది.అందువల్ల, ఇది సాధారణంగా సంఖ్యా ఫీల్డ్‌లను ప్రాసెస్ చేయడానికి ఉపయోగించబడుతుంది, కానీ పనితీరు కారణాల కోసం ఇది విస్తృతంగా ఉపయోగించబడదు.

(3)సిస్టమ్ టెక్నాలజీ

అణచివేత సాంకేతికత గోప్యతా రక్షణకు అనుగుణంగా లేని డేటా అంశాలను తొలగిస్తుంది లేదా షీల్డ్ చేస్తుంది, కానీ వాటిని ప్రచురించదు.

- మాస్కింగ్: ఇది ప్రత్యర్థి సంఖ్య, ID కార్డ్ నక్షత్రం గుర్తుతో గుర్తించబడింది లేదా చిరునామా కుదించబడి ఉండటం వంటి లక్షణ విలువను మాస్క్ చేయడానికి అత్యంత సాధారణ డీసెన్సిటైజేషన్ పద్ధతిని సూచిస్తుంది.

- స్థానిక అణచివేత: నిర్దిష్ట అట్రిబ్యూట్ విలువలను (నిలువు వరుసలు) తొలగించే ప్రక్రియను సూచిస్తుంది, అనవసరమైన డేటా ఫీల్డ్‌లను తొలగించడం;

- రికార్డ్ సప్రెషన్: నిర్దిష్ట రికార్డులను (వరుసలు) తొలగించడం, అనవసరమైన డేటా రికార్డులను తొలగించడం వంటి ప్రక్రియను సూచిస్తుంది.

(4)మారుపేరు టెక్నాలజీ

సూడోమానింగ్ అనేది డి-ఐడెంటిఫికేషన్ టెక్నిక్, ఇది డైరెక్ట్ ఐడెంటిఫైయర్ (లేదా ఇతర సెన్సిటివ్ ఐడెంటిఫైయర్) స్థానంలో మారుపేరును ఉపయోగిస్తుంది.మారుపేరు పద్ధతులు ప్రత్యక్ష లేదా సున్నితమైన ఐడెంటిఫైయర్‌లకు బదులుగా ప్రతి వ్యక్తిగత సమాచార విషయానికి ప్రత్యేకమైన ఐడెంటిఫైయర్‌లను సృష్టిస్తాయి.

- ఇది అసలైన IDకి అనుగుణంగా స్వతంత్రంగా యాదృచ్ఛిక విలువలను రూపొందించగలదు, మ్యాపింగ్ పట్టికను సేవ్ చేస్తుంది మరియు మ్యాపింగ్ పట్టికకు ప్రాప్యతను ఖచ్చితంగా నియంత్రించవచ్చు.

- మీరు మారుపేర్లను ఉత్పత్తి చేయడానికి గుప్తీకరణను కూడా ఉపయోగించవచ్చు, కానీ డిక్రిప్షన్ కీని సరిగ్గా ఉంచాలి;

ఓపెన్ ప్లాట్‌ఫారమ్ దృష్టాంతంలో OpenID వంటి పెద్ద సంఖ్యలో స్వతంత్ర డేటా వినియోగదారుల విషయంలో ఈ సాంకేతికత విస్తృతంగా ఉపయోగించబడుతుంది, ఇక్కడ వేర్వేరు డెవలపర్‌లు ఒకే వినియోగదారు కోసం వేర్వేరు Openidలను పొందుతారు.

(5)సాధారణీకరణ పద్ధతులు

సాధారణీకరణ సాంకేతికత అనేది డేటా సెట్‌లో ఎంచుకున్న లక్షణాల యొక్క గ్రాన్యులారిటీని తగ్గించే డి-ఐడెంటిఫికేషన్ టెక్నిక్‌ను సూచిస్తుంది మరియు డేటా యొక్క మరింత సాధారణ మరియు నైరూప్య వివరణను అందిస్తుంది.సాధారణీకరణ సాంకేతికత అమలు చేయడం సులభం మరియు రికార్డు స్థాయి డేటా యొక్క ప్రామాణికతను రక్షించగలదు.ఇది సాధారణంగా డేటా ఉత్పత్తులు లేదా డేటా నివేదికలలో ఉపయోగించబడుతుంది.

- రౌండింగ్: 100, 500, 1K మరియు 10K ఫలితాలను అందించే పైకి లేదా క్రిందికి ఫోరెన్సిక్స్ వంటి ఎంచుకున్న లక్షణం కోసం ఒక రౌండింగ్ బేస్‌ను ఎంచుకోవడం ఉంటుంది.

- ఎగువ మరియు దిగువ కోడింగ్ పద్ధతులు: థ్రెషోల్డ్ పైన (లేదా దిగువన) విలువలను ఎగువ (లేదా దిగువ) స్థాయిని సూచించే థ్రెషోల్డ్‌తో భర్తీ చేయండి, "ఎగువ X" లేదా "క్రింద X" ఫలితాన్ని ఇస్తుంది

(6)రాండమైజేషన్ టెక్నిక్స్

ఒక రకమైన డి-ఐడెంటిఫికేషన్ టెక్నిక్‌గా, రాండమైజేషన్ టెక్నాలజీ అనేది యాదృచ్ఛికీకరణ ద్వారా లక్షణం యొక్క విలువను సవరించడాన్ని సూచిస్తుంది, తద్వారా రాండమైజేషన్ తర్వాత విలువ అసలు వాస్తవ విలువ నుండి భిన్నంగా ఉంటుంది.ఈ ప్రక్రియ అదే డేటా రికార్డ్‌లోని ఇతర అట్రిబ్యూట్ విలువల నుండి అట్రిబ్యూట్ విలువను పొందే అటాకర్ సామర్థ్యాన్ని తగ్గిస్తుంది, అయితే ఉత్పాదక పరీక్ష డేటాతో సాధారణమైన ఫలిత డేటా యొక్క ప్రామాణికతను ప్రభావితం చేస్తుంది.


పోస్ట్ సమయం: సెప్టెంబర్-27-2022