压在透明的玻璃上c-国产精品国产一级A片精品免费-国产精品视频网-成人黄网站18秘 免费看|www.tcsft.com

合成數(shù)據(jù)有利于避免過(guò)度處理個(gè)人數(shù)據(jù)

2023年11月6日,西班牙數(shù)據(jù)保護(hù)機(jī)構(gòu)AEPD探討了合成數(shù)據(jù)如何在人工智能模型訓(xùn)練中取代個(gè)人數(shù)據(jù)的問題,認(rèn)為當(dāng)所需要的大量個(gè)人數(shù)據(jù)不可用或不容易收集時(shí),合成數(shù)據(jù)可以作為替代品。

數(shù)據(jù)需求量日益增大。當(dāng)前,人工智能模型需要大量數(shù)據(jù)進(jìn)行開發(fā)、測(cè)試和驗(yàn)證,執(zhí)行此類過(guò)程所需的數(shù)據(jù)量是不可預(yù)估,且在某些情況下,需要通過(guò)專門測(cè)試數(shù)據(jù)來(lái)驗(yàn)證和描述異常情況、極端情況、低概率或未記錄情況的系統(tǒng),甚至通過(guò)操縱數(shù)據(jù)測(cè)試攻擊類型。

合成數(shù)據(jù)是非真實(shí)數(shù)據(jù)。合成數(shù)據(jù)是人工生成的數(shù)據(jù),與從現(xiàn)實(shí)中收集的真實(shí)數(shù)據(jù)形成鮮明對(duì)比,但同樣可以保留特定場(chǎng)景下真實(shí)數(shù)據(jù)的特征和屬性。合成數(shù)據(jù)可用于機(jī)器學(xué)習(xí)服務(wù)的開發(fā)、測(cè)試和驗(yàn)證,在這些服務(wù)中,無(wú)法獲得所需數(shù)量的真實(shí)數(shù)據(jù),甚至可能不存在此類真實(shí)數(shù)據(jù)。合成數(shù)據(jù)可以允許公司以一種在數(shù)據(jù)空間框架內(nèi)共享數(shù)據(jù)而不泄露商業(yè)機(jī)密的方式一樣進(jìn)行使用,可以用于創(chuàng)建具有與個(gè)人數(shù)據(jù)集相同效用的非個(gè)人數(shù)據(jù)集,在這種情況下可以被當(dāng)作一種隱私技術(shù)。

合成數(shù)據(jù)越來(lái)越受到關(guān)注。合成數(shù)據(jù)可以通過(guò)允許方問來(lái)自公共和私人實(shí)體的信息(即數(shù)據(jù)空間)支撐數(shù)據(jù)經(jīng)濟(jì)。但是,如果對(duì)此類數(shù)據(jù)的處理目的、實(shí)際限制、相關(guān)風(fēng)險(xiǎn)沒有得到足夠保證時(shí),相關(guān)實(shí)體將不愿意披露可能泄露商業(yè)秘密、自身情況、知識(shí)產(chǎn)權(quán)的數(shù)據(jù)。而生成合成數(shù)據(jù)將成為可以解決此類問題的主要技術(shù)之一。合成數(shù)據(jù)有助于開發(fā)、測(cè)試和驗(yàn)證自然語(yǔ)言理解系統(tǒng)、視覺算法系統(tǒng)、自動(dòng)駕駛汽車系統(tǒng)和面向金融機(jī)構(gòu)的欺詐檢測(cè)模型,因此,近年來(lái)越來(lái)越受到關(guān)注。

合成數(shù)據(jù)不是隨機(jī)數(shù)據(jù)。從真實(shí)數(shù)據(jù)合成數(shù)據(jù)集,或創(chuàng)建新數(shù)據(jù)集時(shí),應(yīng)當(dāng)再現(xiàn)真實(shí)數(shù)據(jù)的結(jié)構(gòu)和特征,從而在特定場(chǎng)景中得出相關(guān)結(jié)論。由于合成數(shù)據(jù)屬于人工生成的數(shù)據(jù),至少可以對(duì)一個(gè)特定目的具有意義,在此背景下,合成數(shù)據(jù)的最基本形式可能類似真實(shí)數(shù)據(jù)格式的虛擬文件。

合成數(shù)據(jù)可以取代真實(shí)數(shù)據(jù)。每個(gè)特定場(chǎng)景對(duì)數(shù)據(jù)具有不同的質(zhì)量水平要求,對(duì)于流程和最終使用目的也具有差別細(xì)微的不同要求,在某些特定場(chǎng)景下,合成數(shù)據(jù)可以取代真實(shí)數(shù)據(jù)。例如,為了驗(yàn)證人臉識(shí)別系統(tǒng),可以生成一個(gè)合成人臉數(shù)據(jù)集,以檢查這一系統(tǒng)的局限性。但是,需要注意的是,這樣的數(shù)據(jù)集可能缺乏檢查其他類型系統(tǒng)或開發(fā)新的人臉系統(tǒng)所需的數(shù)據(jù)質(zhì)量。

合成數(shù)據(jù)可以作為PET使用。由于合成數(shù)據(jù)可以最大限度的減少對(duì)個(gè)人數(shù)據(jù)的處理,同時(shí)實(shí)現(xiàn)相關(guān)目標(biāo),且結(jié)論與使用原始個(gè)人數(shù)據(jù)所獲得的結(jié)論一樣,因此,與其他許多技術(shù)一樣,合成數(shù)據(jù)也可以作為一種隱私增強(qiáng)技術(shù)(PET)使用。在GDPR框架下,即使是從真實(shí)的個(gè)人數(shù)據(jù)中生成,合成數(shù)據(jù)也不應(yīng)包含可識(shí)別個(gè)人的信息。合成數(shù)據(jù)出于特定目的保留了真實(shí)個(gè)人數(shù)據(jù)的統(tǒng)計(jì)屬性,因此可以防止個(gè)人數(shù)據(jù)被處理。但根據(jù)GDPR,從真實(shí)的個(gè)人數(shù)據(jù)創(chuàng)建合成數(shù)據(jù)本身就是一種處理活動(dòng),所以應(yīng)當(dāng)考慮GDPR的相關(guān)規(guī)定。

來(lái)源:CAICT互聯(lián)網(wǎng)法律研究中心

上一篇:中國(guó)跨境電商暴露數(shù)百萬(wàn)用戶隱私數(shù)據(jù),部分含身份證照片

下一篇:ENISA預(yù)測(cè):2030年組織將要面對(duì)5方面的網(wǎng)絡(luò)安全威脅