压在透明的玻璃上c-国产精品国产一级A片精品免费-国产精品视频网-成人黄网站18秘 免费看|www.tcsft.com

實測:頂級AI模型未達到歐盟AI法案標(biāo)準(zhǔn)

瑞士初創(chuàng)公司LatticeFlow開發(fā)了名為“COMPL-AI”的大型語言模型測試工具(LLM Checker),旨在測試AI模型是否能滿足歐盟人工智能法案的合規(guī)性要求,該工具受到歐盟官員的廣泛歡迎。測試結(jié)果顯示,一些頂級科技公司的人工智能模型在網(wǎng)絡(luò)安全和防止歧視性輸出等關(guān)鍵領(lǐng)域未能達到要求。

一、測試結(jié)果

該工具由LatticeFlow與蘇黎世聯(lián)邦理工學(xué)院和保加利亞計算機科學(xué)、人工智能和技術(shù)研究所合作設(shè)計,從技術(shù)穩(wěn)健性和安全性,隱私和數(shù)據(jù)治理,透明度,多元化、非歧視和公平,社會與環(huán)境福祉,人類的主體性與監(jiān)督等方面測試了OpenAI、Meta、阿里巴巴等頂級科技公司的AI模型。

這些模型的測試分?jǐn)?shù)從0到1不等,大多數(shù)測試的模型平均得分為0.75或更高,例如Anthropic的“Claude 3 Opus”得分為0.89。但在測試中,一些模型也暴露了重大缺陷。

在測試歧視性輸出時,OpenAI的“GPT-3.5 Turbo”獲得了0.46的低分,而阿里巴巴的“Qwen1.5 72B Chat”得分更低,為0.37,凸顯了人工智能在性別和種族等領(lǐng)域反映人類偏見的問題。

在測試“提示劫持”時(一種黑客使用欺騙性提示來提取敏感信息的攻擊形式),Meta的Llama 2 13B Chat模型得分為0.42,而法國初創(chuàng)公司Mistral的8x7B Instruct模型得分為0.38。

二、未來展望

LLM Checker的開發(fā)是為了與歐盟人工智能法案不斷變化的要求保持一致,隨著未來兩年執(zhí)法措施的出臺,該工具預(yù)計將發(fā)揮更大的作用。LatticeFlow已免費提供該工具,允許開發(fā)人員在線測試其AI模型的合規(guī)性,讓他們了解滿足歐盟AI法案要求時面臨的挑戰(zhàn)。此外,法案的部分要求預(yù)計將于2025年全面實施,不遵守AI法案的公司將面臨3500萬歐元(3800萬美元)或其全球年營業(yè)額7%的罰款

LatticeFlow公司的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Petar Tsankov表示,測試結(jié)果總體上是積極的,能為各公司提供一個路線圖,供他們根據(jù)法案微調(diào)模型。

歐盟委員會也一直在密切關(guān)注該工具的發(fā)展,一位發(fā)言人表示,該工具代表了將歐盟人工智能法案轉(zhuǎn)化為技術(shù)合規(guī)要求的“第一步”,這表明更詳細的執(zhí)法措施正在計劃中。

聲明:本文來自上海市人工智能與社會發(fā)展研究會,稿件和圖片版權(quán)均歸原作者所有。所涉觀點不代表東方安全立場,轉(zhuǎn)載目的在于傳遞更多信息。如有侵權(quán),請聯(lián)系rhliu@skdlabs.com,我們將及時按原作者或權(quán)利人的意愿予以更正。

上一篇:國家安全部:某境外企業(yè)“借殼”國內(nèi)測繪企業(yè)非法竊取測繪地理信息

下一篇:蘋果大幅縮短安全證書有效期引發(fā)眾怒