国产草,狠狠干狠狠久久,三级特黄高清完整视频

實測：頂級AI模型未達到歐盟AI法案標(biāo)準(zhǔn)

責(zé)編：gltian ｜2024-10-17 16:26:59

瑞士初創(chuàng)公司LatticeFlow開發(fā)了名為“COMPL-AI”的大型語言模型測試工具（LLM Checker），旨在測試AI模型是否能滿足歐盟人工智能法案的合規(guī)性要求，該工具受到歐盟官員的廣泛歡迎。測試結(jié)果顯示，一些頂級科技公司的人工智能模型在網(wǎng)絡(luò)安全和防止歧視性輸出等關(guān)鍵領(lǐng)域未能達到要求。

一、測試結(jié)果

該工具由LatticeFlow與蘇黎世聯(lián)邦理工學(xué)院和保加利亞計算機科學(xué)、人工智能和技術(shù)研究所合作設(shè)計，從技術(shù)穩(wěn)健性和安全性，隱私和數(shù)據(jù)治理，透明度，多元化、非歧視和公平，社會與環(huán)境福祉，人類的主體性與監(jiān)督等方面測試了OpenAI、Meta、阿里巴巴等頂級科技公司的AI模型。

這些模型的測試分?jǐn)?shù)從0到1不等，大多數(shù)測試的模型平均得分為0.75或更高，例如Anthropic的“Claude 3 Opus”得分為0.89。但在測試中，一些模型也暴露了重大缺陷。

在測試歧視性輸出時，OpenAI的“GPT-3.5 Turbo”獲得了0.46的低分，而阿里巴巴的“Qwen1.5 72B Chat”得分更低，為0.37，凸顯了人工智能在性別和種族等領(lǐng)域反映人類偏見的問題。

在測試“提示劫持”時（一種黑客使用欺騙性提示來提取敏感信息的攻擊形式），Meta的Llama 2 13B Chat模型得分為0.42，而法國初創(chuàng)公司Mistral的8x7B Instruct模型得分為0.38。

二、未來展望

LLM Checker的開發(fā)是為了與歐盟人工智能法案不斷變化的要求保持一致，隨著未來兩年執(zhí)法措施的出臺，該工具預(yù)計將發(fā)揮更大的作用。LatticeFlow已免費提供該工具，允許開發(fā)人員在線測試其AI模型的合規(guī)性，讓他們了解滿足歐盟AI法案要求時面臨的挑戰(zhàn)。此外，法案的部分要求預(yù)計將于2025年全面實施，不遵守AI法案的公司將面臨3500萬歐元（3800萬美元）或其全球年營業(yè)額7%的罰款。

LatticeFlow公司的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Petar Tsankov表示，測試結(jié)果總體上是積極的，能為各公司提供一個路線圖，供他們根據(jù)法案微調(diào)模型。

歐盟委員會也一直在密切關(guān)注該工具的發(fā)展，一位發(fā)言人表示，該工具代表了將歐盟人工智能法案轉(zhuǎn)化為技術(shù)合規(guī)要求的“第一步”，這表明更詳細的執(zhí)法措施正在計劃中。

聲明：本文來自上海市人工智能與社會發(fā)展研究會，稿件和圖片版權(quán)均歸原作者所有。所涉觀點不代表東方安全立場，轉(zhuǎn)載目的在于傳遞更多信息。如有侵權(quán)，請聯(lián)系rhliu@skdlabs.com，我們將及時按原作者或權(quán)利人的意愿予以更正。

上一篇：國家安全部：某境外企業(yè)“借殼”國內(nèi)測繪企業(yè)非法竊取測繪地理信息

下一篇：蘋果大幅縮短安全證書有效期引發(fā)眾怒

压在透明的玻璃上c-国产精品国产一级A片精品免费-国产精品视频网-成人黄网站18秘 免费看|www.tcsft.com

實測：頂級AI模型未達到歐盟AI法案標(biāo)準(zhǔn)

压在透明的玻璃上c-国产精品国产一级A片精品免费-国产精品视频网-成人黄网站18秘免费看|www.tcsft.com