(資料圖片僅供參考)

以ChatGPT為代表的生成式人工智能廣受關(guān)注,大模型亦在加速發(fā)展??蒲袌F隊近日發(fā)布新的AI安全平臺,以期為大模型系好“安全帶”、把好“方向盤(pán)”。

據介紹,人工智能安全平臺RealSafe3.0版本由清華大學(xué)人工智能研究院孵化企業(yè)瑞萊智慧RealAI發(fā)布。該平臺能夠提供端到端的模型安全性測評解決方案,旨在解決當前通用大模型安全風(fēng)險難以審計的“痛點(diǎn)”。

“大模型‘落地難’的本質(zhì)在于,當前還沒(méi)有找到場(chǎng)景、風(fēng)險和規范三者之間的平衡點(diǎn)?!比鹑R智慧聯(lián)合創(chuàng )始人、算法科學(xué)家蕭子豪在受訪(fǎng)時(shí)說(shuō),而在探尋這一平衡點(diǎn)的過(guò)程中缺少易用和標準化的工具。換言之,亟須在技術(shù)層面找到有力抓手,幫助人們科學(xué)評判大模型在場(chǎng)景中能否同時(shí)滿(mǎn)足規范和低風(fēng)險,助力大模型上線(xiàn)運行。

據知,相較上一版本,RealSafe3.0新增了對通用大模型的評測。該平臺覆蓋數據安全、認知任務(wù)、通用模型特有漏洞、濫用場(chǎng)景等近70個(gè)評測維度,可以全方位、多維度地評測通用大模型的性能,未來(lái)還會(huì )持續擴增測評維度的數量。

蕭子豪介紹說(shuō),RealSafe3.0內部集成了多個(gè)自研模型和專(zhuān)家論證高質(zhì)量數據集,來(lái)幫助用戶(hù)修復模型中的問(wèn)題。例如,對黑盒不可解釋的通用大模型,自研紅隊對抗模型取代人工設計問(wèn)題,顯著(zhù)提升攻擊成功率和樣本多樣性。

再如,教練模型通過(guò)對被測大模型進(jìn)行多輪次的“提問(wèn)—回答訓練”,并以訓練好的評分模型對問(wèn)答結果進(jìn)行評分,再將評分結果反饋給大模型,使其不斷強化學(xué)習到好壞答案的要點(diǎn)及區別,直至問(wèn)答能力逐步迭代至最優(yōu)。

值得一提的是,瑞萊智慧科研團隊還研發(fā)出能夠防范生成式人工智能惡意濫用的DeepReal2.0,即“生成式人工智能內容檢測平臺”。該平臺支持對圖像、視頻、音頻、文本進(jìn)行是否偽造的檢測,應用場(chǎng)景包括打擊網(wǎng)絡(luò )詐騙和聲譽(yù)侵害行為、檢測網(wǎng)絡(luò )內容合規性、檢測音視頻物證真實(shí)性等。

“我們將持續迭代技術(shù)、打磨產(chǎn)品,以確保在這場(chǎng)人工智能安全‘攻防戰’中始終立于不敗之地,將人工智能的兩面性這一‘關(guān)鍵變量’,轉化為高質(zhì)量發(fā)展的‘最大增量’?!笔捵雍勒f(shuō)。(完)

熱點(diǎn)圖片

備案號:贛ICP備2022005379號
華網(wǎng)(http://fotografmarianne.com) 版權所有未經(jīng)同意不得復制或鏡像

QQ:51985809郵箱:51985809@qq.com

久久国产精品2020免费m3u8|人妻少妇精品无码专区APP|无码少妇一区二区三|一本一本久久a久久精品综合麻豆|亚洲色偷偷偷鲁综合