《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 解決方案 > 質(zhì)量重于數(shù)量

質(zhì)量重于數(shù)量

平衡大型語言模型的算法透明度、問責制和知識產(chǎn)權(quán)
2023-08-04
作者:派拓網(wǎng)絡(luò)大中華區(qū)售前總經(jīng)理 董春濤
來源:派拓網(wǎng)絡(luò)

在我們對推動算法革命的數(shù)據(jù)展開研究的過程中,算法透明度和問責制是核心原則。一些人可能誤認為這種說法是在隱晦地呼吁公開知識產(chǎn)權(quán)。然而,經(jīng)過細致入微的研究,我們發(fā)現(xiàn)了一個更加復(fù)雜的敘事,即大型語言模型和專有模型之間的區(qū)別。

大型語言模型是在綜合文本數(shù)據(jù)集上訓(xùn)練而成的AI系統(tǒng),其設(shè)計意圖是根據(jù)輸入內(nèi)容生成類似人類的文本。“大型”一詞體現(xiàn)了模型在參數(shù)數(shù)量和訓(xùn)練數(shù)據(jù)量上的規(guī)模。比如 OpenAI 的GPT-3在訓(xùn)練時運用了一個包含1750億個海量文本參數(shù)的巨大模型。這些模型必須能夠理解它們生成的文本,通過辨別訓(xùn)練數(shù)據(jù)中的模式來生成并輸出預(yù)測結(jié)果。一個不變的原則是:只有綜合全面的高質(zhì)量訓(xùn)練數(shù)據(jù)才能使模型生成準確的預(yù)測結(jié)果。

與之相反的是,“專有模型”通常由特定實體或公司創(chuàng)建。其設(shè)計、結(jié)構(gòu)和算法保護創(chuàng)建者的知識產(chǎn)權(quán)。這個詞往往指的是藍圖可供公眾使用、修改和傳播的開源模型。值得注意的是,專有模型與大型語言模型沒有本質(zhì)區(qū)別,使用“專有模型”這個術(shù)語是為了強調(diào)模型的其他特征。

以O(shè)penAI的GPT-3為例,它既可以是大型語言模型,也可以是專有模型。網(wǎng)絡(luò)安全行業(yè)給出了一個恰當?shù)谋扔鳎骸袄M,垃圾出”。與網(wǎng)絡(luò)衛(wèi)生實踐一樣,為模型提供經(jīng)過整理的高質(zhì)量數(shù)據(jù)可以影響輸出結(jié)果,在實現(xiàn)精準異常檢測的同時推動創(chuàng)新。

那么如何防止數(shù)據(jù)中毒呢?關(guān)鍵在于用細致入微的數(shù)據(jù)采集和整理取代雜亂無章的數(shù)據(jù)積累。無論是專有模型還是開源模型,確保采集高質(zhì)量的數(shù)據(jù)可以幫助提升模型輸出結(jié)果的準確性。決定模型有效性的最終因素是數(shù)據(jù)的質(zhì)量和相關(guān)性,而非數(shù)據(jù)的數(shù)量。

算法透明度要求明確算法的一般操作。例如貸款決策算法應(yīng)說明其考慮的因素(收入、信用評分)及各項因素的權(quán)重。與之相對應(yīng)的算法問責制則要求實體對其算法決策負責,尤其是當出現(xiàn)跡象表明結(jié)果帶有偏差或差別時。

由于應(yīng)用了機器學(xué)習,入侵檢測系統(tǒng)(IDS)可監(jiān)視網(wǎng)絡(luò)是否存在潛在威脅或違反政策的情況。機器學(xué)習可以根據(jù)以往數(shù)據(jù)識別威脅,大大提升了 IDS 的能力。但即便如此,透明度和問責制方面仍然存在挑戰(zhàn)。

因此,算法透明度的“潛臺詞”是 IDS 用戶需要對決策依據(jù)具備一定的了解。例如,威脅信號的特征是什么?IDS如何區(qū)分正常活動和惡意活動?雖然為了避免給攻擊者提供“參考”而不能公布具體的系統(tǒng)機制,但用戶只有在掌握足夠信息的情況下才能信任并有效利用該系統(tǒng)。

算法問責制提出了誤報和漏報的責任問題。IDS 提供商應(yīng)對此類錯誤承擔責任,尤其是當這些錯誤是由算法缺陷引起時。

目前挑戰(zhàn)在于如何在透明度、問責制、專有利益保護和潛在攻擊防范之間保持平衡。這是一項涉及多方面的任務(wù),需要細致入微的考量和各方面兼顧的方法。另外,需要認識到理解某些算法(如神經(jīng)網(wǎng)絡(luò))的決策過程及保護專有信息的技術(shù)復(fù)雜性。然而盡管存在這些障礙,但對于優(yōu)化算法透明度和問責制,專家們已經(jīng)達成共識。

鑒于日益智能和先進的黑客技術(shù)所帶來的威脅迫在眉睫,網(wǎng)絡(luò)安全行業(yè)必須擁有同等資源才能對抗這些AI驅(qū)動的攻擊。從長遠來看,安全行業(yè)的目標不僅是讓一群人類威脅獵手通過猜測來零散地解決問題。

當務(wù)之急是采取智能化措施來化解這些不斷發(fā)展的威脅。作為全球網(wǎng)絡(luò)安全領(lǐng)導(dǎo)企業(yè),Palo Alto Networks(派拓網(wǎng)絡(luò))一直在加速AI在網(wǎng)絡(luò)安全堆棧中的應(yīng)用,是當今安全行業(yè)最成熟的AI應(yīng)用之一。派拓網(wǎng)絡(luò)不僅在人工智能和機器學(xué)習方面的投資處于領(lǐng)先地位,而且還致力于將這些投資轉(zhuǎn)化為客戶可以獲得的實實在在的利益。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 91大神亚洲影视在线| 久久久久久久久影院| 清纯秘书被总经理吸乳小说| 四虎成人永久影院| 非常h很黄的变身文| 国产日韩精品欧美一区喷水| 7777精品伊人久久久大香线蕉| 天天狠狠色综合图片区| 一看就湿的性行为描写大尺度| 无码天堂va亚洲va在线va| 久久精品国产99久久99久久久| 欧美一级特黄啪啪片免费看| 亚洲欧洲日产国码av系列天堂| 特级毛片a级毛片免费播放 | www.天天色| 戍人视频fc2最近一周| 中文字幕精品一区二区精品| 日韩乱码人妻无码中文视频| 五月婷婷六月爱| 欧洲最强rapper潮水免费| 亚洲国产成人精品无码一区二区 | 国产成人精品亚洲2020| www亚洲欲色成人久久精品| 国产精品美女久久久免费| 992tv国产人成在线观看| 在线观看国产日本| WWW夜片内射视频在观看视频| 女人张开腿日出白浆视频| 一本一道波多野结衣大战黑人| 成人三级精品视频在线观看| 中文字幕在线观看亚洲日韩| 无码专区HEYZO色欲AV| 久久久久久久亚洲AV无码| 日本人视频-jlzzjlzzjlzz| 久久国产亚洲欧美日韩精品| 日韩一级视频免费观看| 久久婷婷国产综合精品| 日韩av高清在线看片| 久久国产免费一区| 日本人强jizz多人高清| 久久久不卡国产精品一区二区|