新研究表明:新技術(shù)助力人工智能減少“胡謅”
新研究表明:新技術(shù)助力人工智能減少“胡謅”
本報訊 人工智能(AI)中廣泛使用的大語言模型不時出現(xiàn)的“一本正經(jīng)地胡謅”是其難以克服的問題。近日,英國牛津大學(xué)研究團隊開發(fā)出一種名為“語義熵”的新方法,有望大幅提升AI回答的可靠性。
大語言模型的“胡謅”在業(yè)界被稱為“幻覺”,牛津大學(xué)計算機科學(xué)系的研究人員提出“語義熵”方法試圖解決這一問題。在熱力學(xué)中,熵描述的是系統(tǒng)的混亂或者說不穩(wěn)定程度。這項研究中,熵衡量了大語言模型回答的不確定性,不確定性高意味著大語言模型的回答可能存在虛構(gòu)。
該研究成果已發(fā)表在近期出版的英國《自然》雜志上。論文中說,如果AI對同一個問題,給出了許多語義相似的答案,那說明它對自己的回答比較有把握;反之,如果答案五花八門,那就意味著AI自己也“心里沒底”,很可能是在“胡謅”。
研究人員利用“語義熵”方法,讓大語言模型對同一問題生成多個答案,然后將語義相近的答案聚類,最后根據(jù)聚類結(jié)果計算熵值。熵值越高,表示大語言模型的回答越不確定。
值得注意的是,這一方法不僅考慮了大語言模型回答的字面差異,更關(guān)注語義層面的一致性。這使得“語義熵”能夠更準確地識別AI的“胡謅”,而不會被表達方式的多樣性所迷惑。
研究結(jié)果表明,“語義熵”方法在多個數(shù)據(jù)集和任務(wù)中都表現(xiàn)出色,能有效檢測大語言模型的錯誤回答,并通過拒絕回答不確定的問題來提高整體準確率。更重要的是,這一方法無需修改AI模型本身,可以直接應(yīng)用于現(xiàn)有的大語言模型。
研究人員說,“語義熵”技術(shù)有望在問答系統(tǒng)、文本生成、機器翻譯等多個領(lǐng)域發(fā)揮重要作用,幫助AI生成更可靠、更有價值的內(nèi)容。這不僅將提升AI在實際應(yīng)用中的表現(xiàn),也將增強用戶對AI系統(tǒng)的信任。
本報擁有此文版權(quán),若需轉(zhuǎn)載或復(fù)制,請注明來源于中國政府采購報,標注作者,并保持文章的完整性。否則,將追究法律責任。
責任編輯:LIZHENG
點擊排行
歡迎訂閱中國政府采購報
我國政府采購領(lǐng)域第一份“中”字頭的專業(yè)報紙——《中國政府采購報》已于2010年5月7日正式創(chuàng)刊!
《中國政府采購報》由中國財經(jīng)報社主辦,作為財政部指定的政府采購信息發(fā)布媒體,服務(wù)政府采購改革,支持政府采購事業(yè),推動政府采購發(fā)展是國家和時代賦予《中國政府采購報》的重大使命。
《中國政府采購報》的前身是伴隨我國政府采購事業(yè)一路同行12年的《中國財經(jīng)報?政府采購周刊》。《中國政府采購報》以專業(yè)的水準、豐富的資訊、及時的報道、權(quán)威的影響,與您一起把握和感受中國政府采購發(fā)展事業(yè)的脈搏與動向。
《中國政府采購報》為國際流行對開大報,精美彩色印刷;每周二、周五出版,每期8個版,全年訂價276元,每月定價23元,每季定價69元。零售每份3元??梢云圃?、破季訂閱。 可以破月、破季訂閱。
歡迎訂閱《中國政府采購報》!
訂閱方式:郵局訂閱(請到當?shù)剜]局直接訂閱)