《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 【ChatGPT專題】ChatGPT,不得不說的十大能力缺陷

【ChatGPT專題】ChatGPT,不得不說的十大能力缺陷

2023-02-17
來源: 未盡研究
關(guān)鍵詞: ChatGPT 人工智能 缺陷

  從未有一種產(chǎn)品,能像人工智能對話軟件ChatGPT一樣,在兩個月的時間內(nèi),吸引了上億的用戶。它所迅速引發(fā)的爭議波及范圍之廣,也創(chuàng)造了一個紀錄。最重要的是,不管你喜歡還是不喜歡它,都必須談?wù)撍?/p>

  一向AI技術(shù)領(lǐng)先的谷歌,也不得不跟隨,推出ChatGPT的競品。Bard在發(fā)布會上翻車了,它回答問題稱,美國的詹姆斯·韋伯太空望遠鏡拍攝了太陽系外行星的第一張照片,然而實際上是由歐洲南方天文臺的Very Large Telescope (VLT) 在 2004 年拍攝的。這樣一個 科技巨頭,也會犯這樣低級的事實性錯誤。

  其實ChatGPT犯的低級錯誤,比比皆是,只是當(dāng)人們對一件事物著迷的時候,其優(yōu)點和缺點是一體的,而且人們往往忽略后者。

  今天,我們“不合時宜”地來聊一聊ChatGPT的十大不足。指出缺點,是為了改進。加油!(本文編譯自Ali Borji的 A Categorial Archive of ChatGPT Failures)

  一、推理能力

  “推理”這個詞在文學(xué)作品和日常談話中都很廣泛地使用,但它是一個模糊的術(shù)語,可以指許多不同的東西。批判性思維、決策和解決問題都是關(guān)鍵的活動,它們在很大程度上依賴于推理。但像ChatGPT這樣的模型缺乏一個“世界模型”,這意味著它們沒有對物理世界和社會世界的完全理解,也沒有能力對概念和實體之間的聯(lián)系進行推理。他們只能根據(jù)在訓(xùn)練中學(xué)到的模式來生成文本。

  1.1 空間推理能力

  空間推理是指理解和操縱我們周圍物理空間中的物體、人和地點之間的關(guān)系的能力。它包括在二維或三維空間中對物體進行可視化和心理轉(zhuǎn)換,以及識別模式、轉(zhuǎn)換和物體之間的關(guān)系。空間推理技能對于許多任務(wù)和活動都很重要,比如導(dǎo)航,解決問題,以及可視化你腦海中的物體和結(jié)構(gòu)。

  圖1顯示了 ChatGPT努力完成空間導(dǎo)航任務(wù)的實例。

 微信截圖_20230217151639.png

  1.2 物理推理能力

  物理推理是指在現(xiàn)實世界中理解和操縱物理物體及其相互作用的能力。它涉及到應(yīng)用物理定律和概念來預(yù)測 和解釋物理系統(tǒng)的行為。物理推理是人類智能的一個關(guān)鍵方面,被用于各種智能領(lǐng)域,如工程、物理和機器人技術(shù)。在人工智能中,物理推理是一項具有挑戰(zhàn)性的任務(wù),需要專門的模型來學(xué)習(xí)和推理物理系統(tǒng)。

  圖2顯示了ChatGPT在物理推理失敗的一些例子。

 微信截圖_20230217151711.png

  1.3 時間推理能力

  時間推理是指對事件及其時間順序進行推理和預(yù)測的能力。它涉及到理解事件之間的時間關(guān)系,事件的持續(xù)時間,以及事件與事件之間相對的時間。時間推理是人類智能的一個重要方面,它被用于調(diào)度、規(guī)劃和預(yù)測等各個領(lǐng)域。在人工智能中,時間推理是一項具有挑戰(zhàn)性的任務(wù),需要專門的模型和算法來學(xué)習(xí)和預(yù)測事件序列的時間和時間。

  圖3中的實例表明,ChatGPT不能從一個簡單的故事中推斷出正確的時間順序。

 微信截圖_20230217151744.png

  1.4 心理推理能力

  心理推理是指理解和預(yù)測人類行為和心理過程的能力。它涉及到應(yīng)用心理學(xué)理論、模型和概念來解釋和預(yù)測人類的行為和心理狀態(tài)。在人工智能中,心理推理是一項具有挑戰(zhàn)性的任務(wù),需要專門的模型和算法,來學(xué)習(xí)和推理人類的行為和心理過程。

 微信截圖_20230217151807.png

  二、邏輯

  邏輯學(xué)是數(shù)學(xué)和哲學(xué)的一個分支,它研究推理的原理。它處理正確推理的規(guī)則和方法,如三段論、歸納法和演繹法。邏輯是指確保參數(shù)是有效的、一致的、沒有矛盾的。

  圖5和圖6中顯示了ChatGPT在邏輯推理中失敗的一些示例。

  微信截圖_20230217151908.png

  圖5. Q:邁克的媽媽有4個孩子;其中3個是路易斯、德雷克和瑪?shù)贍栠_。第四個孩子叫什么名字?--ChatGPT:如果沒有更多的信息,就不可能確定第四個孩子的名字。

  微信截圖_20230217151927.png

  圖6.  Q:一所房子四面都有窗。一頭熊走過窗前。這頭熊是什么顏色的?---ChatGPT:基于現(xiàn)有信息,無法判斷熊的顏色!

  三、數(shù)學(xué)和算術(shù)

  ChatGPT計算數(shù)學(xué)表達式的能力有限。圖7、8和9顯示了ChatGPT在數(shù)學(xué)和算術(shù)方面失敗的一些例子。

  微信截圖_20230217152007.png

  圖7. ChatGPT無法簡化代數(shù)表達式

  微信截圖_20230217152043.png

  圖8

  ChatGPT在回答“我6歲時,我的妹妹只有我一半的年齡”這個問題時犯了一個錯誤。現(xiàn)在我已經(jīng)70歲了,我妹妹多大了?”因為它提供的回答是73,但正確的答案是67。

  四、事實性錯誤

  ChatGPT的輸出在科學(xué)事實方面缺乏準(zhǔn)確性。它有時缺乏對基本事實的知識,它提供的信息可能看起來可信,但最終被證明是不正確的,Bard在發(fā)布會現(xiàn)場的翻車事件,就是一個很好的例子。圖10和圖11顯示了ChatGPT所犯下的其他兩個令人啼笑皆非的事實性錯誤。

  微信截圖_20230217152117.png

  圖10. 一個月竟有40多天!!!!

  微信截圖_20230217152135.png

  圖11.   Q:英寸、公斤、厘米、碼,其中哪個不屬于其他三個的范疇?  -- ChatGPT: “碼”。因為“碼”是長度單位,其他三個都是質(zhì)量單位。

  五、偏見和歧視

  人工智能帶來的倫理挑戰(zhàn)是巨大的,其中最重要的一個是偏見問題。語言模型中的偏見是指生成的語言輸出中出現(xiàn)的系統(tǒng)性不準(zhǔn)確或刻板印象,這些數(shù)據(jù)被訓(xùn)練數(shù)據(jù)所影響,并反映了數(shù)據(jù)中存在的社會和文化偏見。這些偏見可以以多種方式影響語言模型,如延續(xù)刻板印象,造成誤解,或傳播有害和虛假的信息。

  微信截圖_20230217152200.png

 

  六、幽默

  幽默是一種有趣或滑稽的品質(zhì),通常通過娛樂或讓人大笑的言語或行為來表達。它可以采取多種形式,如笑話、諷刺、諷刺或好玩的行為,它的意義可以根據(jù)文化背景和個人品味而有很大的不同。幽默通常包括使用幽默技巧,如雙關(guān)語、文字游戲和荒謬,來喚起觀眾的反應(yīng)。這是一種復(fù)雜而微妙的人類交流形式,對機器人,即使是最先進的機器人,也是一個重大的挑戰(zhàn)。

  ChatGPT說笑話的效果如何?

  微信截圖_20230217152230.png

  七、寫代碼

  ChatGPT擅長處理一些編程問題,但有時會產(chǎn)生不準(zhǔn)確或不那么優(yōu)質(zhì)的代碼。雖然它有了編寫代碼的能力,可以幫助完成諸如生成通用函數(shù)或重復(fù)代碼等任務(wù),但它不能完全替代人類開發(fā)人員。

  圖14顯示了ChatGPT所犯的一些編碼錯誤。例如,盡管ChatGPT能夠在Python中正確識別操作符優(yōu)先級,但它在語句中生成了一個錯誤的答案。

  微信截圖_20230217152259.png

  八.句法結(jié)構(gòu)、拼寫和語法

  ChatGPT擅長于語言理解,但偶爾仍然會出現(xiàn)錯誤。

  微信截圖_20230217152326.png

  圖15. 當(dāng)被要求以s為結(jié)尾造句時,ChatGPT兩次都答非所問了。

  九、自我意識

  自我意識是指認識到自己是一個獨立于他人的個體,并理解自己的思想、感受、個性和身份的能力。它包括能夠改變自己的思想、情感和行為,并理解它們?nèi)绾斡绊懸粋€人的行為和與他人的互動。

  圖16的例子顯示,ChatGPT的自我意識能力亟待提升,它并不清楚自己的體系結(jié)構(gòu),包括模型圖層和參數(shù)。

  微信截圖_20230217152408.png

  圖16

  十、其他

  除前述不足之外,ChatGPT在以下方面的表現(xiàn)可能也不盡如人意,包括:

  1. ChatGPT在使用習(xí)語方面的拙劣表現(xiàn),讓人輕易察覺到它的非人類身份。

  2. 由于ChatGPT缺乏真實的情感和思想,因此它無法像人類那樣創(chuàng)造出能與人們產(chǎn)生情感共鳴的內(nèi)容。

  3. ChatGPT雖能很好地濃縮主題內(nèi)容,但無法提供獨特的視角。

  4. ChatGPT的答案往往過于全面和冗長,從多個角度處理一個主題,當(dāng)需要給出一個直接的答案時,可能無法勝任。

  5. 世界上沒有兩片相同的葉子,世界上也沒有兩個相同的人。ChatGPT缺乏這種個體差異性,而且往往過于字面化,在某些情況下導(dǎo)致了某些信息的缺失。例如,它的回答通常會嚴格地框定在所問到的問題之中,而人類的回答往往會各種各樣,并很有可能將話題轉(zhuǎn)移到其他主題上。

  6. ChatGPT努力保持一種中立的立場,而人類在表達觀點時則往往有傾向性。

  7. ChatGPT的回答在本質(zhì)上往往是正式的,因為它的編程避免了非正式的語言。相比之下,人類傾向于使用更隨意和熟悉的表達方式。

  8. 如果ChatGPT被告知它的答案是不正確的,它可能會通過道歉,并糾正自己的答案,但也有可能保持其原來的答案。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲精品专区| 久久网站免费| 亚洲第一二三四五区| 一区二区三区欧美成人| 亚洲激情视频在线播放| 极品中文字幕一区| 国内成人精品视频| 国产亚洲午夜| 国产亚洲综合在线| 国产午夜亚洲精品不卡| 国产欧美精品日韩区二区麻豆天美 | 国产精品v日韩精品| 国产欧美日韩高清| 欧美理论电影在线观看| 欧美激情精品久久久久久久变态 | 加勒比av一区二区| 加勒比av一区二区| 亚洲国产美女| 亚洲精品一区二区三区四区高清 | 亚洲私人影吧| 午夜精品福利电影| 欧美中日韩免费视频| 久久精品一区二区| 免费一区视频| 欧美日韩亚洲一区二区三区四区 | 亚洲精品视频中文字幕| 99在线热播精品免费| 亚洲一区二区三区高清| 羞羞答答国产精品www一本| 久久国产精品久久久| 久久综合999| 欧美久久电影| 国产精品毛片va一区二区三区 | 免费观看一区| 欧美日韩精品免费观看视一区二区| 欧美日韩精品国产| 国产乱子伦一区二区三区国色天香| 韩国一区二区三区在线观看| 亚洲国产毛片完整版 | 亚洲欧美国产一区二区三区| 欧美一区二区三区在线观看| 最新国产成人在线观看 | 欧美一区二区视频97| 久久免费精品视频| 欧美激情在线| 国产欧美日韩视频一区二区| 欧美激情综合五月色丁香| 亚洲国产成人精品视频| 日韩午夜免费视频| 性刺激综合网| 亚洲黄色高清| 午夜精品久久久久久久男人的天堂| 欧美一区二区三区在线看| 亚洲精品久久久久久一区二区| 亚洲一区二区免费看| 久久久女女女女999久久| 欧美精品精品一区| 国产欧美一区二区三区久久人妖 | 午夜久久久久| 免费在线欧美黄色| 国产精品萝li| 亚洲国产一二三| 亚洲男人av电影| 日韩视频精品| 久久精品视频网| 欧美日韩另类国产亚洲欧美一级| 国产欧美一区二区视频| 亚洲三级国产| 久久精品视频在线| 午夜精品久久久99热福利| 免费观看亚洲视频大全| 国产乱码精品1区2区3区| 亚洲精品视频在线观看免费| 亚洲欧美中文日韩v在线观看| 亚洲日本成人网| 久久久久久香蕉网| 国产精品高精视频免费| 亚洲激情在线视频| 久久精品国产免费| 午夜激情亚洲| 欧美色网一区二区| 在线欧美一区| 欧美一区二区成人6969| 亚洲性av在线| 欧美精品激情在线观看| 伊人成人在线视频| 亚洲综合另类| 亚洲视频电影图片偷拍一区| 美女91精品| 国内精品伊人久久久久av影院 | 在线看无码的免费网站| 午夜精品影院| 午夜日韩电影| 欧美日韩三级一区二区| 亚洲福利视频网| 亚洲国产精品va在看黑人| 欧美中文字幕在线| 国产精品久久久久久久久免费桃花 | 欧美日韩四区| 亚洲国产免费| 亚洲国产欧美另类丝袜| 久久精视频免费在线久久完整在线看| 国产精品国产福利国产秒拍| 99re6热在线精品视频播放速度| 亚洲国产三级在线| 久久一区二区三区四区五区| 国产视频一区三区| 亚洲免费在线观看视频| 亚洲一区二区三区乱码aⅴ蜜桃女| 欧美高清视频www夜色资源网| 一区久久精品| 亚洲激情在线播放| 欧美gay视频| 亚洲国产精品视频一区| 亚洲激情图片小说视频| 老鸭窝91久久精品色噜噜导演| 国产乱码精品一区二区三区不卡| 亚洲综合三区| 欧美在线视频在线播放完整版免费观看| 国产精品久久久久久久9999| 亚洲午夜精品一区二区| 亚洲欧美中文日韩在线| 国产精品久线观看视频| 亚洲尤物在线| 欧美亚洲自偷自偷| 国产日韩欧美在线一区| 欧美在线观看网址综合| 久久久久成人精品免费播放动漫| 国产亚洲精品自拍| 久久精品视频导航| 免费在线观看一区二区| 亚洲日本va午夜在线影院| 一本综合久久| 国产精品男人爽免费视频1| 亚洲在线网站| 久久精品1区| 在线观看日韩| 一区二区三区久久久| 国产精品热久久久久夜色精品三区| 亚洲午夜精品国产| 国产精品久久久久av| 欧美日韩精品一区二区在线播放| 99v久久综合狠狠综合久久| 亚洲综合社区| 国产亚洲a∨片在线观看| 亚洲国产欧美日韩| 欧美刺激性大交免费视频 | 欧美一区二区视频网站| 久久综合九色99| 日韩午夜黄色| 亚洲欧美成人精品| 国内视频精品| 一本久久综合亚洲鲁鲁| 国产精品免费视频xxxx| 亚洲国产精品va在线看黑人 | 国一区二区在线观看| 亚洲日韩第九十九页| 欧美天堂在线观看| 久久av最新网址| 欧美人交a欧美精品| 亚洲免费一区二区| 欧美a级一区二区| 在线一区二区三区做爰视频网站| 久久精品国产久精国产思思| 亚洲国产日韩一级| 羞羞漫画18久久大片| 亚洲国产经典视频| 亚洲综合色在线| 狠狠色丁香婷婷综合影院| 亚洲无线视频| 狠狠爱www人成狠狠爱综合网| 99国产精品国产精品久久 | 久久国产88| 欧美日韩一区在线播放| 欧美一区二区三区四区在线观看地址 | 欧美一区二区三区婷婷月色| 欧美精品1区2区3区| 午夜精品久久久| 欧美日韩国产影院| 久久精精品视频| 国产精品高潮视频| 亚洲精华国产欧美| 国产免费一区二区三区香蕉精| 亚洲精品永久免费| 国产亚洲欧美在线| 亚洲一级黄色| 亚洲经典在线| 久久深夜福利| 亚洲自拍三区| 欧美激情在线有限公司| 欧美一区视频| 欧美日韩一区二区精品| 亚洲国产精品久久久| 国产免费成人av| 亚洲一级在线观看| 亚洲国产一区在线| 老牛影视一区二区三区| 亚洲欧美激情在线视频| 欧美视频在线播放| 亚洲看片免费|