No Result
View All Result
Tech & Deals
  • 首頁
  • 科技新聞
  • 著數優惠
  • 電訊網絡
  • 智能裝置
  • 電腦產品
  • 電子產品
  • 家庭電器
  • 家庭影音
  • 加密貨幣
  • 聯絡我們
  • 首頁
  • 科技新聞
  • 著數優惠
  • 電訊網絡
  • 智能裝置
  • 電腦產品
  • 電子產品
  • 家庭電器
  • 家庭影音
  • 加密貨幣
  • 聯絡我們
No Result
View All Result
Tech & Deals
No Result
View All Result
Home 科技新聞

GPT-4 具備「自我反思」能力,研究顯示經反思後表現提升 30%!

by Tech & Deal
April 4, 2023
in 科技新聞
A A
ADVERTISEMENT

OpenAI 推出的最新語言模型 GPT-4 不僅能模擬人類生成各類文章,還具備自我評估和改進的能力。這種獨特的「自我反思」技術使得 GPT-4 在許多較高難度的測試中取得重要進展,表現提升了 30%。

gettyimages openai
Credit: Getty Images

GPT-4 系統是 GPT、GPT-2 和 GPT-3 的後續產物,由 OpenAI 推出。目前,它是最大的多模態模型,能夠接收圖像和文本輸入,並輸出文本。該系統利用深度學習技術,仿照人類寫作,使用人工神經網絡。

研究員 Noah Shinn 和 Ashwin Gopinath 在論文中指出:「我們研發了一種使 AI 代理能模擬人類自我反思並評估自身表現的創新技術。在完成各類測試時,GPT-4 會添加額外步驟,讓其能自行設計測試以檢查答案,找出錯誤和不足之處,並根據發現修改解決方案。」

A Self-Reflecting LLM Agent

Equips LLM-based agent w/
-dynamic memory
-a self-reflective LLM
-a method for detecting hallucinations

Challenge agent to learn from its own mistakes

-Evaluate on knowledge-intensive tasks
-Outperforms ReAct agents

Paper: https://t.co/URsJWbkwmj pic.twitter.com/WfNcPQvIs6

— John Nay (@johnjnay) March 23, 2023

該研究團隊針對 GPT-4 進行了多種不同性能測試。在 HumanEval 測試中,GPT-4 面對 164 個未見過的 Python 編程問題,原本準確率為 67%;經反思技術後,準確率增至 88%。在 Alfworld 測試中,GPT-4 須在各種互動環境中進行決策,解決多步任務。應用反思技術後,準確率從 73% 提升至 97%,僅 4 項任務失敗。在 HotPotQA 測試中,GPT-4 可查閱維基百科,回答需從多個支援文件中解析內容並推理的 100 個問題。原本準確率為 34%,經反思技術後,提高至 54%。

assets newatlas 2
在 HumanEval 測試中,原本準確率為 67%;經反思技術後,準確率增至 88%。

 

assets newatlas
GPT-4 可以通過設計和執行測試來進行評估,從而提高其性能,此圖是 AlfWorld 測試中的結果

此研究顯示,AI 解決方案有時依賴 AI 本身。這與生成對抗網絡相似,後者是讓兩個 AI 互相提升技能的方法。例如,一個 AI 嘗試生成看似真實的圖片,而另一個 AI 試圖分辨真偽。在 GPT-4 的情境下,它既是作者也是編輯,通過自我反思來提升自身輸出品質。

Source: nanothoughts
Tags: ChatGPTOpen AI
Share22SendShareShare
>> 按此在 Google News 追蹤本站最新內容<<
Previous Post

Marvel Studios 全新原創劇集《秘密入侵》將於 6.21 在 Disney+ 上線

Next Post

Sony 推出 WF-C700N 全無線降噪耳機,WH-1000XM5 加推午夜藍色系

相關文章

meta ai lecun
科技新聞

Meta 首席 AI 專家狠批 OpenAI Sora:偏離正確軌道、注定失敗!

2024/02/23
help me write feature
科技新聞

Google 宣布 Chrome 瀏覽器加入「幫助我寫」的 AI 新功能

2024/02/23
english whatsapp text formatting static
應用教學

WhatsApp 加入更多文字格式化,這個表你一定要存起來!

2024/02/23
whatsapp privacy
科技新聞

WhatsApp 測試新功能,將限制用戶使用截圖保私隱!

2024/02/21
b700cfee864c
科技新聞

小米 14 Ultra 手機現身 GeekBench 4,配置及跑分資訊曝光

2024/01/31
daily cash
科技新聞

Apple Card 儲蓄賬戶正式推出,年利率比一般銀行高十倍!

2023/04/18
Next Post
wf c700n sagegreen new

Sony 推出 WF-C700N 全無線降噪耳機,WH-1000XM5 加推午夜藍色系

Recommended

xiaomi 14 ultra hero

Xiaomi 14 Ultra 系列香港推出,發售日期、售價、預訂優惠

2 years ago
guanyu

《三國BLADE:再戰》歡慶韓服七週年 慶祝活動同步開跑

2 years ago

Trending

No Content Available

Popular

No Content Available
Tech & Deals

本站的三大元素:科技新聞、產品發佈、著數優惠!

  • About
  • 聯絡我們

Copyright © 2023, teachandeal.com

No Result
View All Result
  • 首頁
  • 科技新聞
  • 著數優惠
  • 電訊網絡
  • 智能裝置
  • 電腦產品
  • 電子產品
  • 家庭電器
  • 家庭影音
  • 加密貨幣
  • 聯絡我們

Copyright © 2023, teachandeal.com