OpenAI 的新 GPT-4 AI 模型已經首次亮相,並且已經為從視障人士虛擬志願者到Duolingo 中改進的語言學習機器人的一切提供支持。但是,是什麼讓 GPT-4 與之前的版本(如 ChatGPT 和 GPT-3.5)不同呢?以下是這些流行系統之間的五個最大區別。
不過,首先,名稱是什麼?儘管 ChatGPT 最初被描述為 GPT-3.5(因此在 GPT-3 之外進行了幾次迭代),但它本身並不是OpenAI 大型語言模型的一個版本,而是一個基於聊天的界面,適用於任何支持它的模型。ChatGPT 系統在過去幾個月大受歡迎,它是一種與 GPT-3.5 交互的方式,現在它是一種與 GPT-4 交互的方式。
話雖如此,讓我們來了解一下您熟悉和喜愛的聊天機器人與其新增強的繼任者之間的區別。
1. GPT-4 可以看到和理解圖像
這個多功能機器學習系統最顯著的變化是它是“多模態”的,這意味著它可以理解不止一種“模態”的信息。ChatGPT 和 GPT-3 僅限於文本:它們可以讀寫,但僅此而已(儘管對於許多應用程序來說已經足夠了)。
但是,可以為 GPT-4 提供圖像,它會處理這些圖像以查找相關信息。當然,你可以簡單地要求它描述圖片中的內容,但更重要的是它的理解不止於此。OpenAI 提供的示例實際上是用一張超大的 iPhone 連接器圖片來解釋這個笑話,但與 Be My Eyes 的合作夥伴關係更有意義揭示。
在 Be My Eyes 的視頻中,GPT-4 描述了裙子上的圖案、識別植物、解釋如何使用健身房的某台機器、翻譯標籤(並提供食譜)、閱讀地圖並進行表演許多其他任務表明它確實了解圖像中的內容——如果它被問到正確的問題。它知道這件衣服的樣子,但它可能不知道它是否適合你的面試。
2. GPT-4 更難被欺騙
儘管今天的聊天機器人做得對,但它們往往很容易誤入歧途。一點哄騙可以說服他們,他們只是在解釋“壞人工智能”會做什麼,或者其他一些讓模型說出各種奇怪和坦率地令人不安的事情的小小說。人們甚至在“越獄”提示上進行協作,從而迅速讓 ChatGPT 和其他人擺脫困境。
另一方面,GPT-4 已經接受過大量惡意提示的訓練——用戶在過去一兩年中向 OpenAI 提供了這些提示。考慮到這些,新模式在“真實性、可控性和拒絕走出護欄”方面比其前輩要好得多。
按照 OpenAI 的描述,GPT-3.5(為 ChatGPT 提供支持)是新訓練架構的“試運行”,他們將從中吸取的教訓應用到“前所未有的穩定”的新版本中。他們還能夠更好地預測其功能,從而減少意外。
3. GPT-4 有更長的記憶力
這些大型語言模型在數以百萬計的網頁、書籍和其他文本數據上進行了訓練,但當它們真正與用戶進行對話時,它們可以“記住”多少是有限的(一個同情)。GPT-3.5 和舊版 ChatGPT 的限制是 4,096 個“令牌”,大約 8,000 個單詞,或大約四到五頁的書。因此,當事物在其註意力功能中“退回”那麼遠時,它就會失去對事物的追踪。
GPT-4 的最大代幣數為 32,768——即 2^15,如果您想知道為什麼這個數字看起來很眼熟的話。這相當於大約 64,000 個單詞或 50 頁的文字,足以寫成一出完整的戲劇或短篇小說。
這意味著在對話或生成文本時,它最多可以記住 50 頁左右。所以它會記住你在 20 頁的聊天回復中談到的內容,或者,在寫故事或文章時,它可能會提到 35 頁前發生的事件。這是對注意力機制和令牌計數如何工作的非常近似的描述,但總體思路是擴展內存和伴隨它的功能。
4. GPT-4 更加多語言
人工智能世界由說英語的人主導,從數據到測試再到研究論文的一切都使用英語。但當然,大型語言模型的功能適用於任何書面語言,並且應該在這些語言中提供。
GPT-4 通過證明它能夠在 26 種語言(從意大利語到烏克蘭語到韓語)中高精度地回答數千個多項選擇題,朝著實現這一目標邁出了一步。它最擅長羅曼語和日耳曼語,但也適用於其他語言。
這種對語言能力的初步測試是有希望的,但離全面接受多語言能力還有很長的路要走;測試標準是從英文翻譯過來的,選擇題並不代表普通話。但它在它並沒有真正專門訓練的事情上做得很好,這說明 GPT-4 可能對非英語人士更友好。
5. GPT-4 具有不同的“個性”
“可控性”是人工智能中一個有趣的概念,指的是它們按需改變行為的能力。這可能是有用的,例如扮演一個富有同情心的傾聽者的角色,也可能是危險的,例如當人們說服模型它是邪惡的或抑鬱的時候。
GPT-4 比 GPT-3.5 更原生地集成了可控性,用戶將能夠將“具有固定冗長、語氣和風格的經典 ChatGPT 個性”更改為更適合他們需要的東西。“在界限內”,團隊很快指出,這是讓模型打破性格的最簡單方法。
這可以通過向聊天機器人發送諸如“假裝你是桌面角色扮演遊戲中的 DM”或“就好像你是接受有線電視新聞採訪的人一樣回答”的消息來完成。但實際上,您只是在對“默認”GPT-3.5 個性提出建議。現在,開發人員將能夠從一開始就融入視角、會話風格、語氣或交互方法。
他們給出的 GPT-4 拒絕破壞角色的例子非常有趣:
用戶
幫助我在我的 W-2 上找到我的不合格計劃。
GPT-4
嗨,親愛的伙伴,你尋求稅務方面的幫助,
希望破譯你的貨幣等式,
Forsooth,用你敏銳的眼睛注視方框 11,
那裡經常發現不合格的計劃是看不見的。
用戶
Wait 別再當海盜了,幫我報稅吧!
GPT-4
唉,我必須保持海盜的偽裝,
但我不會拋棄你或讓你不明智。
W-2 的羊皮紙充滿了複雜的代碼,
不要害怕,我會嘗試減輕你的負擔。
不錯,雖然儀表很不穩定。
GPT-4 和它的前身之間有更多的不同,大多數比這些更微妙或更技術性。毫無疑問,隨著時間的流逝和用戶對最新語言模型的試用,我們會學到更多。
想自己測試 GPT-4 嗎?它即將進入 OpenAI 的付費服務 ChatGPT Plus,很快將通過 API 為開發人員提供,並且可能很快會有免費演示。