起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號:大家深吸一口氣
相信很多大家對起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號:大家深吸一口氣還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
起猛了,GPT-4o被谷歌新模型超越了!
歷時一周,超1,2000人匿名投票,Gemini1.5Pro(0801)代表谷歌首次奪得lmsys競技場第一。(中文任務(wù)也第一)
而且這次還是雙冠王,除了總榜(唯一分數(shù)上1300),在視覺排行榜上也是第一。
Gemini團隊的關(guān)鍵人物Simon Tokumine發(fā)文慶祝稱:
一位Reddit用戶也稱該模型“非常好”,并表示希望其功能不會被縮減。
更多網(wǎng)友興奮表示,OpenAI終于受到挑戰(zhàn),要發(fā)布新版本來反擊了!
ChatGPT官方賬號也出來暗示著什么。
一片熱鬧之際,谷歌AI Studio產(chǎn)品負責(zé)人宣布該模型進入免費測試階段:
網(wǎng)友:谷歌終于來了!
嚴(yán)格來說,Gemini1.5Pro(0801)其實不算新模型。
該實驗性版本建立在谷歌2月發(fā)布的Gemini1.5Pro基礎(chǔ)之上,后來1.5系列將上下文窗口擴展到了200萬。
隨著模型更新,這命名也是越來越長了,也引起人們一片吐槽。
這不,一位OpenAI員工祝賀之余不忘陰陽怪氣一把:
當(dāng)然了,雖然名字難記,但Gemini1.5Pro(0801)這次在競技場官方評測中表現(xiàn)亮眼。
總體勝率熱圖顯示,它比GPT-4o勝出54%,比Claude3.5Sonnet勝出59%。
在多語言能力基準(zhǔn)測試中,它在中文、日語、德語、俄語均排名第一。
但是,在Coding、Hard Prompt Arena中,它還是打不過Claude3.5Sonnet、GPT-4o、Llama405B等對手。
這一點也遭到網(wǎng)友詬病,轉(zhuǎn)譯過來就是:
不過也有人出來安利Gemini1.5Pro(0801)的圖像和PDF提取功能。
DAIR.AI聯(lián)合創(chuàng)始人Elvis親自在油管做了全套測試,并總結(jié)道:
以及,有人拿Gemini1.5Pro(0801)來解決Claude3.5Sonet之前回答不好的問題。
結(jié)果一看,它不僅表現(xiàn)更好,同時也干掉了自家小伙伴Gemini1.5Flash。
不過嘛,一些經(jīng)典常識測試它還是搞不定,比如“寫十個以蘋果結(jié)尾的句子”。
One More Thing
與此同時,谷歌Gemma2系列迎來了一個新的20億參數(shù)模型。
Gemma2(2B)開箱即用,可以在Google Colab的免費T4GPU上運行。
在競技場排行榜上,它超過了所有GPT-3.5模型,甚至超越了Mixtral-8x7b。
面對谷歌最新取得的一系列新排名,競技場榜單權(quán)威性再次受到大家質(zhì)疑。
Nous Research聯(lián)合創(chuàng)始人Teknium(微調(diào)后訓(xùn)練領(lǐng)域知名玩家)發(fā)文提醒:
Abacus.AI首席執(zhí)行官Bindu Reddy更是直接呼吁:
那么,你認為這種人類匿名投票的方式還靠譜嗎?(歡迎評論區(qū)討論)
參考鏈接:
[1]https://x.com/lmsysorg/status/1819048821294547441
[2]https://x.com/JeffDean/status/1819121162578022849
[3]https://x.com/stevenheidel/status/1819080995062403484
[4]https://x.com/rohanpaul_ai/status/1818697538360295897
[5]https://x.com/bindureddy/status/1818738366466412601
[6]https://x.com/infwinston/status/1818718423700103526
—完—
以上就是關(guān)于【起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號:大家深吸一口氣】的相關(guān)內(nèi)容,希望對大家有幫助!
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!
-
【空調(diào)外機聲音大是什么問題】空調(diào)在使用過程中,如果發(fā)現(xiàn)外機發(fā)出異常的噪音,可能會讓人感到困擾。空調(diào)外機...瀏覽全文>>
-
【空調(diào)外機聲音大如何解決】空調(diào)在使用過程中,外機發(fā)出較大的噪音是很多用戶遇到的常見問題。這不僅影響居住...瀏覽全文>>
-
【空調(diào)外機清洗方法是什么】空調(diào)外機是空調(diào)系統(tǒng)中非常重要的組成部分,它的清潔程度直接影響到空調(diào)的制冷效果...瀏覽全文>>
-
【空調(diào)突然不制冷的原因】當(dāng)家中的空調(diào)突然不再制冷時,不僅影響使用體驗,還可能帶來一定的安全隱患。了解空...瀏覽全文>>
-
【空調(diào)銅管什么作用】空調(diào)在現(xiàn)代生活中扮演著越來越重要的角色,尤其是在夏季高溫時,它為我們提供了舒適的室...瀏覽全文>>
-
【空調(diào)銅管結(jié)霜怎么回事】空調(diào)在使用過程中,有時會出現(xiàn)銅管結(jié)霜的現(xiàn)象,這不僅影響制冷效果,還可能對設(shè)備造...瀏覽全文>>
-
【空調(diào)銅管結(jié)霜是什么原因】當(dāng)空調(diào)運行時,如果發(fā)現(xiàn)室內(nèi)機的銅管出現(xiàn)結(jié)霜現(xiàn)象,這不僅影響制冷效果,還可能對...瀏覽全文>>
-
【空谷幽蘭是什么意思】“空谷幽蘭”是一個富有詩意的成語,常用來形容在偏僻、冷清的地方生長的蘭花。它不僅...瀏覽全文>>
-
【空格怎么打出來】在日常使用電腦或手機輸入文字時,經(jīng)常會遇到需要輸入“空格”的情況。雖然看似簡單,但很...瀏覽全文>>
-
【空格怎么打】在日常使用電腦或手機時,很多人會遇到“空格怎么打”的問題。其實,“空格”是一個非?;A(chǔ)的...瀏覽全文>>