最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁 >> 今日更新 >

起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號:大家深吸一口氣

2024-08-02 14:30:31 來源: 用戶: 

相信很多大家對起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號:大家深吸一口氣還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

起猛了,GPT-4o被谷歌新模型超越了!

歷時一周,超1,2000人匿名投票,Gemini1.5Pro(0801)代表谷歌首次奪得lmsys競技場第一。(中文任務(wù)也第一)

而且這次還是雙冠王,除了總榜(唯一分數(shù)上1300),在視覺排行榜上也是第一。

Gemini團隊的關(guān)鍵人物Simon Tokumine發(fā)文慶祝稱:

一位Reddit用戶也稱該模型“非常好”,并表示希望其功能不會被縮減。

更多網(wǎng)友興奮表示,OpenAI終于受到挑戰(zhàn),要發(fā)布新版本來反擊了!

ChatGPT官方賬號也出來暗示著什么。

一片熱鬧之際,谷歌AI Studio產(chǎn)品負責(zé)人宣布該模型進入免費測試階段:

網(wǎng)友:谷歌終于來了!

嚴(yán)格來說,Gemini1.5Pro(0801)其實不算新模型。

該實驗性版本建立在谷歌2月發(fā)布的Gemini1.5Pro基礎(chǔ)之上,后來1.5系列將上下文窗口擴展到了200萬。

隨著模型更新,這命名也是越來越長了,也引起人們一片吐槽。

這不,一位OpenAI員工祝賀之余不忘陰陽怪氣一把:

當(dāng)然了,雖然名字難記,但Gemini1.5Pro(0801)這次在競技場官方評測中表現(xiàn)亮眼。

總體勝率熱圖顯示,它比GPT-4o勝出54%,比Claude3.5Sonnet勝出59%。

在多語言能力基準(zhǔn)測試中,它在中文、日語、德語、俄語均排名第一。

但是,在Coding、Hard Prompt Arena中,它還是打不過Claude3.5Sonnet、GPT-4o、Llama405B等對手。

這一點也遭到網(wǎng)友詬病,轉(zhuǎn)譯過來就是:

不過也有人出來安利Gemini1.5Pro(0801)的圖像和PDF提取功能。

DAIR.AI聯(lián)合創(chuàng)始人Elvis親自在油管做了全套測試,并總結(jié)道:

以及,有人拿Gemini1.5Pro(0801)來解決Claude3.5Sonet之前回答不好的問題。

結(jié)果一看,它不僅表現(xiàn)更好,同時也干掉了自家小伙伴Gemini1.5Flash。

不過嘛,一些經(jīng)典常識測試它還是搞不定,比如“寫十個以蘋果結(jié)尾的句子”。

One More Thing

與此同時,谷歌Gemma2系列迎來了一個新的20億參數(shù)模型。

Gemma2(2B)開箱即用,可以在Google Colab的免費T4GPU上運行。

在競技場排行榜上,它超過了所有GPT-3.5模型,甚至超越了Mixtral-8x7b。

面對谷歌最新取得的一系列新排名,競技場榜單權(quán)威性再次受到大家質(zhì)疑。

Nous Research聯(lián)合創(chuàng)始人Teknium(微調(diào)后訓(xùn)練領(lǐng)域知名玩家)發(fā)文提醒:

Abacus.AI首席執(zhí)行官Bindu Reddy更是直接呼吁:

那么,你認為這種人類匿名投票的方式還靠譜嗎?(歡迎評論區(qū)討論)

參考鏈接:

[1]https://x.com/lmsysorg/status/1819048821294547441

[2]https://x.com/JeffDean/status/1819121162578022849

[3]https://x.com/stevenheidel/status/1819080995062403484

[4]https://x.com/rohanpaul_ai/status/1818697538360295897

[5]https://x.com/bindureddy/status/1818738366466412601

[6]https://x.com/infwinston/status/1818718423700103526

—完—

以上就是關(guān)于【起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號:大家深吸一口氣】的相關(guān)內(nèi)容,希望對大家有幫助!

  免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!

 
分享:
最新文章