Llama-3不算真開(kāi)源:今年10月,權(quán)威定義就要來(lái)了
相信很多大家對(duì)Llama-3不算真開(kāi)源:今年10月,權(quán)威定義就要來(lái)了還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
開(kāi)源大模型的標(biāo)桿 Llama3,居然都「被閉源」了。今天,開(kāi)源再次成為了人們討論的話(huà)題。
如今,開(kāi)源的人工智能算法無(wú)處不在,從個(gè)人開(kāi)發(fā)者到大型科技公司,大家都在享受最新技術(shù)帶來(lái)的成果。
就連目前最熱門(mén)的大模型領(lǐng)域,也區(qū)分了開(kāi)源和閉源兩個(gè)互相競(jìng)爭(zhēng)的大方向。人們認(rèn)為,隨著開(kāi)源技術(shù)的擴(kuò)散與交流,開(kāi)源的大模型最終將趕上 OpenAI 這樣的業(yè)界頂尖水平。這或許就是扎克伯格等人理想中的繁盛景象。
不過(guò),在層出不窮的新 AI 模型評(píng)論區(qū)里,我們也經(jīng)??吹接腥送虏邸高B權(quán)重、數(shù)據(jù)都沒(méi)有,這算什么開(kāi)源?」
這個(gè)時(shí)候,一家有影響力的機(jī)構(gòu)終于決定站出來(lái),對(duì)開(kāi)源這件事下一個(gè)定義了。
今年10月,「真開(kāi)源」定義就要來(lái)了
開(kāi)放源代碼促進(jìn)會(huì)(OSI)最近公布了其對(duì)「開(kāi)源 AI」的最新定義草案。此舉旨在澄清 Open Source 這一術(shù)語(yǔ)在快速發(fā)展的科技領(lǐng)域中,經(jīng)常出現(xiàn)的模糊用法。
這個(gè)定義似乎來(lái)的正是時(shí)候。一個(gè)月前,大模型領(lǐng)域剛剛經(jīng)歷過(guò)一輪開(kāi)源技術(shù)更新。Meta 發(fā)布了迄今為止最強(qiáng)的開(kāi)源大模型 Llama3.1405B,宣布所有 Llama 版本的總下載量已超過(guò)3億次,創(chuàng)業(yè)公司 Mistral 也緊接著宣布開(kāi)源了 Large2大模型。
這些公司發(fā)布的預(yù)訓(xùn)練 AI 語(yǔ)言模型帶有權(quán)重使用限制,同時(shí)繼續(xù)使用了「開(kāi)源」標(biāo)簽。這引發(fā)了開(kāi)發(fā)者們對(duì) AI 技術(shù)背景下什么才是真「開(kāi)源」的激烈爭(zhēng)論。
因?yàn)樽罱欢螘r(shí)間,開(kāi)源變得越來(lái)越像是一個(gè)營(yíng)銷(xiāo)術(shù)語(yǔ),將大模型描述為「開(kāi)源」可以讓人們對(duì)其變得更加信賴(lài),即使研究人員和開(kāi)發(fā)者時(shí)常會(huì)被這些許可證所限制。
Llama-3.1發(fā)布的時(shí)候,Yann LeCun 曾宣傳了開(kāi)源的優(yōu)勢(shì)。
OSI 給出的定義下,很多事情需要我們來(lái)重新審視。例如,Meta 的 Llama3模型雖然可以自由獲取,但 Meta 針對(duì)使用 Llama 系列模型的公司規(guī)模及通過(guò)該模型生成的內(nèi)容類(lèi)型,設(shè)定了特定的許可限制。因此,Llama 不符合 OSI 為軟件定義的傳統(tǒng)開(kāi)源標(biāo)準(zhǔn)。
文生圖模型 Flux 實(shí)際上也不是真正的開(kāi)源。由于這種模糊性,OSI 通常用「開(kāi)放權(quán)重」或「代碼可用」等術(shù)語(yǔ)來(lái)指代那些含有代碼或權(quán)重限制或缺乏配套訓(xùn)練數(shù)據(jù)的 AI 模型。
為了正式解決「真假開(kāi)源」的問(wèn)題,一向倡導(dǎo)開(kāi)源的 OSI 召集了一個(gè)專(zhuān)家團(tuán)隊(duì)來(lái)為「開(kāi)源」下定義。這個(gè)約70人的團(tuán)隊(duì)由研究人員、律師、政策制定者組成,其中還有來(lái)自 Meta、Google 和亞馬遜等大型科技公司的代表。他們起草的最新草案為判斷 AI 模型是否符合開(kāi)源標(biāo)準(zhǔn)提出了「四項(xiàng)基本自由」:不限制使用目的,允許深入研究其工作原理,支持隨意修改,無(wú)論是否進(jìn)行過(guò)修改都允許用戶(hù)自由分享模型。
這「四項(xiàng)基本自由」也沿用了人們對(duì)開(kāi)源軟件的定義。OSI 希望通過(guò)對(duì)「開(kāi)源 AI」樹(shù)立明確的標(biāo)準(zhǔn),方便開(kāi)發(fā)者、研究人員和用戶(hù)在創(chuàng)建、研究或使用 AI 工具做出更明智的決策。
OSI 執(zhí)行董事 Stefano Maffulli 在 Linux 基金會(huì) AI_dev 大會(huì)上發(fā)布了對(duì)開(kāi)源定義的最新版草案
換句話(huà)說(shuō),開(kāi)源對(duì)于 AI 更加穩(wěn)定安全:如果 AI 模型做到了真正的「開(kāi)源」,研究人員將能分析 AI 模型背后的工作方式,AI 系統(tǒng)的潛在軟件漏洞也將更加明顯。相較于 OpenAI 的「閉源」系統(tǒng) ChatGPT,其確切的架構(gòu)是一個(gè)嚴(yán)格保密的秘密。
據(jù) OSI 的項(xiàng)目時(shí)間表顯示,他們預(yù)計(jì)在2024年10月在 All Things Open 會(huì)議上正式宣布「開(kāi)源 AI」定義的最終版。
那么在這個(gè)定義下,有哪些大模型是「開(kāi)源」的呢?據(jù)說(shuō)在第一批名單里包括 EleutherAI 的 Pythia、Ai2的 OLMo 和開(kāi)源集體 LLM360等。
「創(chuàng)新不應(yīng)該需要許可」
在五月份的新聞發(fā)布會(huì)上,OSI 強(qiáng)調(diào)了為真正的「開(kāi)源」AI 厘清定義的重要性?!窤I 與常規(guī)軟件不同,需要迫使所有利益相關(guān)者重新審視開(kāi)源原則對(duì)該領(lǐng)域的適用性」,OSI 的執(zhí)行董事 Stefano Maffulli 說(shuō),「OSI 相信每個(gè)人都應(yīng)保有對(duì)技術(shù)的主導(dǎo)權(quán)和控制權(quán)。我們還認(rèn)識(shí)到,當(dāng)定義明確后,它將推動(dòng) AI 系統(tǒng)更加透明、更緊密的協(xié)作和無(wú)需許可的創(chuàng)新,市場(chǎng)就會(huì)繁榮發(fā)展?!?/p>
OSI 的最新草案不止要求「開(kāi)源」模型本身及其權(quán)重,還要求對(duì)整個(gè)系統(tǒng)更加廣義的開(kāi)放。 一個(gè) AI 系統(tǒng)要想被認(rèn)定為「開(kāi)源」,必須提供 OSI 定義的「適合修改的形式」,其中包括訓(xùn)練數(shù)據(jù)的詳細(xì)信息、用于訓(xùn)練和運(yùn)行系統(tǒng)的全部源代碼,以及模型權(quán)重和參數(shù)。這些都必須在 OSI 認(rèn)可的許可證或條款下提供。
值得注意的是,這份草案并沒(méi)有強(qiáng)制要求公開(kāi)原始訓(xùn)練數(shù)據(jù)。相反,它要求提供關(guān)于訓(xùn)練數(shù)據(jù)和方法的詳細(xì)元數(shù)據(jù)。比如數(shù)據(jù)的來(lái)源、選擇標(biāo)準(zhǔn)、預(yù)處理技術(shù)以及其他相關(guān)細(xì)節(jié),方便研究者重建類(lèi)似的系統(tǒng)。
這種方法旨在不公開(kāi)實(shí)際數(shù)據(jù)集的情況下提供透明度和可復(fù)制性,在堅(jiān)持開(kāi)源原則的同時(shí),從表面上解決了潛在的隱私和版權(quán)問(wèn)題。不過(guò)是否能達(dá)成預(yù)計(jì)的效果,可能還有待進(jìn)一步討論。
訓(xùn)練數(shù)據(jù)的來(lái)源缺乏透明度,已經(jīng)導(dǎo)致了一系列針對(duì)大型 AI 公司的訴訟。從 OpenAI 這樣的業(yè)內(nèi)帶頭人到 Suno 這樣的小應(yīng)用,這些公司的生成式 AI 產(chǎn)品除了聲稱(chēng)包含「可公開(kāi)訪(fǎng)問(wèn)的信息」外,并未披露太多有關(guān)其訓(xùn)練集的信息。很多人呼吁開(kāi)源模型應(yīng)該披露所有訓(xùn)練集,不過(guò)由于版權(quán)和數(shù)據(jù)所有權(quán)等問(wèn)題,這一標(biāo)準(zhǔn)很難執(zhí)行。
「這個(gè)定義最有趣的是,他們?cè)试S不公開(kāi)訓(xùn)練數(shù)據(jù),」獨(dú)立 AI 研究員 Simon Willison 在接受外媒 Ars Technica 采訪(fǎng)時(shí)說(shuō)道:「這是一個(gè)非常務(wù)實(shí)的方法 —— 如果不允許這樣,那就幾乎就沒(méi)有模型算『開(kāi)源』了?!?/p>
OSI 想明確「開(kāi)源」的定義,這個(gè)想法可以追溯到2022年,當(dāng)時(shí)它首次開(kāi)始聯(lián)系有關(guān)組織,邀請(qǐng)他們一起來(lái)定義這個(gè)術(shù)語(yǔ)。
「經(jīng)過(guò)近兩年,我們從世界各地征求意見(jiàn),來(lái)確定適合 AI 系統(tǒng)的開(kāi)源原則,OSI 現(xiàn)在正在全球巡講,希望能夠完善并驗(yàn)證草案中的定義,」Maffulli 表示,「定義『開(kāi)源』的研討會(huì)仍在進(jìn)行,現(xiàn)在參與還不晚,可以通過(guò) OSI 網(wǎng)站找到論壇,發(fā)表評(píng)論建言獻(xiàn)策?!?/p>
當(dāng)最終定義在10月揭曉時(shí),新的「開(kāi)源」AI 定義可能對(duì)行業(yè)產(chǎn)生深遠(yuǎn)影響。它將影響公司以何種形式發(fā)布 AI 模型,并塑造未來(lái)的法規(guī),例如加州備受爭(zhēng)議的 SB-1047法案。
希望新的定義,能夠進(jìn)一步推動(dòng)大模型領(lǐng)域的技術(shù)創(chuàng)新。
以上就是關(guān)于【Llama-3不算真開(kāi)源:今年10月,權(quán)威定義就要來(lái)了】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!
免責(zé)聲明:本文由用戶(hù)上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 董明珠曾喊話(huà)雷軍給股民分多少錢(qián)!格力:擬分紅超55億
- Epic喜+1:動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元
- 雷軍辟謠只招聘35歲以下員工:僅針對(duì)未來(lái)之星項(xiàng)目
- 普華永道發(fā)布2025年AI預(yù)測(cè):AI Agents將勞動(dòng)力提升1倍
- 雷軍回應(yīng)股價(jià)暴跌:年年難過(guò)年年過(guò)
- 一天100座!理想汽車(chē)第1700座超充站正式建成
- 《守望先鋒》國(guó)服宣布2月19日回歸:賬號(hào)數(shù)據(jù)完整保留
- 雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢(qián)給員工:別到山窮水盡才講問(wèn)題
- 雷軍新年第一天收到200元紅包 自侃年入百萬(wàn)的開(kāi)始
- 雷軍親自展示REDMI Turbo 4!2025年第一款新機(jī)
- 雷軍:小米未來(lái)10年建至少20座世界頂級(jí)工廠(chǎng)
- 雷軍辟謠只招聘35歲以下員工:只有招聘未來(lái)之星時(shí)才有年齡限制
- 雷軍回應(yīng)100億造車(chē):沒(méi)有好到“封神” 不要神話(huà)我
- 雷軍表態(tài):一心做好小米汽車(chē) 大家可以在“許愿池”尋找商機(jī)
- 雷軍:中國(guó)汽車(chē)產(chǎn)業(yè)應(yīng)少些歪門(mén)邪道 不要發(fā)黑稿、背后捅刀子
- 小米SU7選配色都是7000元 為什么璀璨洋紅卻需要9000元
-
【空調(diào)外機(jī)聲音大是什么問(wèn)題】空調(diào)在使用過(guò)程中,如果發(fā)現(xiàn)外機(jī)發(fā)出異常的噪音,可能會(huì)讓人感到困擾。空調(diào)外機(jī)...瀏覽全文>>
-
【空調(diào)外機(jī)聲音大如何解決】空調(diào)在使用過(guò)程中,外機(jī)發(fā)出較大的噪音是很多用戶(hù)遇到的常見(jiàn)問(wèn)題。這不僅影響居住...瀏覽全文>>
-
【空調(diào)外機(jī)清洗方法是什么】空調(diào)外機(jī)是空調(diào)系統(tǒng)中非常重要的組成部分,它的清潔程度直接影響到空調(diào)的制冷效果...瀏覽全文>>
-
【空調(diào)突然不制冷的原因】當(dāng)家中的空調(diào)突然不再制冷時(shí),不僅影響使用體驗(yàn),還可能帶來(lái)一定的安全隱患。了解空...瀏覽全文>>
-
【空調(diào)銅管什么作用】空調(diào)在現(xiàn)代生活中扮演著越來(lái)越重要的角色,尤其是在夏季高溫時(shí),它為我們提供了舒適的室...瀏覽全文>>
-
【空調(diào)銅管結(jié)霜怎么回事】空調(diào)在使用過(guò)程中,有時(shí)會(huì)出現(xiàn)銅管結(jié)霜的現(xiàn)象,這不僅影響制冷效果,還可能對(duì)設(shè)備造...瀏覽全文>>
-
【空調(diào)銅管結(jié)霜是什么原因】當(dāng)空調(diào)運(yùn)行時(shí),如果發(fā)現(xiàn)室內(nèi)機(jī)的銅管出現(xiàn)結(jié)霜現(xiàn)象,這不僅影響制冷效果,還可能對(duì)...瀏覽全文>>
-
【空谷幽蘭是什么意思】“空谷幽蘭”是一個(gè)富有詩(shī)意的成語(yǔ),常用來(lái)形容在偏僻、冷清的地方生長(zhǎng)的蘭花。它不僅...瀏覽全文>>
-
【空格怎么打出來(lái)】在日常使用電腦或手機(jī)輸入文字時(shí),經(jīng)常會(huì)遇到需要輸入“空格”的情況。雖然看似簡(jiǎn)單,但很...瀏覽全文>>
-
【空格怎么打】在日常使用電腦或手機(jī)時(shí),很多人會(huì)遇到“空格怎么打”的問(wèn)題。其實(shí),“空格”是一個(gè)非?;A(chǔ)的...瀏覽全文>>
- 空調(diào)突然不制冷的原因
- 空格怎么打出來(lái)
- 空城舊夢(mèng)是情侶網(wǎng)名嗎
- 可吸收線(xiàn)是什么顏色
- 可微與可導(dǎo)之間有什么聯(lián)系
- 康復(fù)是什么意思
- 康復(fù)評(píng)定包括哪5個(gè)方面
- 開(kāi)通QQ十周年黃鉆是不是可以永久使用十周年黃鉆標(biāo)志
- 卡路里和焦耳怎么換算
- 卡樂(lè)購(gòu)是什么意思
- 卡拉瓦喬代表作
- 巨鱷的電影有什么
- 巨大的英語(yǔ)是什么
- 禁閉島的結(jié)局真相
- 靳東個(gè)人資料
- 靳東的妹妹為什么叫高露
- 金枝玉葉繁殖方法
- 金針菜和黃花菜是一種嗎
- 金吉鳥(niǎo)健身私教一般多少
- 戒指戴什么手指好