女生高潮喷水视频,俄罗斯精品无码在线一区

斯坦福團(tuán)隊(duì)抄襲國(guó)產(chǎn)AI開(kāi)源模型

2024-06-11 14:20

近日，斯坦福大學(xué)AI團(tuán)隊(duì)主導(dǎo)的Llama3-V開(kāi)源模型被證實(shí)套殼抄襲國(guó)內(nèi)清華與面壁智能的開(kāi)源模型“小鋼炮”MiniCPM-Llama3-V 2.5一事，在網(wǎng)絡(luò)上引發(fā)熱議。

巧合的是，最先發(fā)現(xiàn)抄襲的，是星空君一起玩AI的朋友，大家先是在群里義憤填膺的批判，然后朋友把相關(guān)資料發(fā)到推特發(fā)酵，最終引起了斯坦福團(tuán)隊(duì)在hugging face刪庫(kù)跑路。

在最新進(jìn)展中，斯坦福Llama3-V團(tuán)隊(duì)的兩位作者Siddharth Sharma和 Aksh Garg在社交平臺(tái)上就這一學(xué)術(shù)不端行為向面壁MiniCPM團(tuán)隊(duì)正式道歉，并表示會(huì)將Llama3-V模型悉數(shù)撤下。

6月3日，面壁智能CEO李大海與聯(lián)合創(chuàng)始人劉知遠(yuǎn)先后發(fā)文，回應(yīng)開(kāi)源模型被斯坦福大學(xué)AI團(tuán)隊(duì)抄襲一事，稱“深表遺憾”：一方面感慨這是一種受到國(guó)際團(tuán)隊(duì)認(rèn)可的方式，另一方面呼吁大家共建開(kāi)放、合作、有信任的社區(qū)環(huán)境。“我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可，但不是以這種方式。”

其實(shí)這從側(cè)面反映出中國(guó)AI團(tuán)隊(duì)的影響力。

很長(zhǎng)一段時(shí)間，因?yàn)槿ν馊穗y以理解的原因，中國(guó)的AI團(tuán)隊(duì)背負(fù)著“抄襲”、“套殼”的惡名，甚至很多人說(shuō)“國(guó)外一開(kāi)源，國(guó)內(nèi)就自研”。

ChatGPT剛剛發(fā)布的時(shí)候，國(guó)產(chǎn)的AI因?yàn)椴捎昧溯^多的國(guó)外訓(xùn)練集，使用的時(shí)候存在著把用戶的中文翻譯成英文再和大模型交互的情況，被惡毒的攻擊為套殼。

后來(lái)，當(dāng)谷歌的大模型發(fā)布的時(shí)候，人們發(fā)現(xiàn)幾乎存在著一模一樣的問(wèn)題，才有一部分人明白問(wèn)題的根源。

在生成式AI方面，美國(guó)的團(tuán)隊(duì)走的確實(shí)比較快，但并不代表中國(guó)一無(wú)是處。

如果你研究近年來(lái)AI相關(guān)的論文，會(huì)發(fā)現(xiàn)大量的中國(guó)團(tuán)隊(duì)和華人散落其中。

如果把世界AI形容成十斗，美國(guó)占八斗，中國(guó)占一斗，世界其他國(guó)家分一斗。

實(shí)事求是的講，這樣的實(shí)力并不算差。中國(guó)在這次AI革命中，沒(méi)有落伍，不僅跟上了，還斷崖式領(lǐng)先第三名。

在ChatGPT推出不到一年的時(shí)候，中國(guó)的生成式AI迅速普及，除了百度的文心一言外，像Kimi、通義千問(wèn)、ChatGLM都取得了不錯(cuò)的效果，用戶反饋比較積極。

通義千問(wèn)和ChatGLM都將最新進(jìn)行了開(kāi)源，深受廣大AI愛(ài)好者的喜歡。

MiniCPM-Llama3-V 2.5 不是一個(gè)很知名的模型，被斯坦福的大學(xué)生拿去套殼。這件事有點(diǎn)無(wú)厘頭，但也證明了用開(kāi)源模型套殼這種行為實(shí)際上是行不通的，有無(wú)數(shù)種方式可以驗(yàn)證大模型是否自研。

當(dāng)然了，也沒(méi)必要把這件事扣到斯坦福大學(xué)頭上，這只是一個(gè)團(tuán)隊(duì)部分成員的學(xué)術(shù)不端行為，不用上綱上線。

結(jié)論是給中國(guó)的AI大模型開(kāi)發(fā)者們一個(gè)遲到的正名：他們沒(méi)有靠套殼開(kāi)源來(lái)實(shí)現(xiàn)自研。

斯坦福的團(tuán)隊(duì)抄襲中國(guó)團(tuán)隊(duì)的AI開(kāi)源大模型事件后不久，快手放出了文生視頻大模型：可靈。

從前期內(nèi)測(cè)用戶的體驗(yàn)來(lái)看，可靈幾乎和Sora是同一級(jí)別，某些細(xì)節(jié)還優(yōu)于Sora。

難能可貴的是，可靈已經(jīng)開(kāi)始大規(guī)模內(nèi)測(cè)，而發(fā)布了小半年的Sora依然還只是PPT狀態(tài)。

我一直說(shuō)，中國(guó)的AI的確比美國(guó)落后，但并沒(méi)有代差，且穩(wěn)居第二名，遙遙領(lǐng)先第三名。

當(dāng)可以落地的商業(yè)模式跑通的時(shí)候，中國(guó)的AI場(chǎng)景不會(huì)比美國(guó)少，甚至可能還更多一些。

因?yàn)橹袊?guó)的自媒體行業(yè)高度發(fā)達(dá)，使用AI工具創(chuàng)作圖文、視頻素材，已經(jīng)開(kāi)始普及。

有拿到內(nèi)測(cè)賬號(hào)的朋友，用之前Sora發(fā)布的提示詞交給可靈生成視頻，發(fā)現(xiàn)效果非常驚人。

從技術(shù)路線講，現(xiàn)在AI技術(shù)沒(méi)有太高深的技術(shù)壁壘。

OpenAI固然niubility，但他們的先發(fā)優(yōu)勢(shì)非常小。ChatGPT的3.5版本領(lǐng)先了接近一年，4.0頂多領(lǐng)先了半年，現(xiàn)在已經(jīng)被各開(kāi)源大模型追趕了上來(lái)。

像中國(guó)的Kimi、通義千問(wèn)、ChatGLM等大模型，近期的實(shí)測(cè)效果已經(jīng)不比ChatGPT4.0差。

一方面，大模型（哪怕閉源）的主體技術(shù)路線是公開(kāi)的，一些獨(dú)特的訓(xùn)練技巧，通過(guò)高強(qiáng)度大范圍的使用，也是可以推測(cè)出來(lái)的，在此基礎(chǔ)上進(jìn)行優(yōu)化，大模型就可以“奮起直追”；另一方面，大模型行業(yè)的人才流動(dòng)非常頻繁，也促進(jìn)了技術(shù)的傳播。

OpenAI共有770名員工，ChatGPT團(tuán)隊(duì)不足百人，博士、碩士、本科各占三分之一。

隨著追趕的加速，也許一個(gè)不留神，就有大模型實(shí)現(xiàn)對(duì)ChatGPT的“彎道超車(chē)”。

像傳統(tǒng)工業(yè)時(shí)代動(dòng)輒領(lǐng)先十?dāng)?shù)年、數(shù)十年的技術(shù)，在AI時(shí)代是不存在的。

由于字節(jié)、小紅書(shū)之前過(guò)于招搖，大家?guī)缀跬浟丝焓值拇嬖凇?/p>

這類(lèi)短視頻企業(yè)最大的優(yōu)勢(shì)就是有海量的音視頻素材，可以方便的進(jìn)行訓(xùn)練，而我堅(jiān)持認(rèn)為AI大模型本身沒(méi)有什么高深的科技，無(wú)非就是大力出奇跡。

事實(shí)證明也是如此。ChatGPT3.5一炮走紅的時(shí)候，人們發(fā)現(xiàn)原來(lái)居然可以搞一萬(wàn)張顯卡來(lái)訓(xùn)練，放在其他公司這只能是想想。但模式一旦跑通，各大佬紛紛下場(chǎng)搶購(gòu)顯卡。

比較搞笑的是，可靈迅速在推特火了起來(lái)，但快手相關(guān)的APP并沒(méi)有純英文版，很多老外在推特上咨詢?nèi)绾巫?cè)、申請(qǐng)內(nèi)測(cè)資格。

這也讓中國(guó)的AI技術(shù)反向輸出了一把。

星空君的申請(qǐng)只等待了一天就順利通過(guò)，請(qǐng)欣賞星空君用可靈制作的視頻：

提示詞：一艘巨大的火箭從山谷里緩緩起飛，漫山遍野的桃花。

提示詞：一個(gè)披肩發(fā)女孩站在閃耀的銀河下。

提示詞：宇航員走出太空船，面臨一個(gè)冰天雪地的星球。

提示詞：一直正在大海邊彈吉他的大熊貓。

6月7日凌晨0點(diǎn)，阿里云通義千問(wèn)深夜發(fā)布技術(shù)博文，推出全球性能最強(qiáng)的開(kāi)源模型Qwen2-72B，性能超過(guò)美國(guó)最強(qiáng)的開(kāi)源模型Llama3-70B。

兩小時(shí)后，全球最大開(kāi)源社區(qū)Hugging Face的聯(lián)合創(chuàng)始人兼首席執(zhí)行官克萊門(mén)特·德朗格宣布，Qwen2-72B沖上HuggingFace 開(kāi)源大模型榜單Open LLM Leaderboard第一名，全球排名最高。

相比2月推出的通義千問(wèn)Qwen1.5，Qwen2實(shí)現(xiàn)了整體性能的代際飛躍。通義千問(wèn)Qwen2系列模型大幅提升了代碼、數(shù)學(xué)、推理、指令遵循、多語(yǔ)言理解等能力。

通義千問(wèn)團(tuán)隊(duì)在技術(shù)博客中披露，Qwen2系列包含5個(gè)尺寸的預(yù)訓(xùn)練和指令微調(diào)模型，Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B，其中Qwen2-57B-A14B為混合專家模型（MoE）。

Qwen2所有尺寸模型都使用了GQA（分組查詢注意力）機(jī)制，以便讓用戶體驗(yàn)到GQA帶來(lái)的推理加速和顯存占用降低的優(yōu)勢(shì)。

阿里在AI方面布局非常廣闊，星空君甚至認(rèn)為在AI創(chuàng)新領(lǐng)域，阿里要比OpenAI更有錢(qián)景：阿里的AI研發(fā)是直接對(duì)接商業(yè)模式的，OpenAI的核心技術(shù)，在阿里這里幾乎都是開(kāi)源的！

就像導(dǎo)航軟件，未來(lái)極有可能出現(xiàn)OpenAI的核心技術(shù)想要拿來(lái)賣(mài)錢(qián)，卻發(fā)現(xiàn)阿里出的都是免費(fèi)的。

比如星空正在用EasyPhoto開(kāi)源組件（EasyPhoto團(tuán)隊(duì)也是阿里注資的）幫朋友訓(xùn)練的AI繪畫(huà)模型，代碼里用到的modelscope是阿里的魔搭社區(qū)，阿里的很多AI領(lǐng)域的工作，已經(jīng)成為開(kāi)源界的標(biāo)準(zhǔn)之一。魔搭社區(qū)也是國(guó)內(nèi)最活躍的AI開(kāi)源社區(qū)，大部分開(kāi)源模型都能在這里交流。