国产啪亚洲国产精品无码,无码办公室丝袜ol中文字幕,久久久久久国产精品免费免费,国产成人亚洲精品无码h在线

當前位置:首頁 > 股市 >

世界滾動:小羊駝:訓(xùn)練成本僅300美元的斯坦福開源模型,適合創(chuàng)業(yè)公司打造自己的AI模型2023-04-13 10:59:55 | 編輯:admin | 來源:阿爾法工場


導(dǎo)語:小羊駝的邏輯叫“知識蒸餾”,即通過將大型模型的知識轉(zhuǎn)移到小型模型中,從而快速達到想要的模型質(zhì)量,同時減少計算成本。

不久前,斯坦福公開了一個名為 Alpaca 的新模型。(俗稱“羊駝”)它使用了 GPT3.5 生成的 52k 個指令訓(xùn)練,訓(xùn)練費用只花了 500 美元,但是性能可以與 GPT-3.5 相媲美。

然而由于使用了 GPT3.5 的指令數(shù)據(jù),使用條款禁止開發(fā)與 OpenAI 競爭的模型,因此 AIpaca 禁止了商用。


【資料圖】

而近日,斯坦福學(xué)者與 CMU、UC 伯克利等人合作推出了一個全新的模型——Vicuna,它有 130 億個參數(shù),俗稱“小羊駝”。 初步評估小羊駝

其實 Vicuna 說白了就是一款新的“ChatGPT”,它和 Google Bard、ChatGPT 還有 New Bing 都一樣,都是聊天機器人(Chatbots)。

初步評估上,Vicuna-13B 達到了  ChatGPT 能力的 92%;幾乎要比 Google Bard 更強;同時遠遠甩開其他模型,如 LLaMA 和它的前輩——斯坦福的 Alpaca。

而訓(xùn)練 Vicuna-13B 的成本是僅僅 300 美元??赡苓€沒有屏幕前的你游戲顯卡的價格高。

Vicuna 在推出后面臨的一個問題是,自己的模型質(zhì)量究竟如何。顯然作為學(xué)術(shù)機構(gòu)沒辦法像大公司養(yǎng)著幾百上千的測試團隊進行大量測試,于是他們另辟蹊徑——既然人力太貴,那就用剛剛推出的 GPT-4 來評測嘛。

具體操作上,他們提出了一個評估框架。設(shè)計了九大主題下共計八十條測試問題,然后把由其他模型和自家 Vicuna 的回答交給 GPT-4 進行評估(“哪個虛擬助理的回答更好”)。

驚人的是在這八十個問題的評估上,Vicuna 已經(jīng)能微微贏下 Google 重注的 Bard,更是把自己的“祖父模型”LLaMA-13B、AIpaca-13B 殺得片甲不留。

盡管問題的勝出數(shù)量上比不過 ChatGPT,但以 10 分制的角度切入,Vicuna 也已經(jīng)實現(xiàn)了 ChatGPT 超過 90%的質(zhì)量。

不得不說,“羊駝”AIpaca用 GPT-3.5 生成的指令訓(xùn)練模型,而“小羊駝”Vicuna在此基礎(chǔ)上又用 GPT-4 評估模型,斯坦福他們是懂人工智能的。

進入Vicuna主頁,不必注冊登錄;直接輸入想要的內(nèi)容,然后等待Vicuna為你生成。全程一分鐘,行云流水絲毫不卡頓。

作為大語言模型,中英文自然是通吃。

“知識蒸餾”

ChatGPT 訓(xùn)練費用高企甚至一次訓(xùn)練就要接近上億美金,然而 Vicuna 只花了 300 美元。從效果上看就達到了 GPT3.5 質(zhì)量的 90%。這是怎么做到的?

其實Vicuna的邏輯在人工智能領(lǐng)域叫做“知識蒸餾”(knowledge distillation),即通過將大型模型的知識轉(zhuǎn)移到小型模型中,從而快速達到想要的模型質(zhì)量,同時減少計算成本。

通常,大型模型(即“Teacher”)會生成訓(xùn)練數(shù)據(jù),小型模型(即“Student”)則使用這些數(shù)據(jù)來學(xué)習(xí)大型模型的知識和能力。

通過這種方式,小型模型可以在自己的場景下獲得大型模型90%甚至99%的能力,這意味著,可用于生成模型的領(lǐng)域?qū)⒊手笖?shù)級增長。

在Vicuna公布的訓(xùn)練過程里,一開始,開發(fā)團隊是從 ShareGPT (與 ChatGPT 對話內(nèi)容的UGC網(wǎng)站)上收集了七萬條對話。這恰恰是“知識蒸餾”里最重要的“訓(xùn)練數(shù)據(jù)”。

而訓(xùn)練方法上則是選擇了在“羊駝”AIpaca(成本已降低至500美元)上優(yōu)化。

這兩個最重要的環(huán)節(jié)就使得Vicuna同時在訓(xùn)練成本和訓(xùn)練質(zhì)量上均有突出優(yōu)勢。

而理論上你也可以花300美元租云計算資源然后訓(xùn)練出你的“小羊駝”。 全華人團隊

一個小插曲是,作者在撰寫稿件搜集資料時,看到小羊駝的開發(fā)團隊不禁虎軀一震。

包括 Wei-Lin Chiang、Zhuohan Li、Zi Lin、Ying Sheng、Zhanghao Wu、Hao Zhang、Lianmin Zheng、Siyuan Zhuang 和 Yonghao Zhuang,這學(xué)生團隊是清一色的全員華人,不免讓人感慨。

總結(jié):遍地AI的世界就在眼前

從本質(zhì)上來說,ChatGPT這種大語言模型就是通過燒錢燒算力燒數(shù)據(jù)達到"大力出奇跡"的效果。

而這也帶來了一個問題,即這樣的大語言模型燒錢的程度會讓很多小公司望而卻步,只能加入霸權(quán)壟斷的圈子。

而對于像小紅書/B站這樣不上不下的公司,既承擔不起自己訓(xùn)練大模型的成本,也不愿意將自己內(nèi)容池的數(shù)據(jù)拱手讓人,其實是陷入蠻尷尬的境地。

Vicuna展現(xiàn)了另一種可能性,即通過“知識蒸餾”的方式,以極低的價格復(fù)刻大語言模型90%甚至99%的能力。

而這就意味著哪怕是剛剛創(chuàng)業(yè)的小公司也完全負擔得起一個獨屬于自己體系的AI的訓(xùn)練成本。

換句話說,ChatGPT拉開了AI落地的序幕,而Vicuna告訴我們,遍地AI的世界也許就在眼前。


關(guān)鍵詞

上一篇:百利科技:自2017年公司業(yè)務(wù)延伸至新能源領(lǐng)域,公司一直致力于新能源裝備和新型材料的工藝研發(fā)和儲備 最后一頁下一篇:

推薦內(nèi)容
精品国产综合区久久久久久 | 亚洲欧美激情精品一区二区| yyy6080韩国三级理论| 久久久久国色av免费观看| 精品乱人伦一区二区三区| 久久欧美牲大无无码毛片| 伊人成色综合人夜夜久久| 国产做a爰片毛片a片美国 | 久久国产精品久久喷水| 刺激的至亲乱45部| 被黑人猛躁10次高潮视频| 全免费A级毛片免费看网站| 亚洲AV色香蕉一区二区三区蜜桃| 精品爆乳一区二区三区无码av| 人妻丰满熟AV无码区HD| 国产精品第一区揄拍无码| 亚洲AV无码不卡| 中华姓氏起源一览图| 久久av高潮av无码av喷吹| 正在播放老肥熟妇露脸| 中文字幕无码无码专区| 欧美另类图片| 妺妺窝人体色www在线下载| 精品国产一区二区三区久久久狼| 久久亚洲熟女cc98cm| 国产高潮流白浆啊免费a片动态| 国产精品毛片一区二区三区| 欧美精品乱码99久久蜜桃| 337p粉嫩大胆色噜噜噜 | 亚洲av无一区二区三区久久\ | a片高潮抽搐揉捏奶头视频| 直接观看黄网站免费视频| 小舞屈辱打开双腿自慰出白浆| 亚洲国产精品成人天堂| 国产jizzjizz全部免费看| 久久久久久a亚洲欧洲av冫| jizzjizz少妇亚洲水多| 久久精品无码精品免费专区| 久久久久夜色精品国产明星| 色噜噜亚洲男人的天堂| 地铁上两个人一前一后攻击|