(資料圖)
《科創板日報》7月8日訊在WAIC2023期間,阿里云推出了國內首款大模型調用工具魔搭GPT(ModelScopeGPT),它能接收用戶指令,通過“中樞模型”一鍵調用魔搭社區其他的AI模型,大小模型協同完成復雜任務。目前,魔搭GPT已能夠調用魔搭社區十多個核心AI模型的API。
“目前,大語言模型在文本創作、內容生成等方面,都有驚艷表現。但作為一個大模型,如果本身只有文本生成能力的話,其實并不足夠的。我們提出了魔搭GPT,主要理念是以大模型為中樞,調動各種各樣的小模型API,來彌補大模型在圖片生成、語言視頻、視頻生成等能力上的不足。” 阿里巴巴達摩院高級算法工程師李晨亮對《科創板日報》記者表示。
當前,如何把通用大模型做小做精,讓行業更快用起來,是一大探索方向。在這方面,李晨亮向《科創板日報》記者介紹,“為了讓各行各業的這種開發者能夠把大模型用在真實的業務場景上,我們對大模型做了很多的一些優化,包括利用蒸餾壓縮的方法,來提供更多的小模型;通過模型量化,來壓縮得到小模型等。后續也會開放更多和大模型周邊相關的工具,來幫助模型的落地應用。”
構建和訓練一個大模型需要大量的計算資源和數據,這對于個人研究者或者小團隊來說非常具有挑戰性。在這樣的背景下,開源開放的生態系統成為了推進大模型技術發展的重要力量。
目前,阿里云魔搭社區是國內最大的AI模型社區,集聚了180多萬AI開發者和900多個AI模型。模型貢獻者包括百川智能、嗶哩嗶哩、IDEA研究院、蘭丁股份、瀾舟科技、openBMB社區、啟智社區、清華TSAIL、RWKV、深勢科技、WeNet社區、元語智能、浙江大學、智譜AI等,貢獻了30多個10億以上參數規模大模型。
“開源生態肯定是有助于大模型的繁榮。”李晨亮強調,“2018年谷歌提出了BERT大模型,并開源了模型的代碼,這帶來了整個預訓練大模型領域的繁榮。如果沒有BERT的開源,那可能就沒有如今大模型的繁榮現狀,整個業界發展得會比較慢。”
以數據層面為例,大模型非常依賴于數據的質量。“”現在不管是大廠還是創業公司,自身都有大量的數據積累。如果大家能夠把一些數據貢獻出來,構建高質量、更大規模的開源數據集,那么不管是從自身模型的迭代,還是國內大模型發展速度,都能帶來很大的提升。” 李晨亮呼吁。
標簽: