本報記者 李喬宇
4月10日,商湯科技SenseTime舉辦技術交流日活動,分享了以“大模型+大算力”推進AGI(通用人工智能)發展的戰略布局,并公布了商湯在該戰略下的“日日新SenseNova”大模型體系,推出自然語言處理、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力?;顒由?,商湯不僅展示了“日日新SenseNova”大模型體系下的語言大模型,還展示了AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用,并公布了商湯依托AI大裝置SenseCore實現“大模型+大算力”融合創新的研發體系。
商湯科技歷時五年,建設了業界領先的AI大裝置,大裝置上總共有27000塊的GPU芯片卡,可以輸出5.0exaFLOPS的總算力,是亞洲目前最大的智能計算平臺之一?;诖笱b置的能力,商湯科技目前已構建了計算機視覺、自然語言處理、AI內容生成、多模態、決策智能等多個領域的大模型,持續演進能力并廣泛支持各種應用。
商湯科技董事長兼CEO徐立表示:“在AI大模型時代,數據、算法和算力這三要素也在經歷新的演變,大模型參數量將以指數級的速率提升,而數據量隨著多模態的引入也將大規模增長,因此就必然會導致對算力需求的劇增。我們以AI大裝置SenseCore打造AGI時代的基礎設施,并基于此將大模型體系命名為‘日日新SenseNova’,寓意‘茍日新、日日新、又日新’,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。”
“AGI催生了新的研究范式,即基于一個強大的多模態基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。AGI將實現從‘數據飛輪’到‘智慧飛輪’的演進,最終邁向人機共智。”商湯科技聯合創始人、首席科學家王曉剛表示:“商湯已建立了全棧的大模型研發體系,并已在多個行業場景中落地,場景的多樣性,任務的復雜度,數據的豐富度均充分展示了我們大模型的能力和未來潛力。我們將持續推動基礎設施建設,期待和合作伙伴一起投入到AGI的時代大潮中。”
(編輯 李波)