
商湯科技日前推出了升級版的「日日新SenseNova 5.0」大模型,這也讓人工智慧成為了各大科技巨頭競相爭取的焦點。商湯董事行政總裁徐立表示,「日日新SenseNova 5.0」的能力已經達到甚至超越了GPT-4 Turbo。據報導,商湯的股價在今天早上暴漲逾3成,但隨後因需要刊發可能構成內幕消息的公告而在11:15暫停買賣。
據《信報》報導,商湯的「日日新SenseNova」大模型已經推出了第五個大版本。徐立表示,「日日新5.0」經過逾10TB Tokens的訓練,使用了大量的合成數據,並採用了混合專家架構,推理時上下文窗口可以有效達到200K。「日日新5.0」主要增強了知識、數學、推理和代碼能力。
在發布會上,徐立展示了部分「日日新5.0」的功能,並與Open AI GPT-4的結果進行了對比。徐立表示,「日日新5.0」的綜合能力已經超越了GPT-4,並展示了在高考作文題目上的表現,表示「日日新5.0」可以融入更多中國文化元素,寫作風格比GPT-4更加自由。根據《on.cc》的報導,商湯表示由於「日日新SenseNova 5.0」大模型非常成功,因此按照港交所建議刊發可能構成內幕消息的公告並暫停買賣。 想知得更多詳情?立即Click這裡
本文章由Open AI人工智能編寫,僅屬學術用途。
可參考相關同類新聞

相關報道
擺脫對NVIDIA依賴 ChatGPT開發商OpenAI攜手博通開發AI晶片
底層邏輯:AI會取代「整份」工作嗎?不,它只會取代某些「任務」 – 未來城市@天下
通說:「港版ChatGPT」如何驗證香港人工智慧實力 – hkcna.hk