教授創業再次獲得頂級VC支持。
投中嘉川CVSource顯示,上海模思智能科技有限公司(簡稱“模思智能”)完成首輪融資。投資方為IDG資本、華為哈勃、元禾控股和智譜系機構星連資本。
模思智能由復旦大學知名教授邱錫鵬和他的學生創辦。邱錫鵬是國內AI領域最知名的教授之一。他的專著《神經網絡與深度學習》是國內“人工智能入門必讀書”。2023年,他還帶領團隊發布了大模型MOSS,成為最早破圈的開源中文大語言模型。
模思智能主要從事語音大模型研發,近期發布了MOSS-Speech。按其官方說法,這標志著國產AI邁入了“真語音到語音交互”的新階段。
01.誰是邱錫鵬?復旦教授,人工智能的布道者
2024年11月,模思智能(Moss Intelligence)在上海成立。這家年輕的公司立志于推動多模態交互與具身智能的產業化落地,希望通過更“懂人”的AI交互系統,重塑語音與視覺的結合方式。
模思智能的核心技術方向,是通過對用戶提供的上下文與情境進行深度理解,構建自然、擬人的交互體驗。公司當前的主營業務聚焦在語音大模型應用領域,產品主要服務于游戲解說、直播電商、新聞播報等語音內容密集型場景。
能讓模思智能在天使輪階段就吸引IDG資本、華為哈勃、元禾控股等頂級機構投資的,離不開公司創始人復旦大學計算機學院教授邱錫鵬。
邱錫鵬1997年考入復旦大學,先后獲得理學學士和博士學位,并自2007年起留校任教。目前,他是復旦大學計算機學院教授、博士生導師,也是中國自然語言處理(NLP)領域的重要推動者。
有趣的是,邱錫鵬最初的本科專業并非計算機。在進入復旦大學之前,他幾乎沒有接觸過編程。正是在復旦的通識課程中,他第一次接觸到計算機科學,并因此深受吸引,最終轉入該領域。
根據復旦大學官網信息,邱錫鵬主要研究方向包括自然語言處理與深度學習。他在ACL、EMNLP、AAAI、IJCAI等國際頂級會議和期刊上發表論文50余篇,是國內外學界高度認可的學者。他主持開發的開源自然語言處理工具FudanNLP與FastNLP,至今仍被廣泛使用。
2015年邱錫鵬入選首屆“中國科協青年人才托舉工程”;2018年則榮獲中國中文信息學會“錢偉長中文信息處理科學技術獎——漢王青年創新獎”。
話說2015年時,復旦大學首次開設“神經網絡與深度學習”課程。由于當時沒有合適的教材,邱錫鵬便決定親自編寫講義。后來,這份講義被擴寫成專著《神經網絡與深度學習》,成為國內AI教育領域的經典讀物,被譽為“人工智能入門必讀書”。邱錫鵬也由此成為中國人工智能領域布道者式的人物。
不過真正讓邱錫鵬“出圈”的,是在2023年春節,他帶領團隊迅速推出了開源中文大語言模型MOSS。這款以科幻電影《流浪地球2》中量子超級計算機命名的模型,一經發布便登上微博熱搜。
當時,OpenAI發布ChatGPT不久,國內大模型尚處于空白。邱錫鵬團隊的成果是國內首個開放式中文對話大模型,不僅填補了中文語境下的技術空白,也推動了國內大模型的開源研究生態。
而這次創辦的模思智能,其中文名“模思”,正是“MOSS”的音譯。可見這家公司正是此前科研成果的轉化項目。
02.最新發布MOSS-Speech,讓機器人說話更自然
從工商信息看,邱錫鵬目前擔任模思智能首席科學家,同時也是最大股東,持股約29%。
圖片來源:投中嘉川CVSource
公司聯合創始人兼CEO李世民,則是邱錫鵬的學生,復旦大學計算與智能創新學院2022級的碩博連讀研究生。
這位與唐朝皇帝同名的年輕人,在學術界已嶄露頭角——據復旦大學官方公眾號今年6月報道,李世民作為第一作者在CCF-A類國際會議上發表了3篇論文,并深度參與科技部“新一代人工智能2030”重點研發項目,在擬人化人機交互領域取得重要突破。
在創業之前,他主導推出了SpeechGPT——國內首個離散化端到端語音交互模型。該模型打破了傳統語音系統“語音識別→對話模型→語音合成”的三級串聯架構,實現了“語音輸入→語音輸出”的直接交互方式,被視為“語音版GPT”的早期雛形。
2024年,李世民還帶領團隊開發跨學科協作平臺“學橋”。這款產品“學橋”整合了學校信息辦和圖書館提供的10萬余篇官方論文、數千名教師以及學生達人信息,打破學科交叉合作的信息壁壘。
在接受復旦大學公眾號采訪時,他說“將前沿技術真正轉化成具有社會價值的產品,是我們的目標。”可見,李世民是邱錫鵬的得意門生,不論是在科研還是產品上,延續了導師對學術的探索與面向應用的技術導向。
目前,模思智能正圍繞其核心技術打造對標谷歌Gemini Pro的多模態大模型與智能體內容創作平臺,涵蓋高表現力的音視頻理解與生成能力。最新進展顯示,在邱錫鵬和李世民的帶領下,模思智能近期發布了MOSS-Speech。
據官方介紹,這款模型標志著語音AI正式進入“語音到語音”的交互階段。它與傳統“語音識別—文本生成—語音合成”的級聯方案不同,MOSS-Speech實現了直接從語音理解到語音生成,無需文本中介。該模型可在生成回答的同時捕捉語調、情緒、笑聲等非文字信號,使機器“說話”更自然、更具人性。
2023年,在接受復旦大學專訪時,邱錫鵬說:“長遠來看,我們期待把MOSS作為一個通向通用人工智能的基座,讓它變成一個像科幻片角色的真實存在。我覺得通用人工智能由科幻步入現實,應該不會很遠,也許5到10年。”
從科研到創業,邱錫鵬和他的學生們,正以商業的力量,把“未來”一點點拉近現實。
參考資料:
1.CIPS大模型與生成,真-語音到語音交互:MOSS-Speech正式發布
2.復旦大學,研究成果將會開源!復旦MOSS團隊深度訪談來了
3.復旦大學,青年五四獎章!放棄“大廠”,他的選擇是……
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.