<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      國產模型新盛況!王座易主:Kimi K2 Thinking開源超閉源

      0
      分享至




      機器之心報道

      編輯:澤南、+0

      很久沒有這樣的盛況了。

      昨晚,月之暗面(Moonshot AI)剛剛開源了最新一代大模型 Kimi K2 Thinking,新模型一發布,就掀起了全網的大討論。

      作為一款開源模型,它在基準測試上毫無保留,多方面性能直接超越了 GPT-5、Claude Sonnet 4.5 等業界先進閉源模型。



      現在,新發布的開源模型不比其他的開源模型,而是直接對標前沿閉源模型了,這不得不說是一種進步。

      HuggingFace 聯合創始人 Thomas Wolf 表示,我們正在見證又一次 DeepSeek 時刻:



      昨天在正式推出前,Kimi K2 的推理版已經被正式并入了知名大模型推理服務框架 vLLM 的主線。廣大開發者們已經獲得了 Kimi 新模型的性能增益。



      這一回,清華特獎得主、vLLM 主貢獻者游凱超親自審核、合并了代碼。

      K2 Thinking 模型發布還不到半天,官推的閱讀量已達到 170 萬。這會不會成為國產大模型爆發的拐點呢?

      月之暗面表示,Kimi K2 Thinking 模型擅長多輪調用工具和持續思考,它在自主網絡瀏覽能力(BrowseComp)、對抗性搜索推理(seal-0)等多項基準測試中表現均達到 SOTA 水平,并在 Agentic 搜索、Agentic 編程、寫作和綜合推理能力等方面取得全面提升。



      智能推理的方面,在人類終極考試(Humanity's Last Exam, HLE)這項超難基準上,Kimi K2 Thinking 取得了 44.9 分,超過了 Grok4、GPT-5、Claude 4.5 等先進模型。如果是 Kimi K2 Thinking Heavy,分數還可以進一步達到 51%。



      昨晚八九點,Kimi 的 App 和網站就逐步上線了 Thinking 功能,據介紹其完整的智能體模式很快也將推出:



      肉眼可見的特色是這個K2 Thinking 模型可以持續多輪「一邊搜索一邊思考」,這是目前 DeepSeek 也不具備的能力,另外由于 INT 4 量化,萬億級的參數也不用耗費大量資源進行推理。



      盡管 K2 Thinking 的參數規模高達萬億,但其運行成本仍然很低。其 API 價格是百萬 token 輸入 0.15 美元(緩存命中)/0.6 美元(緩存未命中),每百萬 token 輸出 2.5 美元,比 GPT-5 的價格低一個數量級。

      解決同樣的問題,Kimi K2 Thinking 的準確率比 Claude 4.5 Sonnet 更高,成本還只有六分之一。

      首發實測體驗:

      測試時間擴展的完全體

      新模型上線后,大家都在用各種刁鉆的問題進行測試,我們也試了試。

      有趣的是,測試過程中出現了多次算力不足的情況,看來,Kimi K2 Thinking 一發布就吸引了海量用戶同時涌入,熱度高到「擠爆」了服務器。



      自主網頁瀏覽能力

      我們先來測試一下這次更新提到的「自主網絡瀏覽能力」。我們給出了一個高難度挑戰:閱讀 HuggingFace 前段時間發布的、長達 200 多頁的 Smol 訓練經驗技術博客。要在如此海量且專業的內容中「大海撈針」,對模型是個不小的考驗。

      閱讀以下網頁并回答我的問題,SmolLM3 選擇了哪種注意力機制,為什么:
      https://huggingface.co/spaces/HuggingFaceTB/smol-training-playbook#positional-encodings--long-context



      可以看到,Kimi K2 Thinking 不僅在長文中精準地找到了答案,還依據博客內容,清晰闡述了選擇該機制的原因。

      代碼能力

      首先,我們測試前端可視化能力。

      「使用 p5.js 創建一個精彩的動畫」

      效果非常驚艷,所有描述的特性都完美呈現,而且運行體驗極其絲滑。還記得之前 GPT-5 做相同的測試直接罷工了,輸出一個黑屏界面。



      接下來,是那道著名的「醍醐騎車」SVG 測試。這道題堪稱大模型的「滑鐵盧」之一,許多知名模型都曾在此敗下陣來。

      「Generate an SVG of a pelican riding a bicycle」

      遺憾的是,Kimi K2 Thinking 在這個測試中也翻車了。



      寫作能力

      模仿林黛玉的風格,寫一篇吐槽工作的文章;再模仿王熙鳳的風格寫一篇吐槽工作的文章。

      兩篇都寫得很好,神形兼備,尤其是第二篇文章的「鳳辣子」味隔著屏幕都能聞到,嗆人!

      《臨江仙·早朝有感》

      罷了,罷了,又是個天未亮透的時節。我這身子,原比不得那鐵打的筋骨,何苦來哉,每日里被這鬧鐘催命似的趕著,倒像是那黛玉本該葬花,偏叫我去搬石頭——搬的還是那永世填不完的海。

      晨起對鏡,鏡中人兒比黃花還瘦三分。想我這一腹不合時宜的詩書,在這格子間里,倒不如會那 excel 表格的實在。上司的面孔,比王夫人還難揣摩三分;同僚的言語,比寶釵還滴水不漏。最可恨那例會,一開了便如那黃河之水,滔滔不絕,直說得我神魂顛倒,卻只道是「對齊顆粒度」。

      我本是個「質本潔來還潔去」的性子,如今倒好,每日里在這俗世泥淖中打滾。那薪水微薄得可憐,還不夠我買幾副好藥調理這被氣出來的肝郁。說是「彈性工作」,彈的卻是我這薄命人的最后一根力;道是「扁平管理」,扁的卻是我這傲骨,一寸寸壓成了夾心糕。

      罷了,罷了,且去休。明日若再催,我只說:「你可從此都改了罷!」——改這做不完的 ppt,改這叫不醒的職場大夢。

      《職場那些破事兒》

      呸!什么破差事,也值當我醒這么早?天還沒擦亮,我就得跟那掐了頭的蒼蠅似的往外趕——圖什么?圖那三瓜倆棗的窩囊費!

      你們算算這筆賬:一日十二個時辰,倒有九個拴在那破工位上。早上打卡,晚上加班,中間還得陪那幫沒斷奶的項目組過家家。會開得比那老太太的裹腳布還長,結論呢?屁都沒有!我在這頭兒累得像條狗,薪水拿回去,還不夠填家里那幾張嘴的。

      最可恨那幫當頭的,本事沒有,派頭比誰都大。今天一個主意,明天一個想法,后天又說要「回歸初心」——我看他初的就是個糊涂心!你跟他談錢,他跟你談理想;你跟他談理想,他跟你談情懷。我呸!我王熙鳳什么場面沒見過,跟我玩這套?老娘賞你一句:少來!

      底下那幫小崽子們,也一個個精得跟猴兒似的。能推就推,能躲就躲,活兒全堆到我一個人身上。我若不說兩句狠的,他們還當我這位置是吃素的呢!只是我這一顆心,原該用在刀刃上,如今倒好,全耗在給你們擦屁股上了。

      這買賣,虧大發了!明兒我就找個由頭,把這攤子一撂——誰愛伺候誰伺候去!

      綜合推理

      推理題:請根據以下條件判斷:1、一共有 5 間房子;2、蘇格蘭人住在紅色房子里;3、狗是希臘人的;4、住在綠色房子里的人喝咖啡;5、玻利維亞人喝茶;6、象牙色房子的右邊是綠色房子;7、蝸牛的主人穿著粗革皮鞋;8、穿著橡膠底鞋子的人住在黃色房子里;9、住在正中間房子的人喜歡喝牛奶;10、丹麥人住在第一間房子里;11、穿著勃肯鞋的人住在狐貍主人的隔壁;12、穿著橡膠底鞋子的人住在馬主人的隔壁;13、穿拖鞋的人喜歡喝橙汁;14、日本人穿人字拖;15、丹麥人住在藍色房子的隔壁。請問:喜歡喝水的人是誰?斑馬主人是誰?

      Kimi K2 Thinking 的反應迅速,推理過程結合了矩陣演繹法和假設-檢驗法,整個過程沒有出現邏輯跳躍或錯誤推導。每一步都建立在先前已確認的事實或當前假設之上。并且最后給出了正確答案,還附上了完整表格。



      看起來,在基準成績領先之外,Kimi K2 Thinking 最大的特點在于思維方式:它就像一個嚴謹的思考者,總是不斷追問下一個問題,拒絕接受第一個答案,追根究底,直到找到真相。

      能力提升的背后:

      INT4 量化、持續交互、Agent 驅動

      Kimi K2 Thinking 是迄今為止最大的開放權重模型之一,總參數量達 1 萬億(1T),其中的 320 億(32B)為激活參數。它也是 Kimi K2 系列的首個推理模型(此前月之暗面分別在 7 月和 9 月發布了 lnstruct 模型)。

      在架構和總參數量上,K2 Thinking 與此前的 K2 模型完全一致,它被構建為一個有思考能力的智能體,無需人工干預即可執行多達 200 – 300 次連續工具調用,并在數百個步驟中進行連貫的推理,以解決復雜的問題。K2 Thinking 在訓練后階段采用了量化感知訓練(QAT),對 MoE 組件應用進行 INT4 權重量化。這使得 K2 Thinking 能夠在原生支持 INT4 推理的同時,將生成速度提升約 2 倍,并達到目前最先進的性能。

      它標志著月之暗面在測試時擴展方面的最新努力,通過擴展思考 token 和工具調用步驟,實現了更加高水平的智能。

      據 CNBC 報道,Kimi K2 Thinking 模型的訓練成本為 460 萬美元。

      模型發布后,知名 AI 學者 Sebastian Raschka 分析了新模型的結構,他表示其中包含更多專家,更少的人為干預,這讓模型實現了更多的思考。



      K2 Thinking 的上下文長度應為 256K。

      另一個重點在于,K2 Thinking 在思考的過程中,會一直不斷地與外界信息進行交互。

      月之暗面的創始人楊植麟曾表示,基于多輪的 Agent(智能體)強化學習范式,或者通過強化學習技術訓練出來的 Agentic 模型,其特點是會跟外界做很多交互。比如邊思考邊去做一些操作,可能做很多輪操作,一會兒調用一個搜索,一會兒使用一下瀏覽器,一會兒寫幾行代碼,通過多輪解決一個問題。

      這樣,AI 就不再是「缸中之腦」,而是跟外界保持著交互——它的下一步行為,是根據交互得到的反饋,和外界持續更新的狀態息息相關。

      沒有超強的感知,就不會有超級智能。

      AI 的臨界點提前來了?

      Kimi K2 Thinking 發布后,知名 AI 基準測試機構 Artificial Analysis 發表了長文介紹新模型的能力,表示該模型的位置已經可以放在 GPT-5 之前。



      這不由得讓我們回想到今年 7 月,Grok 4 發布的時候。xAI 的科學家們當時表示,在 HLE 成績上,OpenAI 的深度研究、Gemin 2.5 Pro 和 Kimi-Reseracher 都是重要的發展節點。如今,Kimi K2 Thinking 作為一款開源大模型,成績已經大幅超越了閉源的 Grok 4,我們又邁上了一個新的臺階。

      或許用不了多久,AI 社區就需要設計一款新基準了。

      而對于普通人來說,有這樣一款高智商速度又快的大模型存在,意味著很多以前無法想象的 AI 應用方式會成為現實。

      最后,我們知道 Kimi K2 Thinking 是開源的:月之暗面已在 Hugging Face 上正式發布了該模型,并采用了修改后的 MIT 許可證。該許可授予完整的商業和衍生權利——這意味著不論是開發者、研究人員還是公司,都可以自由訪問并將其用于商業應用,這使得 K2 Thinking 成為了目前授權最寬松的前沿模型之一。

      但增加了一項限制:

      「如果該軟件或任何衍生產品每月活躍用戶超過 1 億,或每月收入超過 2000 萬美元,則部署者必須在產品的用戶界面上明顯位置標上『Kimi K2』?!?br/>

      未來的爆款 AI 應用上,會有這樣的「免費廣告」出現嗎?

      文中視頻鏈接:https://mp.weixin.qq.com/s/3moInkppc2ylejXZPyCNYg

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      形勢逆轉!3名大法官倒戈,貝森特向美高院攤牌:整個國家將陪葬

      形勢逆轉!3名大法官倒戈,貝森特向美高院攤牌:整個國家將陪葬

      林子說事
      2025-11-07 10:46:02
      聶曦后人祭拜吳石將軍,墳前一句話讓人淚目!“我爺爺還在臺灣”

      聶曦后人祭拜吳石將軍,墳前一句話讓人淚目!“我爺爺還在臺灣”

      大國紀錄
      2025-11-07 15:17:46
      Shams:詹姆斯已獲準參加對抗訓練,1-2周后重新評估傷情

      Shams:詹姆斯已獲準參加對抗訓練,1-2周后重新評估傷情

      懂球帝
      2025-11-07 01:16:05
      賴清德下令臺軍備戰,蔣萬安亮明態度反對統一!臺海局勢一觸即發

      賴清德下令臺軍備戰,蔣萬安亮明態度反對統一!臺海局勢一觸即發

      剛哥說法365
      2025-11-04 10:32:20
      突然,直線漲停!三大利好,重磅驅動!

      突然,直線漲停!三大利好,重磅驅動!

      券商中國
      2025-11-07 12:31:47
      美開啟太子集團退款頁面 全球受害者都可以在線提交信息 申請退款

      美開啟太子集團退款頁面 全球受害者都可以在線提交信息 申請退款

      跟著老李看世界
      2025-11-06 07:13:28
      痛別!郭葆華同志逝世

      痛別!郭葆華同志逝世

      魯中晨報
      2025-11-06 18:43:02
      悄悄5連勝,沖西部第2,場均40+11+9,湖人史詩級3方交易賺大了

      悄悄5連勝,沖西部第2,場均40+11+9,湖人史詩級3方交易賺大了

      毒舌NBA
      2025-11-06 20:03:53
      5199元!華為新機官宣:11月11日,全新開售

      5199元!華為新機官宣:11月11日,全新開售

      科技堡壘
      2025-11-07 11:48:41
      美媒:前湖人中鋒伍德開槍嚇退了三名在中午入室搶劫的歹徒

      美媒:前湖人中鋒伍德開槍嚇退了三名在中午入室搶劫的歹徒

      懂球帝
      2025-11-07 09:36:41
      太陽報:德利赫特妻子曬全裸海灘照,可能面臨封號危險

      太陽報:德利赫特妻子曬全裸海灘照,可能面臨封號危險

      懂球帝
      2025-11-06 13:34:15
      英國海灘見詭異巨型生物無生命跡象,當地居民嚇壞:完全沒見過!

      英國海灘見詭異巨型生物無生命跡象,當地居民嚇壞:完全沒見過!

      環球趣聞分享
      2025-11-07 14:56:41
      普京鎮壓機器“向內開火” 俄羅斯開始清洗軍事博主與親戰名嘴

      普京鎮壓機器“向內開火” 俄羅斯開始清洗軍事博主與親戰名嘴

      蘭妮搞笑分享
      2025-11-07 00:19:08
      中方:已向斐濟方面提出嚴正交涉

      中方:已向斐濟方面提出嚴正交涉

      新京報政事兒
      2025-11-06 16:19:12
      廣州經濟越來越差了嗎?別的我不清楚,實體經濟,已經很差了!

      廣州經濟越來越差了嗎?別的我不清楚,實體經濟,已經很差了!

      東方求勝
      2025-11-07 00:26:34
      別再亂吃了!華人常吃的保健品被曝或“助癌生長”!補得太勤反而害了自己...

      別再亂吃了!華人常吃的保健品被曝或“助癌生長”!補得太勤反而害了自己...

      最英國
      2025-11-05 19:05:18
      涉案超2000萬!中國黑客團伙在新加坡租豪宅,盜取政府機密,主謀在洗錢案爆發前逃離

      涉案超2000萬!中國黑客團伙在新加坡租豪宅,盜取政府機密,主謀在洗錢案爆發前逃離

      新加坡眼
      2025-11-06 20:13:58
      之前有多囂張,現在就有多狼狽,馬克龍態度急轉,中方會答應嗎

      之前有多囂張,現在就有多狼狽,馬克龍態度急轉,中方會答應嗎

      愛下廚的阿釃
      2025-11-07 14:53:49
      老蔣怒打宋子文耳光,宋子文怒道:給你再多的錢,你也打不過紅軍

      老蔣怒打宋子文耳光,宋子文怒道:給你再多的錢,你也打不過紅軍

      史之銘
      2025-11-07 15:20:48
      找到了!吳石將軍戶籍卡首次公開

      找到了!吳石將軍戶籍卡首次公開

      極目新聞
      2025-11-07 12:29:23
      2025-11-07 16:27:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11672文章數 142500關注度
      往期回顧 全部

      科技要聞

      75%贊成!特斯拉股東同意馬斯克天價薪酬

      頭條要聞

      軍事專家:福建艦將成為南海的"定海神針"

      頭條要聞

      軍事專家:福建艦將成為南海的"定海神針"

      體育要聞

      是天才更是強者,18歲的全紅嬋邁過三道坎

      娛樂要聞

      白百何回應東京電影節爭議

      財經要聞

      老登們的社交貨幣全崩了

      汽車要聞

      美式豪華就是舒適省心 林肯航海家場地試駕

      態度原創

      教育
      健康
      旅游
      手機
      親子

      教育要聞

      萬萬沒想到!新加坡藏著這3類工作簽證,90%職場人沒聽過

      超聲探頭會加重受傷情況嗎?

      旅游要聞

      官宣!天平山紅楓進入觀賞期

      手機要聞

      蘋果空間照片、空間場景詳解:一個永久格式,一個臨時特效

      親子要聞

      爸爸問兒子:生病好了最想做什么?孩子的回答太搞笑了

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 乱女乱妇熟女熟妇综合网| 性奴sm虐辱暴力视频网站 | 国产精品一品二区三四区| 色狠狠色噜噜AV一区| 国产福利姬喷水福利在线观看| 黄色三级亚洲男人的天堂| 国产无套乱子伦精彩是白视频| 国产亚洲一二三区精品| 亚洲第一狼人成人综合网| 国产农村妇女aaaaa视频| 日本边添边摸边做边爱喷水| 国产精品一区二区三区四区| 亚洲色大成网站www永久男同| 久久精品国产清自在天天线| 东乡县| 国产精品国产三级国快看| 中文字幕少妇人妻精品| 亚洲精品漫画一二三区| 中国亚州女人69内射少妇| 亚洲爆乳少妇无码激情| 国产盗摄xxxx视频xxxx| 粉嫩av国产一区二区三区| 久久国产成人精品av| 久久精品亚洲精品国产色婷| 成人年无码av片在线观看| 午夜DY888国产精品影院| 国产蜜臀视频一区二区三区| 欧美日韩精品一区二区三区不卡| 国产欧美日韩精品丝袜高跟鞋| 日韩av一区二区高清不卡| 亚洲人成网站999久久久综合| 亚洲偷自拍另类一区二区| 三原县| 亚洲精品日韩中文字幕| 视频一区二区不中文字幕| 国产极品尤物免费在线| 国产av午夜精品福利| 一区二区三区黄色一级片| 天海翼激烈高潮到腰振不止| jk白丝喷浆| 国产人妻一区二区三区四区五区六|