<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek開源的新東西到底強在哪?我幫你找專家問了問

      0
      分享至



      本周,DeepSeek 新開源的 DeepSeek-OCR 在開源社區的熱度持續發酵。

      人們興奮的點是:它不僅是一款新的光學字符識別模型,還更像是一次對 “ 大模型記憶機制 ” 的重新設計。

      在 DeepSeek-OCR 的架構中,圖像不再只是文字的載體,而是成為一種語義壓縮的中間語言。文字被渲染成圖像后,經由 DeepEncoder 轉換為緊湊的視覺表征;這些視覺 token 既可以通過 DeepSeek 3B-MoE 模型還原為原始文本(這也是標準的 OCR 機制),也可以與其他輸入 token 與 prompt 結合,執行問答、摘要、檢索等復雜任務。

      通俗來說,就是我們可以把大量文字打包壓縮成一張圖片來節省空間,等需要使用的時候再解壓出來,甚至在一部分使用場景中,你甚至不需要解壓,直接用壓縮包就可以達成目的。



      DeepSeek-OCR 模型架構。圖源:
      https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf

      即便在 10× 壓縮比的條件下,模型的文本還原精度仍可達 97%。隨著大模型逐漸向越來越復雜的場景嵌入,上下文長度資源遠不夠用甚至越來越不夠用,而基座模型在此參數上升級頗為緩慢的當下,DeepSeek-OCR 的發布瞬間帶來很大的想象空間。

      研究團隊甚至還進一步提出 “ 遺忘機制 ” 的構想,模型可依據信息的 “ 時序遠近 ”,在視覺壓縮階段主動衰減細節,從而實現一種類人記憶式的上下文管理。

      那么,視覺 token 為何能在信息量不損失太多的情況下,比文本 token 少一個數量級?模型記憶能否完全用視覺邏輯來替代?DeepSeek-OCR 是否為解決大模型上下文長度受限的問題提供了一條現實可行的途徑?DeepSeek-OCR 反映了多模態大模型的什么發展趨勢?

      帶著這些問題,知危與 Sand.ai 聯合創始人、首席科學家、《 Swin Transformer 》作者張拯進行了簡單的對話。

      知危:

      同一段輸入,為什么視覺 token 可以比文本 token 的數量少得多,有沒有直觀或本質的解釋?

      張拯:

      有兩種觀點。第一種,視覺是一個 2D 表達,因此可以比 1D 的表達更高效。

      第二種,高效的原因不是視覺 v.s. 文本,而是兩邊采用的 token 表達方式不同:做視覺表達的時候,我們是在一個高維的連續空間中做信息壓縮( 把 image patch 映射為一個高維特征 ),之前 LLM 里常用的 tokenizer( 把文本數據向量化的工具,通俗理解是一種把自然語言翻譯為機器能理解的語言的工具 )則實際上可以被認為是在一個一維空間中做壓縮( 把文本映射為 id )。高維連續空間本來就有更好的表達能力,因此可以用更少的 token 數量來表達更多信息。其實文本也可以做成連續表達,來大幅度減少文本 token,但是目前應該沒有被很廣泛地用到 LLM 里。

      這兩種觀點,我 buy-in 第二種。

      知危:

      DeepSeek-OCR 相比過往的 OCR 模型,除了效率提升方面,還有哪些獨創性?

      張拯:

      我最近沒有特別研究過 OCR 模型的進展,但基于我看過的一些信息,我覺得 DeepSeek-OCR 的技術本身好像并沒有非常特別的部分。但是在觀點上,“ 把視覺作為文本長上下文的壓縮介質 ”,這個 idea 還是很棒的。這個 idea 有路線上的啟發意義,相較于現在的多模態模型,DeepSeek-OCR 會使用兩種不同的 tokenizer 機制,這種路線也許會啟發更好的多模態模型設計方案。

      知危:

      這項技術對于基礎模型上下文長度難以擴展的當下,可以帶來多大的成本效益?對上下文工程的優化有哪些好處?

      張拯:

      理論上最多能拿到 N^2 倍的收益,N 是 Vision Token 相較于 Text Token 的壓縮率。對于上下文工程的優化,最大的好處應該就是不用那么仔細地管理上下文長度了。

      知危:

      DeepSeek 設想的遺忘機制是否過于簡化?忽略了語義的重要性排序?

      張拯:

      這種設想肯定還是很初步的,但是也能腦洞出很多改進的空間,比如語義重要的部分可以渲染成更大的字體?

      知危:

      Andrej Karpathy 認為視覺 token 有潛力可以完全替代文本 token,因為信息壓縮、多模態、可雙向注意力處理、無需 tokenizer 等優勢,您怎么看?

      張拯:

      大部分都同意,但是 “ 可雙向注意力處理 ” 這里有待探討,“ 可雙向注意力處理 ” 很大程度上和 training objective( 訓練目標 )有關。

      另外,如果后面都是處理視覺 token 了,是不是有機會讓模型能在一個 2D 的空間里做思考?從而帶來更高效的推理( 類似 GPT-4o 的 thinking with image )?這個我覺得還是挺有意思的。

      知危:近期 Meta 也提出了一個無需 tokenizer 的模型架構 Byte Latent Transformer ,可以跳過 tokenization ,直接學習原始字節流。結合以上討論和領域現狀,您認為這體現了多模態大模型的哪些發展趨勢?

      張拯:

      宏觀一點來看,不同模態模型的范式還是有機會持續進化的。

      更細節一點的話,我初步想到的有兩個:

      • 現在的多模態大模型的主流做法基本上可以認為在捏合各種不同的模態的模塊,整個訓練 pipeline 其實還是有點復雜( 不優雅 )的。大家肯定希望有更簡單、更統一的方式來處理。類似 DeepSeek-OCR 這樣的工作對我們開發更好的多模態模型范式還是挺有啟發的。
      • 離散表達和連續表達之間的關系,以及是否有更好的組合方式,可能也挺重要的。

      ( 對話全文完 )

      總體來看,DeepSeek-OCR 更多是基于效率上的大幅提升啟發了一個新的路線。

      當模型的 “ 思考空間 ” 從一維文本拓展至二維視覺,思考和推理也可能變得更加高效和簡潔。而在技術層面,則指向當前多模態大模型領域正等待一把 “ 奧卡姆剃刀 ” 簡化模型范式的時刻。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      金靖身材好絕啊,纖腰細腿比例絕佳,以前確實太低調了

      金靖身材好絕啊,纖腰細腿比例絕佳,以前確實太低調了

      阿廢冷眼觀察所
      2025-11-05 09:32:41
      baby葉珂雙雙哭暈!黃曉明跟女制片人貼臉擁抱,坐大腿親密照來了

      baby葉珂雙雙哭暈!黃曉明跟女制片人貼臉擁抱,坐大腿親密照來了

      八星人
      2025-11-05 15:32:27
      這位護理師的身材讓人無法抵擋,竟是超辣的桃里れあ!

      這位護理師的身材讓人無法抵擋,竟是超辣的桃里れあ!

      大為看點丶
      2025-11-05 17:20:08
      汽車協會發出警告:電動車充電價格太離譜,呼吁降低公共充電費用

      汽車協會發出警告:電動車充電價格太離譜,呼吁降低公共充電費用

      新浪財經
      2025-11-04 22:51:28
      作業幫APP驚現“學生跳樓”物理題,網友怒稱“最惡毒的題”,客服回應

      作業幫APP驚現“學生跳樓”物理題,網友怒稱“最惡毒的題”,客服回應

      佛山電視臺小強熱線
      2025-11-05 21:20:02
      4年1.1億!從雷霆廢太子到芝加哥登基,這筆1換1交易收獲4大贏家

      4年1.1億!從雷霆廢太子到芝加哥登基,這筆1換1交易收獲4大贏家

      毒舌NBA
      2025-11-05 12:48:51
      中國,十大“最毒”零食排行榜!常吃等于“慢性自殺”,勸你忌嘴

      中國,十大“最毒”零食排行榜!常吃等于“慢性自殺”,勸你忌嘴

      簡食記工作號
      2025-10-10 00:22:08
      41歲白百何罕見露面,她的下胯變得好大呀,臉也胖了,像個大媽

      41歲白百何罕見露面,她的下胯變得好大呀,臉也胖了,像個大媽

      廣西阿妹香香
      2025-10-29 16:09:46
      《雪中悍刀行2》騰訊預熱,張若昀大男主,原班人馬回歸意義不大

      《雪中悍刀行2》騰訊預熱,張若昀大男主,原班人馬回歸意義不大

      妙知
      2025-11-04 10:34:03
      你談過最拉胯的男朋友是啥樣?網友:對女人來說,錢才是最重要的

      你談過最拉胯的男朋友是啥樣?網友:對女人來說,錢才是最重要的

      帶你感受人間冷暖
      2025-11-04 00:05:11
      蔣經國至死不知,他一手提拔的接班人,竟是他蔣家最后的掘墓人!

      蔣經國至死不知,他一手提拔的接班人,竟是他蔣家最后的掘墓人!

      博覽歷史
      2025-11-04 20:12:28
      爭議?皇馬1.8億巨星剪刀腳飛鏟逃紅牌!門神怒斥對手:演技夸張

      爭議?皇馬1.8億巨星剪刀腳飛鏟逃紅牌!門神怒斥對手:演技夸張

      我愛英超
      2025-11-05 08:21:20
      左小青很難再結婚了,不是因為她年紀大,也不是因為她還愛高權健

      左小青很難再結婚了,不是因為她年紀大,也不是因為她還愛高權健

      百態人間
      2025-11-03 16:13:35
      女性白天和情人發生關系,晚上和老公同房有怎樣的感受呢?

      女性白天和情人發生關系,晚上和老公同房有怎樣的感受呢?

      思絮
      2025-10-24 10:42:12
      全網聚焦!原配妻子強勢反攻,這波操作簡直“殺人誅心”

      全網聚焦!原配妻子強勢反攻,這波操作簡直“殺人誅心”

      一杯咖啡語
      2025-11-04 15:08:15
      他倆官宣結婚,朋友圈都炸了!!!

      他倆官宣結婚,朋友圈都炸了!!!

      美芽
      2025-11-05 19:01:55
      醪糟立大功!醫生:常吃醪糟的人,堅持半年,腸道或迎來8個變化

      醪糟立大功!醫生:常吃醪糟的人,堅持半年,腸道或迎來8個變化

      朗威游戲說
      2025-11-05 09:58:15
      24歲時迪巴拉身價高達1.1億!但如今僅剩800萬,原因真的太扎心!

      24歲時迪巴拉身價高達1.1億!但如今僅剩800萬,原因真的太扎心!

      田先生籃球
      2025-11-04 12:16:13
      吳亦凡監獄近況曝光:身染重病、夜夜痛哭!網友:這下徹底完了!

      吳亦凡監獄近況曝光:身染重病、夜夜痛哭!網友:這下徹底完了!

      可樂談情感
      2025-11-02 03:45:56
      爸爸去哪兒6個孩子現狀:有人進國家隊,有人出家,有人出國斷聯

      爸爸去哪兒6個孩子現狀:有人進國家隊,有人出家,有人出國斷聯

      觀察鑒娛
      2025-11-04 09:35:35
      2025-11-05 22:04:49
      知危 incentive-icons
      知危
      投資不立危墻之下
      493文章數 1824關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      楊受成名下英皇宮殿停運 曾以大堂鋪滿78公斤黃金聞名

      頭條要聞

      楊受成名下英皇宮殿停運 曾以大堂鋪滿78公斤黃金聞名

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      房產
      游戲
      家居
      親子
      時尚

      房產要聞

      最新!海南樓市10月熱銷榜單出爐!

      27歲小花生發文感謝中國粉絲 將服兵役告別職業賽場

      家居要聞

      別樣府院 暢享詩意生活

      親子要聞

      為“三低”心肌病患兒植入人工雙心

      50+女人快跳出“扮嫩”誤區,學會4個技巧,就能穿出高級

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 布尔津县| 九九热精彩视频在线免费| 色又黄又爽18禁免费网站现观看| 扬州市| 亚洲婷婷综合色香五月| 2019亚洲午夜无码天堂| 最新国产精品好看的精品| 亚洲AV天天做在线观看| 一区二区三区不卡国产| 国产精品三级中文字幕| 99久久婷婷国产综合精品青草漫画| 铜鼓县| 久爱无码精品免费视频在线观看 | 亚洲国产精品一二三四区| 色综合天天综合网天天看片| 东方av四虎在线观看| 美女黄网站人色视频免费国产| 干中文字幕| 国产中文字幕精品免费| 日本大片在线看黄a∨免费| 在线免费观看视频1区| 亚洲人成网站77777在线观看| 亚洲精品在线视频自拍| 中文字幕精品久久久久人妻红杏1| 欧美色欧美亚洲高清在线视频| 91九色国产成人久久精品| 久久国产成人午夜av影院| 国产高清在线精品一区二区三区| 深夜宅男福利免费在线观看| 亚洲欧洲色图片网站| 亚洲国产一区二区三区亚瑟| 国产精品亚洲二区在线看| 久久香蕉国产线熟妇人妻| 无码人妻出轨黑人中文字幕| 国产不卡一区二区在线| 国产jjizz女人多水喷水| 中文字幕第一页亚洲精品| 中文字幕无码免费久久99| 盐边县| 国产成人一区二区三区在线| 好男人视频www在线观看|