<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      DeepSeek王炸:10倍壓縮率,97%解碼精度!上下文光學(xué)壓縮登場(chǎng)

      0
      分享至


      來(lái)自DeepSeek的最新研究:DeepSeek-OCR,一種探索通過(guò)光學(xué)2D映射來(lái)壓縮長(zhǎng)上下文的新方法

      LLM處理長(zhǎng)文本的計(jì)算成本,又有了新的破解思路。把長(zhǎng)長(zhǎng)的上下文,直接渲染成一張圖片,再喂給模型,這樣做的好處是,原本數(shù)千上萬(wàn)個(gè)文本token,現(xiàn)在可能只需要幾百個(gè)視覺(jué)token就能表示,實(shí)現(xiàn)了信息的高效壓縮

      實(shí)驗(yàn)結(jié)果相當(dāng)驚人:

      在壓縮率小于10倍時(shí)(即文本token數(shù)是視覺(jué)token數(shù)的10倍以內(nèi)),模型OCR解碼準(zhǔn)確率高達(dá)97%

      即使在20倍的超高壓縮率下,準(zhǔn)確率依然能保持在60% 左右

      在主流的文檔解析基準(zhǔn)測(cè)試 OmniDocBench 上,DeepSeek-OCR 用更少的視覺(jué)token,實(shí)現(xiàn)了超越SOTA模型的性能

      更重要的是,這項(xiàng)技術(shù)不僅是科研探索,還具備極高的實(shí)用價(jià)值。在生產(chǎn)環(huán)境中,單臺(tái)A100-40G GPU每天就能處理超過(guò)20萬(wàn)頁(yè)的文檔,為大模型訓(xùn)練提供海量數(shù)據(jù)

      目前,相關(guān)的代碼和模型權(quán)重均已開(kāi)源

      https://github.com/deepseek-ai/DeepSeek-OCR/

      https://huggingface.co/deepseek-ai/DeepSeek-OCR

      什么是“上下文光學(xué)壓縮”?

      LLM在處理長(zhǎng)文本時(shí),面臨的核心挑戰(zhàn)是其固有的二次方計(jì)算復(fù)雜度。隨著序列長(zhǎng)度的增加,計(jì)算資源和時(shí)間會(huì)急劇增長(zhǎng)。

      DeepSeek研究人員提出了一個(gè)反直覺(jué)卻又合乎邏輯的想法:利用視覺(jué)模態(tài)作為文本信息的壓縮媒介

      相比于一長(zhǎng)串的數(shù)字文本token,一張包含同樣內(nèi)容的文檔圖像,可以用遠(yuǎn)少于前者的視覺(jué)token來(lái)表示。這就好比將一本書(shū)的內(nèi)容拍成一張照片,這張照片本身就包含了所有的文字和排版信息

      這種“文本→圖像→視覺(jué)token”的轉(zhuǎn)換過(guò)程,就是所謂的上下文光學(xué)壓縮(Contexts Optical Compression)

      為了驗(yàn)證這一想法,團(tuán)隊(duì)構(gòu)建了DeepSeek-OCR模型。從圖(a)的壓縮實(shí)驗(yàn)中可以看出,視覺(jué)token數(shù)量和OCR解碼精度之間的權(quán)衡關(guān)系:


      64個(gè)視覺(jué)token(左側(cè)柱狀圖):當(dāng)文本token數(shù)在600-700之間(壓縮率約10.5倍)時(shí),精度為96.5%。隨著文本量增加到1200-1300(壓縮率接近20倍),精度下降到59.1%

      100個(gè)視覺(jué)token(右側(cè)柱狀圖):在600-700文本token(壓縮率6.7倍)時(shí),精度高達(dá)98.5%。即使文本量增加,壓縮率達(dá)到12.6倍時(shí),精度仍有87.1%

      這意味著,在10倍壓縮的范圍內(nèi),模型幾乎可以“無(wú)損”地從圖像中解碼出原文

      DeepSeek-OCR是如何實(shí)現(xiàn)的?

      DeepSeek-OCR的架構(gòu)由兩部分組成:一個(gè)核心的編碼器DeepEncoder,和一個(gè)解碼器DeepSeek3B-MoE-A570M


      解碼器采用了高效的MoE(Mixture-of-Experts)架構(gòu),而整個(gè)系統(tǒng)的創(chuàng)新關(guān)鍵在于DeepEncoder

      為了在處理高分辨率圖像時(shí),依然能保持較低的計(jì)算激活和可控的視覺(jué)token數(shù)量,DeepEncoder的架構(gòu)設(shè)計(jì)非常巧妙,它串聯(lián)了三個(gè)關(guān)鍵組件:

      1.SAM-base (ViTDet):利用窗口注意力(window attention)機(jī)制處理局部感知,將輸入圖像(如1024x1024)分割成大量patch(如4096個(gè))。由于是窗口注意力且模型規(guī)模不大(80M),激活值是可控的

      2.16倍卷積壓縮器:在特征進(jìn)入全局注意力模塊前,通過(guò)一個(gè)2層卷積網(wǎng)絡(luò)進(jìn)行16倍的下采樣,將視覺(jué)token數(shù)量從4096個(gè)銳減到256個(gè)

      3.CLIP-large (ViT):利用密集的全局注意力(dense global attention)機(jī)制提取視覺(jué)知識(shí)。由于輸入的token數(shù)量已經(jīng)大幅減少,這里的計(jì)算開(kāi)銷(xiāo)也變得可以接受

      這種“先局部處理,再壓縮,后全局理解”的串行設(shè)計(jì),使得DeepEncoder能夠在處理高清圖像的同時(shí),生成數(shù)量極少的視覺(jué)token,實(shí)現(xiàn)了內(nèi)存和token的雙重壓縮

      效果炸裂,token用得還少

      在權(quán)威的文檔理解基準(zhǔn) OmniDocBench 上,DeepSeek-OCR展現(xiàn)了其卓越的實(shí)用性能。


      從上圖的性能對(duì)比中可以看出,DeepSeek-OCR(紅色圓點(diǎn))在“平均每張圖的視覺(jué)token數(shù)”(橫軸)上處于最左側(cè)區(qū)域,意味著它使用的token數(shù)量最少。而在“整體性能(編輯距離)”(縱軸,越低越好)上,它卻達(dá)到了SOTA水平

      具體來(lái)看:

      僅用100個(gè)視覺(jué)token(Small模式),就超越了使用256個(gè)token的 GOT-OCR2.0

      使用不到800個(gè)視覺(jué)token(Gundam模式),性能就超過(guò)了需要 6000+ token的 MinerU2.0

      這充分證明,DeepSeek-OCR在實(shí)際應(yīng)用中非常強(qiáng)大,并且由于其極高的token壓縮率,為未來(lái)的研究留下了更高的想象空間

      不止于OCR的“深度解析”

      除了常規(guī)的OCR能力,DeepSeek-OCR還具備對(duì)文檔內(nèi)圖像進(jìn)行深度解析的能力

      無(wú)論是金融研報(bào)里的圖表


      還是化學(xué)文獻(xiàn)里的分子式


      甚至是數(shù)學(xué)題中的幾何圖形,它都能進(jìn)行結(jié)構(gòu)化的解析和轉(zhuǎn)換


      此外,得益于其多語(yǔ)言的訓(xùn)練數(shù)據(jù),模型還能處理包括阿拉伯語(yǔ)、僧伽羅語(yǔ)在內(nèi)的近百種語(yǔ)言的文檔

      未來(lái)構(gòu)想:模擬人類(lèi)記憶遺忘

      這項(xiàng)研究最引人遐想的部分,是它為實(shí)現(xiàn)LLM的記憶遺忘機(jī)制提供了一種可能的路徑

      研究人員將上下文光學(xué)壓縮與人類(lèi)記憶的衰退過(guò)程進(jìn)行了類(lèi)比:


      近期記憶 (Recent Contexts):就像近處的物體,清晰可見(jiàn)??梢詫⑵滗秩境筛叻直媛蕡D像,用較多的視覺(jué)token來(lái)保留高保真信息

      遠(yuǎn)期記憶 (Older Contexts):就像遠(yuǎn)處的物體,逐漸模糊。可以將其漸進(jìn)式地縮放成更小、更模糊的圖像,用更少的視覺(jué)token來(lái)表示,從而實(shí)現(xiàn)信息的自然遺忘和壓縮

      通過(guò)這種方式,模型可以在處理超長(zhǎng)對(duì)話或文檔時(shí),動(dòng)態(tài)地為不同時(shí)期的上下文分配不同數(shù)量的計(jì)算資源,從而可能構(gòu)建出一種理論上無(wú)限長(zhǎng)上下文的架構(gòu)。

      總而言之,DeepSeek-OCR不僅驗(yàn)證了“上下文光學(xué)壓縮”這一新穎想法的可行性,還提供了一個(gè)性能強(qiáng)大、極具實(shí)用價(jià)值的開(kāi)源模型,為解決LLM的長(zhǎng)上下文難題開(kāi)辟了一個(gè)全新的、充滿希望的方向。

      論文地址:

      http://github.com/deepseek-ai/DeepSeek-OCR

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      上海樓市最詭異的時(shí)刻

      上海樓市最詭異的時(shí)刻

      環(huán)線房產(chǎn)咨詢
      2025-11-05 19:04:25
      神二十飛船疑遭撞擊,沒(méi)預(yù)警系統(tǒng)?3名航天員、4鼠乘組延期返回

      神二十飛船疑遭撞擊,沒(méi)預(yù)警系統(tǒng)?3名航天員、4鼠乘組延期返回

      普陀動(dòng)物世界
      2025-11-06 00:12:28
      欲哭無(wú)淚!跌幅近70%,從270萬(wàn)跌到88萬(wàn),廣州一頭部樓盤(pán)房?jī)r(jià)崩了

      欲哭無(wú)淚!跌幅近70%,從270萬(wàn)跌到88萬(wàn),廣州一頭部樓盤(pán)房?jī)r(jià)崩了

      火山詩(shī)話
      2025-11-04 05:49:04
      福建一縣委常委,獲市委提拔(附簡(jiǎn)歷)

      福建一縣委常委,獲市委提拔(附簡(jiǎn)歷)

      魯中晨報(bào)
      2025-11-05 21:43:04
      57歲楊瀾在新加坡旅游被偶遇,她的打扮貴氣十足,身材胖了不少

      57歲楊瀾在新加坡旅游被偶遇,她的打扮貴氣十足,身材胖了不少

      喜歡歷史的阿繁
      2025-11-05 07:21:33
      哇!四川一?;ǎ鹈揽扇?,嬌俏靈動(dòng),這笑容也太有感染力了!

      哇!四川一?;?,甜美可人,嬌俏靈動(dòng),這笑容也太有感染力了!

      情感大頭說(shuō)說(shuō)
      2025-11-06 01:19:01
      雄鹿:小波特已成功接受半月板手術(shù) 預(yù)計(jì)將缺陣約四周

      雄鹿:小波特已成功接受半月板手術(shù) 預(yù)計(jì)將缺陣約四周

      北青網(wǎng)-北京青年報(bào)
      2025-11-06 07:47:04
      高鐵“面壁座”引爭(zhēng)議:消費(fèi)者權(quán)益視角下的票價(jià)與服務(wù)匹配之問(wèn)

      高鐵“面壁座”引爭(zhēng)議:消費(fèi)者權(quán)益視角下的票價(jià)與服務(wù)匹配之問(wèn)

      民言民語(yǔ)
      2025-11-05 09:38:04
      被謝賢養(yǎng)了12年,用青春換來(lái)2000萬(wàn)的Coco,已經(jīng)走上了另一條道路

      被謝賢養(yǎng)了12年,用青春換來(lái)2000萬(wàn)的Coco,已經(jīng)走上了另一條道路

      妙知
      2025-11-05 15:19:50
      中國(guó)駐英國(guó)使館發(fā)言人就英媒報(bào)道稱(chēng)中方阻止英高校開(kāi)展涉疆研究事答記者問(wèn)

      中國(guó)駐英國(guó)使館發(fā)言人就英媒報(bào)道稱(chēng)中方阻止英高校開(kāi)展涉疆研究事答記者問(wèn)

      環(huán)球網(wǎng)資訊
      2025-11-05 09:58:15
      太荒誕!網(wǎng)紅女友賣(mài)淫,被嫖客嫌棄賴(lài)賬報(bào)警,男友送花接出獄被罵

      太荒誕!網(wǎng)紅女友賣(mài)淫,被嫖客嫌棄賴(lài)賬報(bào)警,男友送花接出獄被罵

      扮貓騎老虎
      2025-10-19 18:20:54
      古二得了漸凍癥,在語(yǔ)言功能退化且站立困難之際,他選擇蚍蜉撼樹(shù)

      古二得了漸凍癥,在語(yǔ)言功能退化且站立困難之際,他選擇蚍蜉撼樹(shù)

      芊手若
      2025-11-04 00:30:07
      谷愛(ài)凌,頭發(fā)變黑,臉變精致,胸圍傲人,氣質(zhì)變得更優(yōu)?

      谷愛(ài)凌,頭發(fā)變黑,臉變精致,胸圍傲人,氣質(zhì)變得更優(yōu)?

      娛樂(lè)領(lǐng)航家
      2025-10-27 22:00:06
      男孩摸蛋糕后續(xù):媽媽正臉照,已社會(huì)性死亡,更惡心言論被扒

      男孩摸蛋糕后續(xù):媽媽正臉照,已社會(huì)性死亡,更惡心言論被扒

      蜉蝣說(shuō)
      2025-11-05 14:48:10
      張文宏院士:糖尿病可以吃的食物排名,不知道的糖友太虧了

      張文宏院士:糖尿病可以吃的食物排名,不知道的糖友太虧了

      荷蘭豆愛(ài)健康
      2025-11-02 07:55:38
      演員克拉拉官宣離婚!結(jié)束6年婚姻!曾被評(píng)為亞洲第一美女!

      演員克拉拉官宣離婚!結(jié)束6年婚姻!曾被評(píng)為亞洲第一美女!

      調(diào)侃國(guó)際觀點(diǎn)
      2025-10-17 20:58:13
      從24跌至3元,三季報(bào)再踩雷!空冷龍頭被棄,牛散張素芬逆勢(shì)殺入

      從24跌至3元,三季報(bào)再踩雷!空冷龍頭被棄,牛散張素芬逆勢(shì)殺入

      慧眼看世界哈哈
      2025-11-06 05:57:54
      長(zhǎng)沙海信廣場(chǎng),怎么了?

      長(zhǎng)沙海信廣場(chǎng),怎么了?

      獨(dú)角Mall
      2025-11-05 13:35:34
      不會(huì)吃別尬吃!《樹(shù)影迷宮》廖凡吃餡餅,讓假吃演員無(wú)地自容

      不會(huì)吃別尬吃!《樹(shù)影迷宮》廖凡吃餡餅,讓假吃演員無(wú)地自容

      糊咖娛樂(lè)
      2025-11-05 11:33:50
      田曦薇真人身材真的巨好啊,又瘦又有料,臉蛋超美

      田曦薇真人身材真的巨好啊,又瘦又有料,臉蛋超美

      手工制作阿殲
      2025-11-06 00:08:44
      2025-11-06 08:55:00
      AI寒武紀(jì) incentive-icons
      AI寒武紀(jì)
      專(zhuān)注于人工智能,科技領(lǐng)域
      960文章數(shù) 370關(guān)注度
      往期回顧 全部

      科技要聞

      蘋(píng)果“認(rèn)輸”!曝每年10億美元租用谷歌AI

      頭條要聞

      記者問(wèn)了歐盟一個(gè)“有趣”的問(wèn)題 然后被解雇了

      頭條要聞

      記者問(wèn)了歐盟一個(gè)“有趣”的問(wèn)題 然后被解雇了

      體育要聞

      贏下皇馬,會(huì)是利物浦的轉(zhuǎn)折點(diǎn)嗎?

      娛樂(lè)要聞

      港星林尚武突發(fā)心臟病去世

      財(cái)經(jīng)要聞

      特朗普關(guān)稅遭美國(guó)高院大法官輪番質(zhì)疑

      汽車(chē)要聞

      智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場(chǎng)迎來(lái)新變量

      態(tài)度原創(chuàng)

      旅游
      藝術(shù)
      房產(chǎn)
      教育
      公開(kāi)課

      旅游要聞

      黑龍江將開(kāi)展冬季冰雪旅游“百日行動(dòng)” 冰雪產(chǎn)業(yè)規(guī)模有望破萬(wàn)億

      藝術(shù)要聞

      張鐵林的書(shū)法到底有多神秘?看看這幅作品!

      房產(chǎn)要聞

      最新!海南樓市10月熱銷(xiāo)榜單出爐!

      教育要聞

      83歲還在學(xué)英語(yǔ)?ta們告訴你堅(jiān)持的意義。

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产不卡在线一区二区| 精品人妻伦九区久久aaa片69| 久久99精品久久久久久| 久久精品国产亚洲av品| 国产内射XXXXX在线| 无码人妻精品一区二区三区下载| 久久夜色精品国产亚av| 福利一区二区在线播放| 国产婷婷色一区二区三区| 欧美大屁股xxxx高跟欧美黑人| 色吊丝永久性观看网站| 国产精品视频一区二区不卡| 亚洲一级片一区二区三区| 欧美日本激情| 国产精品综合一区二区三区 | 成人深夜节目在线观看| 国产又黄又爽又不遮挡视频| 精品少妇av蜜臀av| 丰满人妻一区二区三区色| 成人欧美一区二区三区在线观看| 国产丰满乱子伦午夜福利| 国产V日韩V亚洲欧美久久| 国产一区二区三区无遮挡| 高清性欧美暴力猛交| 久久精品国产男包| 国产高清在线男人的天堂| 亚洲熟妇国产熟妇肥婆| 久久精品国产午夜福利伦理| 亚洲中文字幕国产综合| 被c到高潮疯狂喷水国产 | 国产成人啪精品午夜网站| 欧美xxxxhd高清| 国产女人18毛片水真多1| 国产成人AV在线免播放观看新 | 亚洲人成网线在线播放VA| 久久自己只精产国品| 华人在线亚洲欧美精品| 18禁免费无码无遮挡网站| 性夜夜春夜夜爽夜夜免费视频 | 牟定县| 麻豆精品一区二区三区蜜臀|