<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      DeepSeek OCR論文引爆網(wǎng)絡(luò)!Andrej Karpathy:,我很喜歡;馬斯克:未來99%都是光子

      0
      分享至


      剛剛,AI大神Andrej Karpathy表示非常喜歡DeepSeek OCR 論文,原話:

      我相當(dāng)喜歡新的DeepSeek-OCR論文。它是一個(gè)很好的OCR模型(可能比dots稍微差一點(diǎn)),是的,數(shù)據(jù)收集等等,但無論如何都不重要。對(duì)我來說更有趣的部分(尤其是作為一個(gè)以計(jì)算機(jī)視覺為核心,暫時(shí)偽裝成自然語言的人)是像素是否比文本更適合作為LLM的輸入。文本標(biāo)記是否浪費(fèi)且糟糕,作為輸入。

      還不知什么情況的看我這篇文章

      Karpathy認(rèn)為,拋開模型本身不談,deepseek這篇論文引出了一個(gè)更值得深思的問題:對(duì)于LLM來說,像素是否是比文本更優(yōu)越的輸入形式?文本Token是否既浪費(fèi)又糟糕?

      他進(jìn)一步設(shè)想,或許所有LLM的輸入都只應(yīng)該是圖像。即便是純文本內(nèi)容,也應(yīng)該先渲染成圖片再輸入給模型

      Karpathy給出了支持這一構(gòu)想的四大核心理由:

      1. 更高的信息壓縮效率

      將文本渲染成圖像,可以實(shí)現(xiàn)更高的信息壓縮,這意味著更短的上下文窗口和更高的運(yùn)行效率

      2. 更通用的信息流

      像素是一種遠(yuǎn)比文本更通用的信息流。它不僅能表示純文本,還能輕松捕捉粗體、彩色文本,甚至是任意的圖表和照片

      3. 默認(rèn)實(shí)現(xiàn)強(qiáng)大的雙向注意力

      像素化的輸入可以很自然、很輕松地默認(rèn)使用雙向注意力進(jìn)行處理,這種處理方式比自回歸注意力更為強(qiáng)大

      4. 徹底淘汰Tokenizer

      Karpathy毫不掩飾自己對(duì)Tokenizer的嫌棄。他認(rèn)為Tokenizer是一個(gè)丑陋、獨(dú)立、非端到端的階段。它引入了Unicode和字節(jié)編碼的所有丑陋之處,繼承了大量歷史包袱,并帶來了安全和越獄風(fēng)險(xiǎn)(例如連續(xù)字節(jié)問題)

      他舉例說,Tokenizer會(huì)導(dǎo)致兩個(gè)在人眼看來完全相同的字符,在網(wǎng)絡(luò)內(nèi)部被表示為兩個(gè)完全不同的Token。一個(gè)笑臉emoji,在模型看來只是一個(gè)奇怪的Token,而不是一個(gè)由像素構(gòu)成的、真實(shí)的笑臉,這導(dǎo)致模型無法利用其視覺信息帶來的遷移學(xué)習(xí)優(yōu)勢(shì)。Tokenizer必須消失,他強(qiáng)調(diào)

      Karpathy總結(jié)道,OCR只是眾多視覺到文本(vision -> text)任務(wù)中的一種。而傳統(tǒng)的文本到文本(text -> text)任務(wù),完全可以被重構(gòu)成視覺到文本任務(wù),反之則不行

      他設(shè)想的未來交互模式可能是:用戶的輸入(Message)是圖像,而解碼器(Assistant的響應(yīng))的輸出仍然是文本。因?yàn)槿绾握鎸?shí)地輸出像素,或者是否有必要這樣做,目前還不明確

      核心爭議:雙向注意力與圖像分塊

      對(duì)于Karpathy的觀點(diǎn),AI學(xué)者Yoav Goldberg提出了兩個(gè)疑問:


      1.為什么說圖像能輕松獲得雙向注意力,而文本不能?

      2.雖然沒有了Tokenization,但將輸入圖像切分成圖塊(Patches),難道不是一種類似且可能更丑陋的處理方式嗎?

      Karpathy對(duì)此進(jìn)行了解釋。

      他回應(yīng)說,原則上沒有任何東西阻止文本使用雙向注意力。但為了效率,文本通常都是以自回歸的方式進(jìn)行訓(xùn)練的。他設(shè)想,可以在訓(xùn)練中期加入一個(gè)微調(diào)階段,用雙向注意力來處理作為條件的信息(比如用戶的輸入消息,因?yàn)檫@些Token不需要模型去生成)。但他不確定在實(shí)踐中是否有人這樣做。理論上,為了預(yù)測(cè)下一個(gè)Token,甚至可以對(duì)整個(gè)上下文窗口進(jìn)行雙向編碼,但這將導(dǎo)致訓(xùn)練無法并行化

      最后他補(bǔ)充道,或許這個(gè)方面(雙向注意力)嚴(yán)格來說并非像素與Token的本質(zhì)區(qū)別,更多是像素通常被編碼(encoded),而Token通常被解碼(decoded)(借用原始Transformer論文的術(shù)語)

      馬斯克:未來99%是光子

      在這場(chǎng)討論的最后,Elon Musk也現(xiàn)身評(píng)論區(qū),并給出了一個(gè)更具未來感的判斷:


      從長遠(yuǎn)來看,AI模型超過99%的輸入和輸出都將是光子。沒有其他任何東西可以規(guī)模化

      馬斯克的這條評(píng)論并非隨口一說。他進(jìn)一步補(bǔ)充了一段堪稱硬核的宇宙學(xué)科普,來解釋為什么他認(rèn)為“光子”是終極的規(guī)模化方案

      簡單來說,宇宙中絕大多數(shù)的粒子都是光子

      而這些光子最主要的來源,是宇宙微波背景(CMB)。根據(jù)測(cè)算,CMB的光子密度約為每立方厘米410個(gè)。將這個(gè)密度乘以可觀測(cè)宇宙的巨大體積(半徑約465億光年),可以得出僅CMB貢獻(xiàn)的光子數(shù)量就達(dá)到了一個(gè)驚人的數(shù)字:約1.5 x 10??個(gè)

      相比之下,所有恒星發(fā)出的光子(星光)以及其他來源(如中微子背景、黑洞輻射等)貢獻(xiàn)的數(shù)量,則完全可以忽略不計(jì)

      這背后揭示的物理事實(shí)是:光子在數(shù)量級(jí)上擁有無與倫比的優(yōu)勢(shì)。這或許就是馬斯克認(rèn)為AI的未來輸入輸出將由光子主宰的底層邏輯

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      中方定罪后,荷蘭方面終于承認(rèn),這件事怎么解決,還得等中國點(diǎn)頭

      中方定罪后,荷蘭方面終于承認(rèn),這件事怎么解決,還得等中國點(diǎn)頭

      桑啟紅原
      2025-11-05 15:08:51
      一地宣布:全面推行現(xiàn)房銷售!

      一地宣布:全面推行現(xiàn)房銷售!

      每日經(jīng)濟(jì)新聞
      2025-11-05 17:50:07
      探訪:二期開街一個(gè)半月后,隆福寺商圈怎么樣了?|新商圈新潮流

      探訪:二期開街一個(gè)半月后,隆福寺商圈怎么樣了?|新商圈新潮流

      北青網(wǎng)-北京青年報(bào)
      2025-11-05 13:15:15
      在考試錄用中泄露試題的龔曉莉 被開除黨籍 取消退休待遇

      在考試錄用中泄露試題的龔曉莉 被開除黨籍 取消退休待遇

      閃電新聞
      2025-11-04 13:20:09
      以卵擊石!沈伯洋集結(jié)數(shù)百臺(tái)獨(dú)舉牌,挑釁大陸底線,中央重拳出擊

      以卵擊石!沈伯洋集結(jié)數(shù)百臺(tái)獨(dú)舉牌,挑釁大陸底線,中央重拳出擊

      老謝談史
      2025-11-04 19:09:27
      金價(jià),閃崩!

      金價(jià),閃崩!

      沈陽百姓一家親
      2025-11-05 16:32:42
      山西廳官跨省行賄山西省原省委書記之子胡志強(qiáng)案

      山西廳官跨省行賄山西省原省委書記之子胡志強(qiáng)案

      創(chuàng)作者_(dá)IE2295
      2025-11-05 00:02:15
      廣西一男子建房子遭鄰居阻撓后挖成魚塘養(yǎng)魚 男子:等他回來求我

      廣西一男子建房子遭鄰居阻撓后挖成魚塘養(yǎng)魚 男子:等他回來求我

      戶外釣魚哥阿勇
      2025-11-05 09:41:13
      烏軍集結(jié)舉行頒獎(jiǎng)典禮,突然遭襲多人死亡

      烏軍集結(jié)舉行頒獎(jiǎng)典禮,突然遭襲多人死亡

      環(huán)球時(shí)報(bào)國際
      2025-11-05 15:39:43
      我退休52歲,找個(gè)48歲農(nóng)村光棍,洞房夜他的一個(gè)舉動(dòng),我淚流不止

      我退休52歲,找個(gè)48歲農(nóng)村光棍,洞房夜他的一個(gè)舉動(dòng),我淚流不止

      雙色球的方向舵
      2025-11-05 14:20:06
      上海市委書記出席!這一大會(huì)上,華理教授獲評(píng)“先進(jìn)”!

      上海市委書記出席!這一大會(huì)上,華理教授獲評(píng)“先進(jìn)”!

      王姐懶人家常菜
      2025-11-05 14:27:08
      白天陪玩晚上陪睡?明碼標(biāo)價(jià)8000一次!高端伴游淪為色情交易溫床

      白天陪玩晚上陪睡?明碼標(biāo)價(jià)8000一次!高端伴游淪為色情交易溫床

      阿纂看事
      2025-08-29 15:46:57
      新賽季0出場(chǎng),24歲后衛(wèi)暫別火箭隊(duì)!被2位射手壓制,合同轉(zhuǎn)正太難

      新賽季0出場(chǎng),24歲后衛(wèi)暫別火箭隊(duì)!被2位射手壓制,合同轉(zhuǎn)正太難

      熊哥愛籃球
      2025-11-05 17:29:17
      羅布·耶滕或?qū)⒊蔀楹商m最年輕首相

      羅布·耶滕或?qū)⒊蔀楹商m最年輕首相

      參考消息
      2025-11-04 17:50:12
      紐約迎來新市長:90后、印度裔、穆斯林、民主社會(huì)主義者、特朗普的“噩夢(mèng)”

      紐約迎來新市長:90后、印度裔、穆斯林、民主社會(huì)主義者、特朗普的“噩夢(mèng)”

      上觀新聞
      2025-11-05 17:59:14
      南寧破局!8000萬“賣公園”

      南寧破局!8000萬“賣公園”

      廣西地產(chǎn)
      2025-11-05 16:40:03
      伏尸百萬,這個(gè)國家已經(jīng)進(jìn)入大屠殺模式 | 地球知識(shí)局

      伏尸百萬,這個(gè)國家已經(jīng)進(jìn)入大屠殺模式 | 地球知識(shí)局

      地球知識(shí)局
      2025-11-03 21:00:07
      1958年,哪五位高級(jí)干部批粟最積極?陳老總為何發(fā)言很多?

      1958年,哪五位高級(jí)干部批粟最積極?陳老總為何發(fā)言很多?

      柳絮憶史
      2025-10-29 08:46:07
      中方下了“最后通牒”,認(rèn)定荷蘭100%擔(dān)責(zé),再不悔改一切后果自負(fù)

      中方下了“最后通牒”,認(rèn)定荷蘭100%擔(dān)責(zé),再不悔改一切后果自負(fù)

      芳芳?xì)v史燴
      2025-11-05 18:15:38
      預(yù)計(jì)我國將進(jìn)入拉尼娜狀態(tài)!今年冬季,廣西或出現(xiàn)極端低溫

      預(yù)計(jì)我國將進(jìn)入拉尼娜狀態(tài)!今年冬季,廣西或出現(xiàn)極端低溫

      南國今報(bào)
      2025-11-05 12:47:03
      2025-11-05 19:20:49
      AI寒武紀(jì) incentive-icons
      AI寒武紀(jì)
      專注于人工智能,科技領(lǐng)域
      960文章數(shù) 370關(guān)注度
      往期回顧 全部

      科技要聞

      大轉(zhuǎn)彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      楊受成名下英皇宮殿停運(yùn) 曾以大堂鋪滿78公斤黃金聞名

      頭條要聞

      楊受成名下英皇宮殿停運(yùn) 曾以大堂鋪滿78公斤黃金聞名

      體育要聞

      贏下皇馬,會(huì)是利物浦的轉(zhuǎn)折點(diǎn)嗎?

      娛樂要聞

      港星林尚武突發(fā)心臟病去世

      財(cái)經(jīng)要聞

      中方官宣!對(duì)美關(guān)稅,調(diào)整!

      汽車要聞

      智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場(chǎng)迎來新變量

      態(tài)度原創(chuàng)

      數(shù)碼
      房產(chǎn)
      時(shí)尚
      家居
      軍事航空

      數(shù)碼要聞

      雷克沙 TouchLock 移動(dòng) SSD 上市:NFC + ASE 雙加密,1TB 899 元

      房產(chǎn)要聞

      最新!海南樓市10月熱銷榜單出爐!

      壞了,看到劇本殺鼻祖了!

      家居要聞

      別樣府院 暢享詩意生活

      軍事要聞

      美國“福特”號(hào)航母駛往加勒比海

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲国产无线乱码在线观看| 国产精品黄大片在线播放| 高清中文字幕一区二区| 俺也来俺也去俺也射| 亚洲跨种族黑人xxxxx| 成人国产精品中文字幕| 日韩成人无码影院| 综合激情网一区二区三区| 欧洲中文字幕一区二区| 开心激情站开心激情网六月婷婷| 国产成人av一区二区三| 中文字幕人妻无码一夲道| 7777精品久久久大香线蕉| 成年午夜免费韩国做受视频| 欧洲精品色在线观看| 江口县| 影音先锋大黄瓜视频| 日韩精品av一区二区三区| 国产精品小仙女自拍视频| 人妻av无码系列一区二区三区| 达孜县| 丝袜美腿视频一区二区三区| 国产真实伦在线观看视频| 中文字幕有码日韩精品| 丰满高跟丝袜老熟女久久| 国产婷婷综合在线视频中文| 97精品尹人久久大香线蕉| 国产高颜值不卡一区二区| 无码内射成人免费喷射| 麻豆麻豆麻豆麻豆麻豆麻豆| 中国女人熟毛茸茸A毛片| 中文字幕亚洲国产精品| 国产免费一区二区三区在线观看 | 国产永久免费高清在线| 青青青久热国产精品视频| 91精品91久久久久久| 亚洲一区二区色情苍井空| 内地偷拍一区二区三区| 一本色道久久综合无码人妻| 98日韩精品人妻一二区| 成人精品天堂一区二区三区|