2025 年 9 月,AirPods Pro 3 發布,其內置的同傳功能也讓「AI 翻譯耳機」這個詞再次成為熱點。但就在 AirPods 的同傳功能遲遲無法在國內落地的同時,一家扎根中國的翻譯耳機品牌,已經為全球用戶默默服務了近十年。
自 2016 年立項至今,時空壺的翻譯產品已經銷往全球 170 多個國家,幾乎以一己之力定義了「翻譯耳機」這個品類。在 AI 翻譯行業因行業巨頭到來而「風云突變」的 2025 年下半年,雷科技也帶著問題拜訪了時空壺 CTO 石偉,聊了聊他眼中這場新的翻譯革命。
![]()
從「聽得見」到「聽得懂」
說起翻譯耳機,其實很多人對這個品類都有誤解。在不少消費者眼里,所謂的「翻譯耳機」不過是一個可以調用手機翻譯 App 的普通藍牙耳機。畢竟翻譯的步驟都在手機 App 里處理,只要 App 翻譯夠快就行。
不過在時空壺看來翻譯耳機其實是一個非常淺層的品類;他們真正想解決的,是人與人交流、理解之間的障礙。簡單來說,翻譯只是信息的轉移,交流是情感和語境的傳遞,而理解則是人與人真正建立連接的過程。時空壺希望用技術跨越前兩者的界限,讓機器翻譯最終服務于人類的理解與共感。
也正因如此,時空壺選擇了一個過去大家都未曾留意到的地方,作為重構翻譯耳機品類的落腳點——「聽」,具體來說是讓「翻譯耳機聽清人說的話」。
一般來說,只有近距離面對面翻譯才會用到翻譯耳機。而在近距離、面對面的雙向交流下,讓翻譯耳機能搞清楚「誰在說什么」,并不是一件簡單的事情:
首先,一般的耳機只有一路麥克風上行信號、開啟同傳模式需要更新藍牙耳機的底層固件;其次,普通的藍牙耳機在近距離場景下很難區分每只耳機對應的講話人——A 說話的聲音除了會被 A 佩戴的耳機捕捉,同時也會被 B 佩戴的耳機捕捉,并導致翻譯混亂。
在 2021 年發布的 W3 同傳耳機中,時空壺設計了一套「矢量降噪技術」,可以區分不同的講話人。而在今年 9 月推出的時空壺 W4 上,時空壺更進一步,拿出了 TWS 中首創的「骨聲紋技術」。
![]()
石偉介紹說,「骨聲紋技術」和市面上常見的骨傳導耳機是兩個完全不同的概念——「常見的骨傳導耳機利用骨傳導技術把聲音送到用戶耳朵里,而骨聲紋技術則是利用骨傳導麥克風技術,讓耳機能通過骨骼振動采集語音信號。」
當然,為了保證 W4 收音的質量,W4 利用骨聲紋技術識別講話人的同時,也會用氣傳導麥克風聯動捕捉說話的聲音。骨聲紋技術分辨講話人,氣傳導麥克風技術采集說話聲,W4 這套業內首創的翻譯耳機聲學方案,讓翻譯耳機可以「無懼」環境噪聲,即使在 IFA、CES 那種人聲洶涌的國際展會中,也能準確分辨、識別佩戴者的聲音。
而這樣技術創新的背后,自然也離不開時空壺研發團隊的努力。由于時空壺 W4 是 TWS 耳機領域首個落地骨傳導麥克風技術的產品,時空壺必須從零開始研發,在這個沒有前人可以借鑒的「技術無人區」,時空壺結合骨導與氣導信號,經過上萬次測試、數十輪樣品驗證,才在 W4 上實現穩定量產。
翻譯應該像母語一樣自然
解決了「聽」這個前置條件,我們來談談翻譯耳機的「根」。毫無疑問,翻譯耳機的核心功能就是「翻譯」——把 A 說的話翻譯成另一種語言,播放給 B 聽,反之亦然。但在時空壺看來,「翻譯」只不過是翻譯耳機的表象。
「我們做產品的出發點,并不僅僅是要做一個翻譯耳機」,石偉解釋道,「我們實際上更希望的它是一個人與人交流的工具」。
有了「交流工具」這個終極目標,時空壺開始對傳統翻譯設備的工作模式進行了大刀闊斧的改進:
首先是翻譯的流暢性。傳統的翻譯耳機受技術限制,高度依賴云端的翻譯模型。這種云端翻譯模型雖然可以帶來較好的翻譯效果,但高度依賴網絡傳輸,一旦網絡信號波動,就會出現斷句。
石偉舉例到:「打電話卡時候,人們自然就會知道這是網絡延遲問題,而在翻譯方面,大部分用戶不會往網絡延遲上想,而是會直接認為這就是產品有問題。從品牌角度,我們肯定不會要求用戶理解我們。」
但這也意味著,時空壺必須從翻譯的原理入手,用更強的短策大模型來處理翻譯延遲的問題。
![]()
在 W4 上,時空壺選擇了端側翻譯模型,讓所有語音識別和翻譯運算可以直接在手機本地完成,即便在離線狀態下也能實時輸出。
但端側模型并不是時空壺在「交流」這個大命題下的唯一解決方案。為了讓跨語言交流能像「母語交流」一樣自然,時空壺還構建了「超能翻譯引擎」系統。
簡單來說,「超能翻譯引擎」集成了行業內最好的翻譯模型,并建立專有評測體系,通過真人錄音測試以確保輸出品質。石偉介紹道:「我們會邀請專業的真人譯員,由他們和時空壺一起評測翻譯的質量。積累出一個公平、全面的評測機制,再基于這個機制去測試市面上的翻譯模型。」
我們知道,不同翻譯服務對不同的翻譯語種有不同的效果,可能某個公司的模型擅長 AB 語言的翻譯,另一個公司的模型擅長 CD 語言之間的翻譯。而時空壺采用的「超能翻譯引擎」,能在不同的翻譯模型之間各取所長,從而打造真正的「母語級」翻譯。
當然了,這并不意味著時空壺沒有自己的翻譯模型能力。石偉補充道「如果(外界翻譯引擎)沒有我們自己的好,我們集成自己的引擎,自己動手優化和提升翻譯質量。」
![]()
這句話聽起來輕描淡寫,卻意味著時空壺擁有從語料清洗到模型調優的一整套自建體系。也正因時空壺有一套完整的自建翻譯體系作為「基準」和「標桿」,在翻譯的細節上,時空壺也有能力打造自己的差異化。
比如在實驗室中,時空壺還打造了「音色跨語種克隆」技術,讓翻譯后的譯文也擁有講話人原始語音中的音色、語氣,讓跨語言交流不再是「機器替用戶說話」。
在「技術無人區」里,用戶就是唯一的前進方向
盡管在訪談中,石偉介紹「骨聲紋」「超能翻譯引擎」「雙向翻譯」等技術時有些「輕描淡寫」,但代入到時空壺的角色后,我們也能看到時空壺從零開始打造翻譯耳機品類的艱辛。
2016 年,時空壺成立。當時整個翻譯耳機行業尚無可參考的成熟模板,技術、形態、交互方式都要時空壺親自去摸索。「時空壺作為行業先行者,一直都是在『無人區』里探索」,石偉說。
在這樣的「技術無人區」里,時空壺沒有數據可抄、也沒有競品可比,唯一能指引時空壺不斷前行的,就是時空壺的用戶。
在此次交流之前,雷科技曾參觀過時空壺的辦公室。在其研發區域,掛著一臺所有人看見的電視。但電視里放的并不是企業文化宣傳片,而是「實時評價」——時空壺會在電視上實時滾動播放全球電商平臺上關于自己產品的評價。
![]()
「我們特別關注差評」,石偉補充道,「我們特別希望用戶寫給我們差評,給我們寫很深入的分析,到底哪個地方好,哪個地方不好,這對我們來說是最受益的。」
除了專注線上用戶反饋,時空壺還會把團隊帶到真實的使用現場。「我們會給研發同事補助、獎金,讓他們帶家人去日本、泰國、越南等小語種國家旅游。唯一的要求就是必須親自用自己的產品,去感受時空壺在真實的場景里的體驗」。
在交流中,石偉也向雷科技分享了一個受用戶啟發的案例:
時空壺原本是一個純 C 端(面向消費者)的產品,但有段時間,時空壺發現很多學校的老師都會自費購買他們的產品。「同時到了現場,觀察到海外很多 K12 教育機構(幼兒園到 12 年級的教育階段),除了正常的課堂,還有很多手工課、木工課之類的課程,課堂里面的收音環境特別的差。正是這些真實的用戶和場景需求,才讓我們找到了如 W4 這樣的骨傳導抗噪方向。」
![]()
類似的案例還有很多——在時空壺辦公室的墻上貼了不少照片,每張照片背后都有一個類似的案例:教室里,兩個來自不同國家的小孩用時空壺的翻譯耳機上課;教堂里,工作人員用時空壺的翻譯機帶領不同語言的教眾參與活動;工作室里,義肢師傅與世界各地的客戶討論定制義肢的細節……
可以說,正是來自海量用戶的信任和反饋,讓時空壺能從 2016 年一路走到今天。也正是這種「洞察用戶、傾聽用戶」的方法論,讓時空壺能從翻譯耳機品類中脫穎而出,從「翻譯耳機品類探索者」成長為「有溫度的科技品牌」。
不做「沒有意義」的競爭
當然了,時空壺開辟翻譯耳機這個賽道已經將近十年了,翻譯耳機這個賽道也迎來了不少「新玩家」。但談到不同品牌之間的競爭時,石偉的看法卻讓雷科技有些出乎意料。
「競爭是一定會有的,這沒什么意外。」他頓了頓,「但關鍵是,我們不能讓競爭變得無意義。」
石偉認為,翻譯耳機這個品類還遠沒到「成熟」的階段。它不像手機、汽車那樣可以比參數、拼配置;現在所有玩家都還在摸索體驗邊界。「有的品牌想靠價格戰搶市場,但我們更清楚,這個行業跑的是馬拉松,不是百米賽。」石偉喜歡用跑步做比喻:「你跑了三公里就開始回頭看別人追上來沒,這種狀態是跑不遠的。」
結合時空壺在「無人區」探索的經歷,石偉這樣的觀點其實也很好理解。就當前的翻譯設備市場來說,企業發展的難題并不是「競爭對手太多」,而是「行業、技術對交流的覆蓋還不夠深」。
舉個例子,人與人的交流除了語義,還包括聲調、眼神、手勢等多種維度。比如意大利人在說話時,手部動作就特別豐富;亞洲人在表達情緒時,也更常用眼部動作。
如果我們將時空壺看作一個「翻譯耳機品牌」,那這個賽道里不同品牌的競爭點無非就是翻譯準確度、速度。但在時空壺看來,「翻譯耳機」只不過是時空壺基于當前消費電子技術現況,選定的最「最佳形態」而已。如果從「交流工具」的角度看,時空壺依舊是那個「沒有對手、探索未知」的品牌。
讓技術更有溫度
在石偉看來,時空壺真正想做的,是讓機器的語言逐漸「長出人味」,而不僅僅是做一個快速且沒有感情的翻譯機器。
「技術再先進,也得讓人感受到溫度。」石偉解釋道,「翻譯不是字對字,而是要把說話的感覺傳過去。」
![]()
這個想法聽上去抽象,但落到技術上卻極具挑戰性。AI 需要學會處理語速、停頓、語調甚至重音變化,讓一句「我沒事」能表達不同語氣的「真沒事」或「我生氣了」。
為了實現這一目標,時空壺作出了大量的努力。得益于大模型的加入,時空壺的雙向翻譯擁有了對上下文的理解能力,可以理解對話場景,并根據歷史對話,排除不符合語境的多音字、多義詞分支,獲得更準確的翻譯效果。
而之前提到的「音色跨語種克隆」技術,也能在翻譯原話的同時,盡可能保留原聲的特點。用石偉的話來說:「我們希望用戶在使用時不會覺得這是機器在幫你,而是有人在理解你。 」
不只是翻譯耳機,還是溝通的橋梁
在 AI 迅猛發展的時代,大多數公司都在追逐更高的模型參數、更快的響應速度。但時空壺選擇了一條不那么顯眼的路徑——去研究「交流的質感」。
![]()
事實上,這份堅持也藏在品牌的起點中。時空壺的 Logo 是代表神經元突觸和無數技術點,代表以技術推動跨語言交流。從這個角度看,時空壺的產品無論在理念還是形態上,也都和科幻巨作《銀河系漫游指南》中的巴別魚非常相似——兩者都希望讓翻譯超越語言,讓理解更有溫度。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.