每日經(jīng)濟(jì)新聞 2025-04-29 20:38:21
近日,國家專精特新“小巨人”企業(yè)傳神語聯(lián)創(chuàng)始人何恩培接受了《每日經(jīng)濟(jì)新聞》記者的專訪。他認(rèn)為,當(dāng)前大模型競爭雖激烈,但遠(yuǎn)未成熟,類似1920年電氣時代,應(yīng)用尚未被充分發(fā)掘。智能語言服務(wù)行業(yè)正從“單純的語言轉(zhuǎn)換”轉(zhuǎn)向“知識理解與應(yīng)用”。傳神語聯(lián)選擇“后撤一步”,提供底層技術(shù)和工具。何恩培強(qiáng)調(diào),數(shù)據(jù)質(zhì)量重于數(shù)量,AI未來競爭在于底層技術(shù)框架,“根原創(chuàng)”是根技術(shù)中最有生命力的部分。
每經(jīng)記者 可楊 每經(jīng)編輯 張海妮
開欄語
大模型正從技術(shù)競逐的“實(shí)驗(yàn)室”加速奔向產(chǎn)業(yè)落地的“深水區(qū)”。在這波浪潮中,一些先行者以敏銳的洞察力與破局勇氣,率先探索技術(shù)與場景的融合邊界——他們是打破算力桎梏的開源先鋒,是深耕垂直領(lǐng)域的場景拓荒者,是構(gòu)建生態(tài)協(xié)同的產(chǎn)業(yè)布道者。
聚焦大模型應(yīng)用落地的“最后一公里”,我們對話以技術(shù)為矛、以場景為盾的探索者,試圖勾勒出一幅大模型賦能千行百業(yè)的“清明上河圖”,為行業(yè)提供可復(fù)用的方法論,也為中國AI產(chǎn)業(yè)的全球化突圍注入信心與動能。
(策劃:郭榮村、李少婷)
義烏小商品城外貿(mào)出海成風(fēng),不懂英語的店員對著海外直播平臺熱情闡述,大模型幫他們將訂單統(tǒng)統(tǒng)攬下,這離不開AI(人工智能)翻譯的功勞。
在大模型重塑千行萬業(yè)的浪潮中,傳統(tǒng)翻譯已發(fā)展成為集語言理解、知識處理、文化適配于一體的綜合性智能服務(wù)體系。換句話說,翻譯不再是被動接受技術(shù)賦能的領(lǐng)域,而是主動引領(lǐng)大模型產(chǎn)業(yè)變革的前沿試驗(yàn)場。
但熱潮的另一面,是智能語言服務(wù)行業(yè)靜默的變革——機(jī)器翻譯增多,人類譯員的工作并沒有隨之減少,然而單價(jià)出現(xiàn)下降;訂單量的增長與盈利能力的滯漲構(gòu)成悖論。在這場人機(jī)博弈中,終極勝負(fù)手或許就藏在未被算法吞噬的認(rèn)知褶皺與知識基因之間。
近日,《每日經(jīng)濟(jì)新聞》記者專訪了國家專精特新“小巨人”企業(yè)——傳神語聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司(以下簡稱傳神語聯(lián))創(chuàng)始人何恩培。
當(dāng)前,大模型的競爭已邁入第三年,新的玩家突出重圍,座次又生變化。何恩培認(rèn)為,此時談定局為時尚早,大模型還遠(yuǎn)未成熟,當(dāng)前更像是1920年的電氣時代,基礎(chǔ)技術(shù)已經(jīng)誕生,但五花八門的應(yīng)用尚未被發(fā)掘。
在他看來,智能語言服務(wù)行業(yè)正在從“單純的語言轉(zhuǎn)換”轉(zhuǎn)向“知識理解與應(yīng)用”。趨勢之下,傳神語聯(lián)選擇“后撤一步”,提供服務(wù)于行業(yè)的底層技術(shù)和工具。而在面向應(yīng)用提供服務(wù)的過程中,他們意識到,“大數(shù)據(jù)”并不適用,質(zhì)量更重于數(shù)量。
技術(shù)發(fā)展的腳步越快,各行各業(yè)面臨的拷問就越相似——人工智能會取代我們嗎?
在這場關(guān)乎生存的討論中,智能語言服務(wù)行業(yè)是最早被卷入的領(lǐng)域之一。早在大模型熱潮來臨之前,機(jī)器翻譯就在不斷進(jìn)化,逐步蠶食著人工翻譯的生存空間。
這種焦慮也沖擊著客戶的預(yù)期:如果機(jī)器翻譯能做到“基本能看懂”,為什么還要支付高昂的翻譯費(fèi)用?
生成式AI席卷而來,人工翻譯會成為最先被取代的職業(yè)嗎?
“我可以給大家一個結(jié)論:翻譯可能是人類和機(jī)器博弈中最后消亡的行業(yè)。”何恩培篤信,語言不僅僅是溝通工具,也是人類思考的“操作系統(tǒng)”,是一個復(fù)雜而動態(tài)的體系,機(jī)器需要通過自然語言來理解世界。
但在這場人類與機(jī)器的“博弈”中,智能語言服務(wù)行業(yè)呈現(xiàn)出一個值得探究的信號:訂單增長幅度顯著高于收入增長。何恩培拋出這樣一組數(shù)據(jù):2024年,傳神語聯(lián)的智能語言服務(wù)收入增長了10%,但訂單量增長了30%。
表面上看,這是一個樂觀的信號,訂單量增長說明市場需求仍然旺盛,但訂單的碎片化趨勢正在重塑行業(yè)——過去,一個翻譯訂單可能價(jià)值不菲,現(xiàn)在訂單金額卻越來越小,“因?yàn)榭蛻糇约耗?lsquo;看懂’了”。
機(jī)器翻譯的普及使得語言不再是障礙,提供智能語言服務(wù)也不再是一項(xiàng)“從頭到尾”的工作,而成為一種“修訂和優(yōu)化”的服務(wù)??蛻舻男枨笞兊酶泳珳?zhǔn)。同時,客戶對人工翻譯的付費(fèi)意愿也在下降。既然機(jī)器能做到95%的準(zhǔn)確率,為什么還要收這么多錢?
然而,何恩培認(rèn)為,知識型產(chǎn)品具有一個顯著特征,即使機(jī)器翻譯的準(zhǔn)確率高達(dá)95%,但只要還需要人工從頭至尾審閱,以識別那5%的誤差,處理速度就會回落至人工水平。
人與機(jī)器的博弈最終帶來了企業(yè)間的博弈。客戶普遍認(rèn)為,機(jī)器進(jìn)行初步翻譯,僅需稍作修改即可,進(jìn)而付費(fèi)意愿降低;而為了獲客,智能語言服務(wù)企業(yè)選擇壓低價(jià)格,而成本端唯一的對沖方式,是不得不在部分場景中使用機(jī)器翻譯;機(jī)器不可避免地?fù)屪吡艘徊糠质袌?,而人類譯員的工作量減少,但單價(jià)也隨之下滑。
博弈中,傳神語聯(lián)選擇“后撤一步”。何恩培解釋,過去,智能語言服務(wù)公司直接服務(wù)于終端客戶,但未來,傳神要做的是“賦能”,讓合作伙伴,比如翻譯公司、中介機(jī)構(gòu),去覆蓋直接的語言需求,而傳神為他們提供底層技術(shù)和工具。
這一策略背后的核心邏輯是智能語言服務(wù)行業(yè),正在從“單純的語言轉(zhuǎn)換”轉(zhuǎn)向“知識理解與應(yīng)用”。“傳統(tǒng)翻譯的總量并沒有減少,而是產(chǎn)品形態(tài)發(fā)生了變化。”何恩培說,“客戶需要的,不再是簡單的文本轉(zhuǎn)換,而是一整套基于大模型的知識處理能力。”
出海,早已成為各家科技企業(yè)繞不開的話題。何恩培認(rèn)為,對于中國企業(yè)而言,AI出海的真正挑戰(zhàn)不僅是語言問題,而是幫助企業(yè)在新的市場環(huán)境中實(shí)現(xiàn)知識遷移和業(yè)務(wù)落地。
“他們關(guān)心的是能不能聽‘懂’。”何恩培認(rèn)為,理想的場景是,大模型成為一個知識轉(zhuǎn)換與傳遞的工具,但現(xiàn)實(shí)總比理想復(fù)雜。今天的大模型在語言覆蓋上仍存在很大局限,尤其是對于非英語市場,數(shù)據(jù)的訓(xùn)練深度和準(zhǔn)確性仍不足以支撐高質(zhì)量的業(yè)務(wù)應(yīng)用。“每家企業(yè)的現(xiàn)有數(shù)據(jù)都很重要,因?yàn)槠髽I(yè)是依據(jù)自身特色出海。”
企業(yè)高質(zhì)量數(shù)據(jù)的稀缺,導(dǎo)致大模型在解決客戶的深度問題上還沒有呈現(xiàn)出絕對優(yōu)勢。“我認(rèn)為(當(dāng)下)距離大模型真正解決客戶問題還有一段路要走。”何恩培表示。
“過去企業(yè)把記錄和數(shù)據(jù)混在一起,他們認(rèn)為工單、硬盤(上的內(nèi)容)也是數(shù)據(jù),但這只能叫記錄和資料。”他指出,數(shù)據(jù)的價(jià)值并不在于存量,而在于其系統(tǒng)化以及可被機(jī)器學(xué)習(xí)和推理的程度。
在人工智能發(fā)展初期,行業(yè)普遍追求“大數(shù)據(jù)”——投入數(shù)量龐大的數(shù)據(jù)進(jìn)行訓(xùn)練,以換取更強(qiáng)大的模型能力。然而,當(dāng)大模型逐漸成為基礎(chǔ)設(shè)施時,數(shù)據(jù)的“質(zhì)量”將比“數(shù)量”更重要。
在何恩培看來,數(shù)據(jù)、參數(shù)和算法并非孤立存在,而是一種動態(tài)平衡關(guān)系;數(shù)據(jù)和參數(shù)規(guī)模在一定范圍內(nèi)能帶來性能增長,但算法創(chuàng)新才是突破“天花板”的關(guān)鍵。
早期開發(fā)翻譯軟件時,何恩培已經(jīng)體會到數(shù)據(jù)和規(guī)則規(guī)模的邊際效應(yīng)。“當(dāng)我們設(shè)定了1.5萬條翻譯規(guī)則時,效果非常好。但當(dāng)規(guī)則規(guī)模擴(kuò)展到2萬條(時),(效果)反而變差了。”原因很簡單,數(shù)據(jù)之間、規(guī)則之間存在沖突,統(tǒng)計(jì)概率的關(guān)系也可能產(chǎn)生矛盾——換句話說,數(shù)據(jù)或參數(shù)在某個階段的增加確實(shí)能帶來提升,但當(dāng)增長到一定程度,如果算法不突破,模型的質(zhì)量反而會下降。
數(shù)據(jù)問題是傳神語聯(lián)提出“數(shù)推分離”架構(gòu)的核心原因。何恩培回憶,最早在2021年,傳神語聯(lián)為法律行業(yè)開發(fā)了一套AI系統(tǒng),能夠?qū)W習(xí)過去十年的法律案例。然而客戶很快提出了一個關(guān)鍵問題:新產(chǎn)生的數(shù)據(jù)怎么辦,還要重新訓(xùn)練一次嗎?
這促使他們開始思考:如果數(shù)據(jù)和推理能夠分離,AI系統(tǒng)就可以在不依賴大規(guī)模訓(xùn)練的情況下,實(shí)現(xiàn)自我學(xué)習(xí)和進(jìn)化。“我們不需要把所有數(shù)據(jù)壓縮到神經(jīng)網(wǎng)絡(luò)里,而是讓推理大腦保持輕量化,同時支持實(shí)時學(xué)習(xí)。”何恩培解釋道,這種架構(gòu)不僅降低了模型的計(jì)算成本,還提高了適應(yīng)性,使其能夠在動態(tài)環(huán)境中不斷優(yōu)化自身。
DeepSeek熱潮后,知名投資人朱嘯虎曾提出,以后給數(shù)據(jù)打標(biāo)簽的(工作)都需要博士生來做。何恩培認(rèn)同這個觀點(diǎn):“我們現(xiàn)在在處理數(shù)據(jù)時,很多時候已經(jīng)是博士生在做了。”在當(dāng)下的人工智能熱潮中,數(shù)據(jù)的價(jià)值并不取決于它的數(shù)量,而取決于質(zhì)量,以及隱藏在其中的知識密度。
他舉例,如果一名律師在過去十年處理過500個案件,他的大腦中就沉淀了豐富的專業(yè)經(jīng)驗(yàn)。當(dāng)有人請教他相關(guān)的問題時,他不需要拿出所有的案卷逐條翻閱,而是可以直接給出綜合判斷和方法論,這位律師的大腦就是一個“行業(yè)大模型”,其價(jià)值在于知識的提煉,而不是原始數(shù)據(jù)的堆積。
何恩培認(rèn)為,AI的未來,也將走向這樣的方向。企業(yè)往往不愿意分享自己的高價(jià)值數(shù)據(jù),因?yàn)閿?shù)據(jù)往往涉及核心業(yè)務(wù)和商業(yè)秘密,但這并不意味著數(shù)據(jù)無法轉(zhuǎn)化為價(jià)值:“數(shù)據(jù)可以不外流,但由數(shù)據(jù)訓(xùn)練出的智能是可以共享的。”
“回看我們的成長路徑,從最早的2.1B模型,到現(xiàn)在的9B,我們從未在參數(shù)規(guī)模上盲目堆砌,也從未在算力上無止境投入。”何恩培表示,這并不是因?yàn)橘Y源不足,而是因?yàn)楣臼冀K認(rèn)為,這是一條更有效的技術(shù)路線。
在他的觀點(diǎn)中,衡量大模型價(jià)值的核心指標(biāo)并非參數(shù)規(guī)模,而是能否真正解決客戶的問題。這種路徑在行業(yè)內(nèi)也帶來了一定的認(rèn)知挑戰(zhàn),銷售和前端團(tuán)隊(duì)有時會遇到客戶的疑問:模型參數(shù)還不到100億,算得上是大模型嗎?“但當(dāng)客戶真正使用后,他們就會明白,關(guān)鍵不在參數(shù),而在效果。”
在當(dāng)下的科技語境中,“國產(chǎn)”“根技術(shù)”“0到1”已然成為熱詞,但在何恩培眼中,這些概念的邊界遠(yuǎn)比市場討論的更加復(fù)雜。
何恩培認(rèn)為,根技術(shù)是產(chǎn)品和應(yīng)用最基礎(chǔ)的底層能力,它可以是自己研發(fā)的,也可以是基于開源的,甚至是通過授權(quán)獲得的。但無論如何,“我們掌握了這項(xiàng)技術(shù),這項(xiàng)技術(shù)也屬于根技術(shù),掌握了根技術(shù),至少代表我們自己有了一定的主動性”。而“(從)0到1的技術(shù)”則等于是某項(xiàng)應(yīng)用發(fā)明,它既可以在應(yīng)用層,也可以在根層。
在他看來,AI的未來競爭,不僅僅是參數(shù)規(guī)模的競賽,而是底層技術(shù)框架的競爭,未來人工智能會衍生出無數(shù)的行業(yè)專用模型,而這些模型的底層架構(gòu)將決定它們的智能邊界。
“根原創(chuàng)”是何恩培提出的概念,他認(rèn)為這是根技術(shù)當(dāng)中最有生命力的一部分,“你只有在‘根’上創(chuàng)新,才能真正擁有自己的技術(shù)思想。”何恩培強(qiáng)調(diào),技術(shù)體系是帶有思想性的,如果所有的技術(shù)來源都依賴于外部的開源框架,就很難擺脫既有框架的思想束縛。而當(dāng)企業(yè)在根技術(shù)層面擁有自主權(quán)時,它不僅能擺脫對外部技術(shù)的依賴,還能決定自身技術(shù)演進(jìn)的方向,這才是最有創(chuàng)新價(jià)值的部分。
在商業(yè)層面,大模型競賽邁入第三年,關(guān)于大模型的商業(yè)模式、技術(shù)最終是不是應(yīng)該是免費(fèi)的,在行業(yè)內(nèi)越來越被關(guān)注。過去,許多科技公司的商業(yè)模式都是先“燒錢做免費(fèi)”,再通過其他方式盈利。例如,搜索引擎免費(fèi),但靠廣告賺錢;手游免費(fèi),但靠道具收費(fèi)。
然而,大模型的情況似乎更為復(fù)雜。何恩培的核心觀點(diǎn)是:To B(企業(yè)級)市場的AI服務(wù),不可能是免費(fèi)的。“企業(yè)使用AI的核心目的是解決業(yè)務(wù)問題,而解決問題就一定會有成本。”他說,“只是說在競爭中把成本降到最低,一定不會免費(fèi)。因?yàn)椋ㄒ坏┟赓M(fèi),它就缺乏了這項(xiàng)技術(shù)持續(xù)運(yùn)轉(zhuǎn)的能力,這由技術(shù)的稀缺性和商業(yè)模式共同決定。”
何恩培認(rèn)為,今天的大模型遠(yuǎn)遠(yuǎn)沒有成熟,市場格局還未定型,現(xiàn)在討論最終格局為時尚早。
當(dāng)前更像是1920年的電氣時代,電力技術(shù)已經(jīng)成熟,但沒人能想到后面還有那么多家電、設(shè)備會被發(fā)明出來。一方面,今天的大模型很多問題尚未解決,不可能像一個成熟產(chǎn)品一樣占領(lǐng)所有領(lǐng)域;另一方面,當(dāng)前市場競爭依舊集中在通用大模型方面,但垂直場景中的模型尚未爆發(fā)。“也許未來可能有一萬個AlphaFold在不同行業(yè),這才(會)形成大模型的完整生態(tài)。”何恩培說。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP