本部要聞 來源:中譯語通日期:2025-09-04瀏覽次數(shù):3085

2025年1月8日,美國司法部正式發(fā)布《防止受關(guān)注國家獲取美國敏感個人數(shù)據(jù)和政府相關(guān)數(shù)據(jù)的規(guī)定》,以落實美國前總統(tǒng)拜登于2024年2月28日簽發(fā)的第14117號行政令。該最終規(guī)則于2025年4月8日正式生效,限制或禁止美國敏感個人數(shù)據(jù)和政府?dāng)?shù)據(jù)流向中國、俄羅斯等六個受關(guān)注國家及其相關(guān)涵蓋主體。涉及的敏感數(shù)據(jù)包括六類:身份驗證信息、個人財務(wù)信息、個人健康數(shù)據(jù)、生物識別數(shù)據(jù)、人類基因組數(shù)據(jù)與精準(zhǔn)地理位置信息。這意味著中美在科技與數(shù)據(jù)領(lǐng)域的脫鉤,正從“技術(shù)出口管制”進一步延伸至“個人數(shù)據(jù)防火墻”的建立。
2024年諾貝爾化學(xué)獎公布,一半共同授予德米斯·哈薩比斯和約翰·M·詹珀,“以表彰他們在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的成就”;另一半則授予大衛(wèi)·貝克,“以表彰在計算蛋白質(zhì)設(shè)計方面的貢獻”?;邶嫶蟮纳镄畔?shù)據(jù),在大模型與超級算力的支撐下,基因測序分析、基因突變識別、藥物特性預(yù)測、靶點和藥物發(fā)現(xiàn)、臨床前實驗設(shè)計、老藥新用等多個方向的研究獲得了極大提升。
美國衛(wèi)星公司MAXAR拍攝了0.3m精度的伊朗福爾多核設(shè)施圖像,該設(shè)施曾被美國B-2轟炸機打擊。此外,合成孔徑雷達還拍攝了伊朗納塔茲核設(shè)施的衛(wèi)星圖像。在伊以沖突中,美西方在高精度的衛(wèi)星數(shù)據(jù)支撐下實現(xiàn)戰(zhàn)場上的“單向透明”。Airbus公司也通過0.3m精度衛(wèi)星拍攝了位于智利的太空望遠鏡高清圖像。這些案例體現(xiàn)出,地理空間數(shù)據(jù)在國防軍事、國家安全、應(yīng)急救援、智慧城市等諸多領(lǐng)域具有廣泛而重要的應(yīng)用潛力。
根據(jù)新摩爾定律,互聯(lián)網(wǎng)數(shù)據(jù)總量每12個月翻一倍。而AI智能體的超級摩爾定律,在過去的六年中,其完成任務(wù)能力每7個月就會提升一倍。預(yù)計未來幾年,這一增速還將以更驚人的幅度持續(xù)提升。中譯語通就是一家每日與這些數(shù)據(jù)、相關(guān)機構(gòu)、這些領(lǐng)域的用戶深度合作,并已連續(xù)四次被美國國防部列入“中國涉軍企業(yè)”的大數(shù)據(jù)和人工智能的企業(yè)。
2023年,美國防部發(fā)布《國防部數(shù)據(jù)戰(zhàn)略》,明確將數(shù)據(jù)定位為戰(zhàn)略資產(chǎn),提出“使國防部成為以數(shù)據(jù)為中心的機構(gòu),通過智能計算資源快速、規(guī)模化地使用數(shù)據(jù),以獲取作戰(zhàn)優(yōu)勢和提高效率”的發(fā)展愿景。2025年7月23日美國白宮發(fā)布《贏得競賽:美國人工智能行動計劃》,提出“美國將主導(dǎo)建設(shè)全球最大、質(zhì)量最高的人工智能適用科學(xué)數(shù)據(jù)集,以加快構(gòu)建美國人工智能的競爭優(yōu)勢”。 毋庸置疑,數(shù)據(jù)是戰(zhàn)略資產(chǎn),是增強作戰(zhàn)準(zhǔn)備度的戰(zhàn)略資產(chǎn),是增強科技研發(fā)效率的戰(zhàn)略資產(chǎn),是加速新藥創(chuàng)新的戰(zhàn)略資產(chǎn)。數(shù)據(jù)也是戰(zhàn)略武器。戰(zhàn)略數(shù)據(jù)已經(jīng)成為大國博弈的新疆域,關(guān)乎國家安全。高質(zhì)量的戰(zhàn)略數(shù)據(jù)資源,也將重構(gòu)大國間人工智能競爭的格局。在此背景下,我們應(yīng)高度重視并加快推進中國自主的戰(zhàn)略數(shù)據(jù)儲備體系建設(shè)。
在這種復(fù)雜的國際博弈環(huán)境下,我們主張建立認知主權(quán)下的全球數(shù)據(jù)戰(zhàn)略與安全新范式——即在尊重各國數(shù)據(jù)主權(quán)的前提下,通過自主、安全、深入地理解與運用跨域數(shù)據(jù),構(gòu)建決策智能新范式,以應(yīng)對數(shù)據(jù)跨境流動、主權(quán)爭議和安全威脅等日益嚴峻的問題,真正使數(shù)據(jù)成為國家競爭力、企業(yè)價值與個體權(quán)益的核心要素。
2015年中譯語通就提出了“跨語言大數(shù)據(jù)”的概念。這也是該詞匯首次在互聯(lián)網(wǎng)上出現(xiàn)。歷經(jīng)十余年發(fā)展,我們逐步構(gòu)建起從數(shù)據(jù)采集到可視化分析,從數(shù)據(jù)分析到知識圖譜、從機器翻譯到語音識別、從計算機視覺到AIGC、從大模型再到智能體的全棧技術(shù)與數(shù)據(jù)能力。我們努力跨越語言障礙,探尋數(shù)據(jù)的關(guān)聯(lián),在多模態(tài)數(shù)據(jù)中尋找復(fù)雜數(shù)據(jù)世界的邏輯。認識到,復(fù)雜數(shù)據(jù)問題本質(zhì)上是治理問題,不是技術(shù)問題。
在數(shù)據(jù)能力方面,這些年來,我們已經(jīng)形成了千億級高質(zhì)量數(shù)據(jù)集、覆蓋全球200多個國家或地區(qū)、120種語言,超過200萬獨立數(shù)據(jù)源的數(shù)據(jù)挖掘能力?;诖竽P图夹g(shù),我們還形成了將數(shù)據(jù)轉(zhuǎn)化為可理解、可推理的語義網(wǎng)絡(luò)的能力,發(fā)布了“格物”大模型。在昨日召開的“國防科技智能體應(yīng)用研討會”閉門會議上,我們正式發(fā)布了GTCOM AIP平臺。該平臺是一個驅(qū)動大模型進化、賦能智能體協(xié)同的動態(tài)、可計算、可演化的認知系統(tǒng)和數(shù)據(jù)融合中臺,通過為人工智能賦予“知識”與“規(guī)則”,使其認知和行為變得可解釋、可控制和可互操作。
掌握數(shù)據(jù)主權(quán)的關(guān)鍵并非數(shù)據(jù)本身,而在于數(shù)據(jù)處理和應(yīng)用的核心“大腦中樞”,即大模型驅(qū)動能力。當(dāng)前,僅依賴數(shù)據(jù)訓(xùn)練的大模型仍面臨幻覺頻出、認知層次淺、復(fù)雜任務(wù)執(zhí)行成功率低等問題。因此,我們需要一個新的認知層來為AI提供結(jié)構(gòu)化的世界模型。具體可以總結(jié)為認知感知與萃取層、本體構(gòu)建與演化層、智能體賦能與協(xié)同層三個層次。認知感知與萃取層負責(zé)精準(zhǔn)抽取實體、關(guān)系、事件、動作等核心本體要素,破除語言與語義壁壘,并解析圖像、音頻、視頻中的多模態(tài)信息,將其對齊至統(tǒng)一的語義本體表征空間,從而產(chǎn)出源源不斷的、經(jīng)過初步結(jié)構(gòu)化的“認知流”。接收到“認知流”后,大模型動態(tài)驅(qū)動構(gòu)建、維護和演化全局知識網(wǎng)絡(luò),即本體,進而形成一個活的、持續(xù)成長的結(jié)構(gòu)化世界模型,成為所有推理與交互的“事實來源”。最后,將本體作為“行動綱領(lǐng)”,為每個智能體注入本體知識,定義復(fù)雜的任務(wù)流程和智能體角色,自動觸發(fā)并協(xié)調(diào)多個智能體協(xié)同完成一項宏任務(wù)。我們努力地在“高質(zhì)量數(shù)據(jù)集+本體+大模型+智能體”深度融合的基礎(chǔ)上,構(gòu)建可信任、可解釋、可協(xié)同的智能體生態(tài)。
當(dāng)我們擁有高質(zhì)量的數(shù)據(jù)集和戰(zhàn)略數(shù)據(jù)儲備,建立起可信數(shù)據(jù)空間,有了高性能的智能體之后,我們?nèi)孕枨逍训卣J識到:數(shù)據(jù)的價值在于流動。除了中文數(shù)據(jù),還有規(guī)模更為龐大的全球數(shù)據(jù)。例如,在大宗貨品交易中計算大豆數(shù)據(jù)時,我們不僅需要中國的數(shù)據(jù),還需要美國、巴西、澳大利亞等多國數(shù)據(jù)的支撐。當(dāng)我們進行生命科學(xué)和藥物研究的時候,中國以外的數(shù)據(jù)我們還缺少很多很多。寶貴的高質(zhì)量數(shù)據(jù)資源是中國的是世界的。我們應(yīng)在“一帶一路”框架下積極推進“全球可信數(shù)據(jù)空間”建設(shè),踐行認知主權(quán)新范式,不斷提升我國在全球數(shù)據(jù)治理中的話語權(quán)。
在全球數(shù)據(jù)戰(zhàn)略及安全新范式下,我們應(yīng)在各參與方的數(shù)據(jù)源之上,共同構(gòu)建一個關(guān)于“深度應(yīng)用”的認知本體。該本體以跨語言、跨標(biāo)準(zhǔn)的方式,明確定義每一項關(guān)鍵里程碑指標(biāo),如同為使用不同語言的人士提供一個通用的“世界語”來討論專業(yè)問題。我們倡導(dǎo)“可信計算”而非簡單數(shù)據(jù)共享。例如,不同區(qū)域的模型算法可通過平臺以加密查詢的方式,“請教”位于其他區(qū)域的本體層。系統(tǒng)在本地執(zhí)行計算,將脫敏后的模型參數(shù)或統(tǒng)計結(jié)果安全地返回給請求的系統(tǒng)。整個過程確保原始數(shù)據(jù)不出域,實現(xiàn)“可用不可見”,完全符合數(shù)據(jù)主權(quán)的規(guī)定。我們推行“智能治理”而非人工標(biāo)注。所有數(shù)據(jù)交互行為均被本體自動記錄,形成不可篡改的數(shù)據(jù)血緣。監(jiān)管機構(gòu)可隨時審計,確保每一次數(shù)據(jù)訪問都符合預(yù)設(shè)治理規(guī)則。這各機制為建立跨國間的監(jiān)管互信提供了堅實的技術(shù)基礎(chǔ)。
我們倡議在“認知主權(quán)”與“全球數(shù)據(jù)信任之網(wǎng)”的理念下,共同建設(shè)數(shù)據(jù)信任生態(tài)的發(fā)展愿景。在“一帶一路”框架下,我們愿以“GTCOM AIP”的能力為基礎(chǔ),與全球的開發(fā)者、標(biāo)準(zhǔn)化組織及企業(yè)開展合作,共同定義并豐富各個行業(yè)的“認知本體”。從國防工業(yè)到金融風(fēng)控,從供應(yīng)鏈韌性到智慧城市,從新藥研發(fā)到地理空間研究,我們通過編織一張張垂直領(lǐng)域的“信任之網(wǎng)”,應(yīng)對全球性挑戰(zhàn),為全球數(shù)字經(jīng)濟發(fā)展貢獻中國智慧與中國技術(shù)。