建立認知主權(quán)下的全球數(shù)據(jù)戰(zhàn)略與安全新范式

本部要聞 來源：中譯語通日期：2025-09-04瀏覽次數(shù)：3085

圖片1.png

于洋在2025數(shù)博會“數(shù)據(jù)安全筑防”論壇上的發(fā)言

2025年1月8日，美國司法部正式發(fā)布《防止受關(guān)注國家獲取美國敏感個人數(shù)據(jù)和政府相關(guān)數(shù)據(jù)的規(guī)定》，以落實美國前總統(tǒng)拜登于2024年2月28日簽發(fā)的第14117號行政令。該最終規(guī)則于2025年4月8日正式生效，限制或禁止美國敏感個人數(shù)據(jù)和政府?dāng)?shù)據(jù)流向中國、俄羅斯等六個受關(guān)注國家及其相關(guān)涵蓋主體。涉及的敏感數(shù)據(jù)包括六類：身份驗證信息、個人財務(wù)信息、個人健康數(shù)據(jù)、生物識別數(shù)據(jù)、人類基因組數(shù)據(jù)與精準(zhǔn)地理位置信息。這意味著中美在科技與數(shù)據(jù)領(lǐng)域的脫鉤，正從“技術(shù)出口管制”進一步延伸至“個人數(shù)據(jù)防火墻”的建立。

2024年諾貝爾化學(xué)獎公布，一半共同授予德米斯·哈薩比斯和約翰·M·詹珀，“以表彰他們在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的成就”；另一半則授予大衛(wèi)·貝克，“以表彰在計算蛋白質(zhì)設(shè)計方面的貢獻”?；邶嫶蟮纳镄畔?shù)據(jù)，在大模型與超級算力的支撐下，基因測序分析、基因突變識別、藥物特性預(yù)測、靶點和藥物發(fā)現(xiàn)、臨床前實驗設(shè)計、老藥新用等多個方向的研究獲得了極大提升。

美國衛(wèi)星公司MAXAR拍攝了0.3m精度的伊朗福爾多核設(shè)施圖像，該設(shè)施曾被美國B-2轟炸機打擊。此外，合成孔徑雷達還拍攝了伊朗納塔茲核設(shè)施的衛(wèi)星圖像。在伊以沖突中，美西方在高精度的衛(wèi)星數(shù)據(jù)支撐下實現(xiàn)戰(zhàn)場上的“單向透明”。Airbus公司也通過0.3m精度衛(wèi)星拍攝了位于智利的太空望遠鏡高清圖像。這些案例體現(xiàn)出，地理空間數(shù)據(jù)在國防軍事、國家安全、應(yīng)急救援、智慧城市等諸多領(lǐng)域具有廣泛而重要的應(yīng)用潛力。

根據(jù)新摩爾定律，互聯(lián)網(wǎng)數(shù)據(jù)總量每12個月翻一倍。而AI智能體的超級摩爾定律，在過去的六年中，其完成任務(wù)能力每7個月就會提升一倍。預(yù)計未來幾年，這一增速還將以更驚人的幅度持續(xù)提升。中譯語通就是一家每日與這些數(shù)據(jù)、相關(guān)機構(gòu)、這些領(lǐng)域的用戶深度合作，并已連續(xù)四次被美國國防部列入“中國涉軍企業(yè)”的大數(shù)據(jù)和人工智能的企業(yè)。

2023年，美國防部發(fā)布《國防部數(shù)據(jù)戰(zhàn)略》，明確將數(shù)據(jù)定位為戰(zhàn)略資產(chǎn)，提出“使國防部成為以數(shù)據(jù)為中心的機構(gòu)，通過智能計算資源快速、規(guī)模化地使用數(shù)據(jù)，以獲取作戰(zhàn)優(yōu)勢和提高效率”的發(fā)展愿景。2025年7月23日美國白宮發(fā)布《贏得競賽：美國人工智能行動計劃》，提出“美國將主導(dǎo)建設(shè)全球最大、質(zhì)量最高的人工智能適用科學(xué)數(shù)據(jù)集，以加快構(gòu)建美國人工智能的競爭優(yōu)勢”。毋庸置疑，數(shù)據(jù)是戰(zhàn)略資產(chǎn)，是增強作戰(zhàn)準(zhǔn)備度的戰(zhàn)略資產(chǎn)，是增強科技研發(fā)效率的戰(zhàn)略資產(chǎn)，是加速新藥創(chuàng)新的戰(zhàn)略資產(chǎn)。數(shù)據(jù)也是戰(zhàn)略武器。戰(zhàn)略數(shù)據(jù)已經(jīng)成為大國博弈的新疆域，關(guān)乎國家安全。高質(zhì)量的戰(zhàn)略數(shù)據(jù)資源，也將重構(gòu)大國間人工智能競爭的格局。在此背景下，我們應(yīng)高度重視并加快推進中國自主的戰(zhàn)略數(shù)據(jù)儲備體系建設(shè)。

在這種復(fù)雜的國際博弈環(huán)境下，我們主張建立認知主權(quán)下的全球數(shù)據(jù)戰(zhàn)略與安全新范式——即在尊重各國數(shù)據(jù)主權(quán)的前提下，通過自主、安全、深入地理解與運用跨域數(shù)據(jù)，構(gòu)建決策智能新范式，以應(yīng)對數(shù)據(jù)跨境流動、主權(quán)爭議和安全威脅等日益嚴峻的問題，真正使數(shù)據(jù)成為國家競爭力、企業(yè)價值與個體權(quán)益的核心要素。

2015年中譯語通就提出了“跨語言大數(shù)據(jù)”的概念。這也是該詞匯首次在互聯(lián)網(wǎng)上出現(xiàn)。歷經(jīng)十余年發(fā)展，我們逐步構(gòu)建起從數(shù)據(jù)采集到可視化分析，從數(shù)據(jù)分析到知識圖譜、從機器翻譯到語音識別、從計算機視覺到AIGC、從大模型再到智能體的全棧技術(shù)與數(shù)據(jù)能力。我們努力跨越語言障礙，探尋數(shù)據(jù)的關(guān)聯(lián)，在多模態(tài)數(shù)據(jù)中尋找復(fù)雜數(shù)據(jù)世界的邏輯。認識到，復(fù)雜數(shù)據(jù)問題本質(zhì)上是治理問題，不是技術(shù)問題。

在數(shù)據(jù)能力方面，這些年來，我們已經(jīng)形成了千億級高質(zhì)量數(shù)據(jù)集、覆蓋全球200多個國家或地區(qū)、120種語言，超過200萬獨立數(shù)據(jù)源的數(shù)據(jù)挖掘能力?；诖竽Ｐ图夹g(shù)，我們還形成了將數(shù)據(jù)轉(zhuǎn)化為可理解、可推理的語義網(wǎng)絡(luò)的能力，發(fā)布了“格物”大模型。在昨日召開的“國防科技智能體應(yīng)用研討會”閉門會議上，我們正式發(fā)布了GTCOM AIP平臺。該平臺是一個驅(qū)動大模型進化、賦能智能體協(xié)同的動態(tài)、可計算、可演化的認知系統(tǒng)和數(shù)據(jù)融合中臺，通過為人工智能賦予“知識”與“規(guī)則”，使其認知和行為變得可解釋、可控制和可互操作。

掌握數(shù)據(jù)主權(quán)的關(guān)鍵并非數(shù)據(jù)本身，而在于數(shù)據(jù)處理和應(yīng)用的核心“大腦中樞”，即大模型驅(qū)動能力。當(dāng)前，僅依賴數(shù)據(jù)訓(xùn)練的大模型仍面臨幻覺頻出、認知層次淺、復(fù)雜任務(wù)執(zhí)行成功率低等問題。因此，我們需要一個新的認知層來為AI提供結(jié)構(gòu)化的世界模型。具體可以總結(jié)為認知感知與萃取層、本體構(gòu)建與演化層、智能體賦能與協(xié)同層三個層次。認知感知與萃取層負責(zé)精準(zhǔn)抽取實體、關(guān)系、事件、動作等核心本體要素，破除語言與語義壁壘，并解析圖像、音頻、視頻中的多模態(tài)信息，將其對齊至統(tǒng)一的語義本體表征空間，從而產(chǎn)出源源不斷的、經(jīng)過初步結(jié)構(gòu)化的“認知流”。接收到“認知流”后，大模型動態(tài)驅(qū)動構(gòu)建、維護和演化全局知識網(wǎng)絡(luò)，即本體，進而形成一個活的、持續(xù)成長的結(jié)構(gòu)化世界模型，成為所有推理與交互的“事實來源”。最后，將本體作為“行動綱領(lǐng)”，為每個智能體注入本體知識，定義復(fù)雜的任務(wù)流程和智能體角色，自動觸發(fā)并協(xié)調(diào)多個智能體協(xié)同完成一項宏任務(wù)。我們努力地在“高質(zhì)量數(shù)據(jù)集+本體+大模型+智能體”深度融合的基礎(chǔ)上，構(gòu)建可信任、可解釋、可協(xié)同的智能體生態(tài)。

當(dāng)我們擁有高質(zhì)量的數(shù)據(jù)集和戰(zhàn)略數(shù)據(jù)儲備，建立起可信數(shù)據(jù)空間，有了高性能的智能體之后，我們?nèi)孕枨逍训卣J識到：數(shù)據(jù)的價值在于流動。除了中文數(shù)據(jù)，還有規(guī)模更為龐大的全球數(shù)據(jù)。例如，在大宗貨品交易中計算大豆數(shù)據(jù)時，我們不僅需要中國的數(shù)據(jù)，還需要美國、巴西、澳大利亞等多國數(shù)據(jù)的支撐。當(dāng)我們進行生命科學(xué)和藥物研究的時候，中國以外的數(shù)據(jù)我們還缺少很多很多。寶貴的高質(zhì)量數(shù)據(jù)資源是中國的是世界的。我們應(yīng)在“一帶一路”框架下積極推進“全球可信數(shù)據(jù)空間”建設(shè)，踐行認知主權(quán)新范式，不斷提升我國在全球數(shù)據(jù)治理中的話語權(quán)。

在全球數(shù)據(jù)戰(zhàn)略及安全新范式下，我們應(yīng)在各參與方的數(shù)據(jù)源之上，共同構(gòu)建一個關(guān)于“深度應(yīng)用”的認知本體。該本體以跨語言、跨標(biāo)準(zhǔn)的方式，明確定義每一項關(guān)鍵里程碑指標(biāo)，如同為使用不同語言的人士提供一個通用的“世界語”來討論專業(yè)問題。我們倡導(dǎo)“可信計算”而非簡單數(shù)據(jù)共享。例如，不同區(qū)域的模型算法可通過平臺以加密查詢的方式，“請教”位于其他區(qū)域的本體層。系統(tǒng)在本地執(zhí)行計算，將脫敏后的模型參數(shù)或統(tǒng)計結(jié)果安全地返回給請求的系統(tǒng)。整個過程確保原始數(shù)據(jù)不出域，實現(xiàn)“可用不可見”，完全符合數(shù)據(jù)主權(quán)的規(guī)定。我們推行“智能治理”而非人工標(biāo)注。所有數(shù)據(jù)交互行為均被本體自動記錄，形成不可篡改的數(shù)據(jù)血緣。監(jiān)管機構(gòu)可隨時審計，確保每一次數(shù)據(jù)訪問都符合預(yù)設(shè)治理規(guī)則。這各機制為建立跨國間的監(jiān)管互信提供了堅實的技術(shù)基礎(chǔ)。

我們倡議在“認知主權(quán)”與“全球數(shù)據(jù)信任之網(wǎng)”的理念下，共同建設(shè)數(shù)據(jù)信任生態(tài)的發(fā)展愿景。在“一帶一路”框架下，我們愿以“GTCOM AIP”的能力為基礎(chǔ)，與全球的開發(fā)者、標(biāo)準(zhǔn)化組織及企業(yè)開展合作，共同定義并豐富各個行業(yè)的“認知本體”。從國防工業(yè)到金融風(fēng)控，從供應(yīng)鏈韌性到智慧城市，從新藥研發(fā)到地理空間研究，我們通過編織一張張垂直領(lǐng)域的“信任之網(wǎng)”，應(yīng)對全球性挑戰(zhàn)，為全球數(shù)字經(jīng)濟發(fā)展貢獻中國智慧與中國技術(shù)。

国产在线综合第一站-欧美视频在线观看免费-69堂成人精品免费视频-欧美视频在线观看免费-成人做爰www免费高清看视频-日韩欧一区二区三区

建立認知主權(quán)下的全球數(shù)據(jù)戰(zhàn)略與安全新范式

于洋在2025數(shù)博會“數(shù)據(jù)安全筑防”論壇上的發(fā)言

聯(lián)系我們