2026年人工智能,“正確數據”之戰打響……基於語義的設計將決定勝負

robot
摘要生成中

2025年是生成式人工智能(AI)成為產業核心議題、開啟"數據文藝復興"之年。但到2026年,重要性已超越單純獲取優質數據的層面,如何讓AI模型真正理解並運用"正確"數據的語義層(semantic layers)問題全面凸顯。這標誌著包含知識圖譜與本體、能明確數據上下文、語義及商業身份的語義化數據設計時代正式拉開帷幕。

去年"智能體"AI熱潮席捲整個產業界,眾多企業期待借此實現業務自動化與決策優化。但多數智能體AI未達預期,其運用數據的品質與語境適切性開始被視為根本原因。卡內基梅隆大學研究指出,當今智能體尚未接受足以處理複雜任務的充分訓練,且數據語境引發的推理錯誤會整體拉低性能。

在此背景下,數據準確性(Data Quality)與治理體系(Data Governance)是否發展至成熟水平成為重要議題。亞馬遜雲科技(AWS)等主要雲供應商雖仍提供龐大數據生態,但其新發布的數據相關技術與平台創新較上年有限。與之相對,IBM收購Confluent、微軟發布基於PostgreSQL的HorizonDB等事件,則象徵性地展現了數據技術棧的重構趨勢。

零ETL架構與數據共享技術已在2025年成為主流。這是簡化複雜脆弱數據管道的嘗試,例如Snowflake、Databricks等平台通過支持SAP或Salesforce數據對接,顯著提升了業務數據可存取性。

另一趨勢是向量數據處理技術的普及。多數主流數據平台增強了向量檢索與分析功能,甲骨文發布了融合結構化/非結構化數據的查詢功能,AWS也推出了向量優化型S3存儲層。由此為AI全面運用文件、圖像乃至企業內分散數據奠定了基礎。

最值得關注的變化正是語義層的價值重估。原本用於BI工具或ERP系統的這一層級,圍繞"指標"、“維度”、"明細"等核心概念,標準化了數據的含義與解讀方式。Tableau、Databricks、Snowflake、微軟等正加速引入語義層,其中微軟Fabric IQ更將企業本體概念融入現有語義層,力求保障即時AI分析的語境準確性。

在此趨勢下,以Snowflake為核心發起的開放語義交換倡議,旨在建立確保各AI及數據平台間語義層互操作性的通用標準。該架構基於dbt Labs的MetricFlow,通過YAML配置文件綜合定義指標與維度。但開源專案能否處理高價值語義資產,尤其應用供應商的共享意願,仍是未知數。

進一步看,獨立知識圖譜與GraphRAG等技術正作為AI精準理解語境的基礎設施受到關注。Neo4J、谷歌Vertex AI RAG引擎、微軟LazyGraphRAG等均致力於構建激活此類模式的技術基礎,實際應用案例也逐步增加。德勤、AdaptX等企業已在醫療、安防等複雜領域全面推進知識圖譜驅動的AI應用。

然而最大難題仍是本體建模人才短缺。在AI難以自主設計語義結構的情形下,知識工程師與語義架構師的需求反而激增。這令人聯想起數十年前的"知識管理"實踐困境,當前趨勢中,精準的語義解讀與業務關聯比單純數據收集更為關鍵。

歸根結底,AI時代的核心並非單純數據積累,而是能精準理解語義與語境的數據。2026年預計將成為語義影響力圈形成、各平台與應用展開主導權爭奪的轉折點。Snowflake、Databricks、SAP等企業的共享協作模式,正在塑造圍繞標準與生態的競爭格局,昭示著能為AI提供"正確"數據的企業終將掌握終極主導權。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)