Gate 廣場創作者新春激勵正式開啟,發帖解鎖 $60,000 豪華獎池
如何參與:
報名活動表單:https://www.gate.com/questionnaire/7315
使用廣場任意發帖小工具,搭配文字發布內容即可
豐厚獎勵一覽:
發帖即可可瓜分 $25,000 獎池
10 位幸運用戶:獲得 1 GT + Gate 鸭舌帽
Top 發帖獎勵:發帖與互動越多,排名越高,贏取 Gate 新年周邊、Gate 雙肩包等好禮
新手專屬福利:首帖即得 $50 獎勵,繼續發帖还能瓜分 $10,000 新手獎池
活動時間:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/49112
2026年人工智能,“正確數據”之戰打響……基於語義的設計將決定勝負
2025年是生成式人工智能(AI)成為產業核心議題、開啟"數據文藝復興"之年。但到2026年,重要性已超越單純獲取優質數據的層面,如何讓AI模型真正理解並運用"正確"數據的語義層(semantic layers)問題全面凸顯。這標誌著包含知識圖譜與本體、能明確數據上下文、語義及商業身份的語義化數據設計時代正式拉開帷幕。
去年"智能體"AI熱潮席捲整個產業界,眾多企業期待借此實現業務自動化與決策優化。但多數智能體AI未達預期,其運用數據的品質與語境適切性開始被視為根本原因。卡內基梅隆大學研究指出,當今智能體尚未接受足以處理複雜任務的充分訓練,且數據語境引發的推理錯誤會整體拉低性能。
在此背景下,數據準確性(Data Quality)與治理體系(Data Governance)是否發展至成熟水平成為重要議題。亞馬遜雲科技(AWS)等主要雲供應商雖仍提供龐大數據生態,但其新發布的數據相關技術與平台創新較上年有限。與之相對,IBM收購Confluent、微軟發布基於PostgreSQL的HorizonDB等事件,則象徵性地展現了數據技術棧的重構趨勢。
零ETL架構與數據共享技術已在2025年成為主流。這是簡化複雜脆弱數據管道的嘗試,例如Snowflake、Databricks等平台通過支持SAP或Salesforce數據對接,顯著提升了業務數據可存取性。
另一趨勢是向量數據處理技術的普及。多數主流數據平台增強了向量檢索與分析功能,甲骨文發布了融合結構化/非結構化數據的查詢功能,AWS也推出了向量優化型S3存儲層。由此為AI全面運用文件、圖像乃至企業內分散數據奠定了基礎。
最值得關注的變化正是語義層的價值重估。原本用於BI工具或ERP系統的這一層級,圍繞"指標"、“維度”、"明細"等核心概念,標準化了數據的含義與解讀方式。Tableau、Databricks、Snowflake、微軟等正加速引入語義層,其中微軟Fabric IQ更將企業本體概念融入現有語義層,力求保障即時AI分析的語境準確性。
在此趨勢下,以Snowflake為核心發起的開放語義交換倡議,旨在建立確保各AI及數據平台間語義層互操作性的通用標準。該架構基於dbt Labs的MetricFlow,通過YAML配置文件綜合定義指標與維度。但開源專案能否處理高價值語義資產,尤其應用供應商的共享意願,仍是未知數。
進一步看,獨立知識圖譜與GraphRAG等技術正作為AI精準理解語境的基礎設施受到關注。Neo4J、谷歌Vertex AI RAG引擎、微軟LazyGraphRAG等均致力於構建激活此類模式的技術基礎,實際應用案例也逐步增加。德勤、AdaptX等企業已在醫療、安防等複雜領域全面推進知識圖譜驅動的AI應用。
然而最大難題仍是本體建模人才短缺。在AI難以自主設計語義結構的情形下,知識工程師與語義架構師的需求反而激增。這令人聯想起數十年前的"知識管理"實踐困境,當前趨勢中,精準的語義解讀與業務關聯比單純數據收集更為關鍵。
歸根結底,AI時代的核心並非單純數據積累,而是能精準理解語義與語境的數據。2026年預計將成為語義影響力圈形成、各平台與應用展開主導權爭奪的轉折點。Snowflake、Databricks、SAP等企業的共享協作模式,正在塑造圍繞標準與生態的競爭格局,昭示著能為AI提供"正確"數據的企業終將掌握終極主導權。