Tác giả: Sebastian Melendez Nguồn: Artemis Dịch: Thiện Oppa, Jinse财经
Stablecoin là tâm điểm của thị trường hiện tại. Hầu như mỗi ngày đều có tin tức quan trọng được phát ra. Tuần trước, Stripe thông báo sẽ mua lại công ty dịch vụ ví Privy, trong khi PayPal thông báo sẽ khai thác PYUSD trên Stellar. Tin tức dồn dập khiến người ta khó lòng theo kịp. Khi ngày càng nhiều công ty tham gia vào lĩnh vực này, nhu cầu theo dõi và lấy dữ liệu về stablecoin ngày càng tăng cao. Tuy nhiên, từ những gì chúng tôi giao tiếp với khách hàng, mọi người luôn lặp đi lặp lại bốn câu hỏi:
Công việc của tôi tại Artemis là thu thập, sắp xếp và tổng hợp dữ liệu stablecoin hàng ngày để trả lời những câu hỏi này. Hôm nay, chúng ta sẽ lật tẩy một số lầm tưởng về dữ liệu “tưởng chừng đơn giản” và xem những câu hỏi này khó trả lời như thế nào.
Chi phí truy cập độc lập vào dữ liệu trên chuỗi là quá cao và rào cản kỹ thuật để gia nhập là cực kỳ cao. Mặc dù khả năng tiếp cận dữ liệu blockchain thô đã được cải thiện trong năm năm qua, nhưng vẫn còn nhiều rào cản. Các nhà cung cấp dữ liệu lớn như Dune, Flipside, Allium và Goldsky có lợi thế của họ, nhưng không có nhà cung cấp nào bao gồm tất cả các blockchain chính.
Tình huống thực tế:
Hầu hết mọi công ty hiện đang tung ra blockchain của riêng mình, mỗi công ty đều có các tính năng kỳ lạ riêng khiến việc phân tích dữ liệu trở nên cực kỳ phức tạp.
Nếu bạn muốn hiểu rõ về mô hình sử dụng stablecoin của mình và khám phá các cơ hội tiềm năng, bạn cần có thể thực hiện phân tích toàn cảnh trên tất cả các chuỗi liên quan, không chỉ trên nền tảng hiện có. Khi chiến lược đa chuỗi phát triển và nhu cầu phân tích sâu hơn, độ phức tạp của cơ sở hạ tầng dữ liệu cũng tăng lên.
Lấy PYUSD làm ví dụ:
Một khi bạn tích hợp giao thức OFT đa chuỗi của LayerZero, để thực sự nhìn thấy toàn cảnh, bạn cần nắm vững:
Tệ hơn nữa, người dùng có thể chuyển token qua nhiều nền tảng khác, điều này làm cho vấn đề dữ liệu trở nên phức tạp gấp bội.
Vấn đề không chỉ nằm ở chuỗi mà bạn hiện đang triển khai, mà còn ở việc toàn bộ hệ sinh thái liên tục mở rộng, các chuỗi mới liên tục xuất hiện. Điều này dẫn đến vấn đề thứ hai: sự phân mảnh kiến trúc.
Hãy nhớ lại đầu những năm 2000, khi bạn gửi một tệp cho người khác, không có nghĩa là bên nhận có thể mở được. PowerPoint không mở được, video thiếu bộ giải mã, hệ thống mỗi nơi một kiểu, mọi thứ đều không thể hợp tác liền mạch. Ngay cả học sinh tiểu học cũng đã bị những vấn đề này làm phiền.
Thế giới blockchain hiện nay cũng hỗn loạn như những năm trước.
Chuỗi hoạt động tích cực nhất hiện nay - Solana, Tron, Ethereum, TON, Stellar, Aptos - kiến trúc dữ liệu của chúng khác nhau một trời một vực.
Đưa ra một vài ví dụ:
Hiểu những hoạt động trên chuỗi có nghĩa là bạn phải phân tích một mạng lưới công nghệ ngày càng phức tạp.
Xem lại PYUSD:
Trước đây chỉ cần hiểu kiến trúc của Ethereum, Solana và LayerZero. Nhưng giờ đây, khi nó đã xuất hiện trên Stellar, bạn còn phải hiểu:
Nền tảng hợp đồng thông minh của Stellar, Soroban,
Có nghĩa là, bạn thậm chí phải trở thành một chuyên gia về một chuỗi nào đó để có thể truy cập và giải mã dữ liệu, chưa nói đến việc rút ra những hiểu biết từ đó.
Nhiều người nghĩ rằng: chỉ cần giải quyết vấn đề truy cập dữ liệu, tiếp theo sẽ dễ dàng có được những cái nhìn về người dùng. Giả sử bạn đã hoàn thành quyền truy cập, nắm được toàn bộ chuỗi dữ liệu về số dư, giao dịch chuyển khoản, vậy bạn đã nhận được gì?
Câu trả lời là: Một đống tiếng ồn.
Địa chỉ trên chuỗi chỉ là một chuỗi chữ cái và số, số dư ví thường không chính xác hoặc có thể gây hiểu lầm. Dữ liệu blockchain gốc không bằng với cái nhìn sâu sắc, nó chỉ là một đống dữ liệu lộn xộn, cần phải trải qua việc làm sạch và chế biến cực kỳ phức tạp để trở nên có giá trị.
**Thực tế là: Để hiểu những gì xảy ra trên chuỗi, **không thể tách rời khỏi bối cảnh và dữ liệu ngoài chuỗi
Ngay cả khi bạn đã nỗ lực thu thập dữ liệu trên chuỗi, bạn vẫn không thể trả lời những câu hỏi quan trọng: Ai đang sử dụng stablecoin của bạn? Họ ở đâu?
Điều duy nhất bạn có thể nói là: “Stablecoin của tôi đã được sử dụng.” Điều này không có tính khả thi và cũng không thể giúp bạn hiểu: hành vi của người dùng, tình hình thâm nhập thị trường, cơ hội tăng trưởng. Để đạt được những hiểu biết này, bạn phải dựa vào ngữ cảnh ngoài chuỗi. Vấn đề thực sự là: bạn cần dữ liệu ngoài chuỗi gì, và làm thế nào để có được?
Thẻ ứng dụng và giao thức: Không có nguồn tin cậy duy nhất để mã hóa hoạt động trên chuỗi. Flipside, Dune, Open Label Initiative, Block Explorer, Arkham - tất cả đều cung cấp một số thông tin, nhưng mỗi loại đều có mô hình riêng và phạm vi bảo hiểm hạn chế. Để trả lời các câu hỏi như “Ứng dụng nào được sử dụng cho địa chỉ này?” “hoặc” Chúng ta đang thấy những loại trường hợp sử dụng nào? Bạn sẽ cần hợp nhất các nguồn thẻ phân mảnh này và gắn thẻ các địa chỉ ví quan trọng theo cách thủ công. Nếu không, bạn sẽ chỉ có thể sử dụng dữ liệu giao dịch thô, dữ liệu này không cung cấp bất kỳ thông tin nào về mô hình sử dụng thực tế.
Tình hình thực tế là việc giải quyết vấn đề nhãn này cần rất nhiều tài nguyên và mối quan hệ trong ngành. Bạn cần thiết lập quan hệ đối tác với các L1 chính và các giao thức để xây dựng một tập dữ liệu nhãn toàn diện. Hầu hết các đội không có đủ băng thông hoặc kết nối để xử lý vấn đề này một cách thủ công - đó là lý do nhiều công việc phân tích gặp khó khăn ngay sau khi có được dữ liệu blockchain gốc. Lớp ngữ cảnh mới thực sự là nơi bắt đầu công việc.
Công nghệ blockchain phức tạp hơn nhiều so với những gì bề ngoài cho thấy. Mặc dù trong vài năm qua, ngành công nghiệp đã bắt đầu chuẩn hóa quanh các mô hình thiết kế cụ thể cho việc chuyển giao token, nhưng điều này không phải lúc nào cũng xảy ra. Khi công nghệ cầu nối lần đầu tiên phổ biến, không có tiêu chuẩn cộng đồng nào để theo dõi các hoạt động xuyên chuỗi. Điều này đã gây ra sự nhầm lẫn khi cố gắng theo dõi chính xác số dư và chuyển khoản - đặc biệt là đối với những token đã tồn tại đủ lâu trước khi các tiêu chuẩn này được ban hành. Bạn cần phải hiểu lịch sử và đặc điểm cụ thể của từng chuỗi để có được dữ liệu chính xác.
Thực tế: Mô hình “cơ sở dữ liệu trên blockchain” luôn thay đổi -** bạn phải trở thành “nhà sử học trên chuỗi” để có được dữ liệu chính xác**
Chúng ta rất dễ quên rằng các hệ sinh thái này đang thay đổi liên tục. Lấy Solana làm ví dụ, kiến trúc của nó (cách thức hoạt động của blockchain) và chương trình token (cách tạo và chuyển token) đã được nâng cấp đáng kể.
Dựa trên điều này, người ta thường nghe nói rằng blockchain là một cơ sở dữ liệu không thể thay đổi, công khai và chỉ có thể thêm vào. Mặc dù điều này hiện nay là phổ biến, nhưng ở giai đoạn đầu không phải lúc nào cũng như vậy. Sự lạc quan là một ví dụ tốt - họ không chỉ trải qua một sự kiện khởi đầu rồi phát hành. Thực tế, vài tháng sau họ đã hoàn toàn tái khởi động.
Kết quả như thế nào? Không có tập dữ liệu hoàn chỉnh nào về tất cả các chuyển động token trên chuỗi Optimism gốc.
Tại sao điều này quan trọng? Những dữ liệu bị thiếu này rất quan trọng để hiểu hoạt động hiện tại và lịch sử của các stablecoin chính trên mạng chính OP (bao gồm USDC, USDT và DAI). Nếu không có những dữ liệu này, bạn sẽ không thể có được bộ dữ liệu đầy đủ và cũng không thể tính toán số dư ví chính xác.
Việc xây dựng một bộ dữ liệu chính xác cần phải trở thành một nhà sử học blockchain. Hiểu được sự tiến hóa tinh vi của mỗi chuỗi và giải thích tất cả những khác biệt lịch sử này cần nhiều năm nỗ lực.
Dữ liệu blockchain phải đối mặt với những thách thức độc đáo mà không tồn tại trong các ngành khác. Mặc dù về lý thuyết là “mở và minh bạch”, nhưng để trích xuất ra những hiểu biết có ý nghĩa, thực sự cần dữ liệu ngoài chuỗi, tích hợp từ hàng chục nhà cung cấp dịch vụ dữ liệu, đọc thông tin ngữ cảnh rải rác trên Twitter về tiền điện tử và tài liệu chính thức, cùng với một đội ngũ kỹ sư hơn 10 người. Nếu không, bạn chỉ đang mò mẫm trong bóng tối, đuổi theo một thị trường ảo biến đổi với tốc độ ánh sáng.