
Mã nhị phân máy tính là hệ thống biểu diễn thông tin dưới dạng chuỗi số 0 và 1, được sử dụng để mã hóa cả dữ liệu và lệnh. Trong hệ này, “0” và “1” tương ứng với hai trạng thái ổn định của mạch điện tử, giúp phần cứng dễ dàng nhận diện và thực thi chỉ thị.
Đơn vị nhỏ nhất của hệ nhị phân là “bit”, giống như một công tắc. Tám bit tạo thành một “byte”, thường được dùng để lưu trữ một ký tự hoặc một số nhỏ. Ví dụ, chuỗi nhị phân “10110010” gồm 8 bit, tương đương một byte.
Máy tính sử dụng mã nhị phân vì transistor trong phần cứng có thể phân biệt rõ ràng hai trạng thái, giúp tăng khả năng chống nhiễu và đơn giản hóa quy trình sản xuất và khuếch đại tín hiệu.
Hệ nhị phân còn giúp cấu trúc tính toán và lưu trữ trở nên đơn giản hơn. Cổng logic—về bản chất là các tổ hợp công tắc—hoạt động tự nhiên với hệ nhị phân, cho phép thực hiện hiệu quả các phép toán số học và logic trong mạch. Khi xảy ra lỗi truyền dẫn, những phương pháp đơn giản như bit chẵn lẻ cũng giúp phát hiện vấn đề.
Khi biểu diễn số, mã nhị phân của máy tính gán mỗi bit là một lũy thừa của hai. Ví dụ, số thập phân 13 được viết thành nhị phân 1101 vì 8 + 4 + 1 = 13.
Số âm thường được biểu diễn bằng “bù hai”, tức là đảo từng bit của giá trị tuyệt đối rồi cộng thêm 1, tạo ra chuẩn chung để mạch thực hiện phép cộng và trừ.
Để biểu diễn văn bản, “mã hóa ký tự” sẽ ánh xạ ký hiệu thành số, sau đó chuyển thành nhị phân. Ví dụ, ký tự “A” được mã hóa thành 65, tức 01000001 trong nhị phân. Ký tự Trung Quốc thường dùng mã hóa UTF-8, mỗi ký tự chiếm 3 byte; ví dụ, ký tự “链” có mã UTF-8 là e9 93 be (thập lục phân), tương đương 24 bit nhị phân.
Do mã nhị phân thô quá dài và khó đọc với con người, hệ thập lục phân (cơ số 16) cung cấp ký hiệu ngắn gọn hơn. Mỗi ký tự thập lục phân biểu diễn chính xác bốn bit nhị phân, giúp việc đọc và ghi dễ dàng hơn.
Ví dụ, 0x1f tương ứng với nhị phân 00011111. Ngược lại, nhóm các chữ số nhị phân thành bộ bốn rồi ánh xạ sang giá trị từ 0 đến f sẽ ra thập lục phân. Nhiều địa chỉ blockchain và mã băm giao dịch được hiển thị dưới dạng chuỗi thập lục phân bắt đầu bằng 0x—đây chỉ là một cách biểu diễn khác của cùng dữ liệu nhị phân gốc.
Trong hệ thống blockchain, khối, giao dịch, tài khoản và các thành phần khác đều được lưu dưới dạng dãy byte—tức là mã nhị phân máy tính. Để dễ đọc, các trình khám phá khối thường hiển thị dữ liệu này ở định dạng thập lục phân.
Ví dụ với hợp đồng thông minh: sau khi triển khai lên chuỗi, hợp đồng sẽ được chuyển thành “bytecode”—một chuỗi chỉ thị nhị phân. Ethereum Virtual Machine (EVM) sẽ đọc từng byte, mỗi byte tương ứng một opcode (ví dụ, 0x60 nghĩa là PUSH1). EVM sử dụng kích thước từ 256 bit để xử lý hiệu quả các phép toán số nguyên lớn trên chuỗi.
Một cây Merkle tổ chức giao dịch bằng cách tổng hợp “dấu vân tay” của chúng. Mỗi mã băm giao dịch—hàm nén dữ liệu bất kỳ thành dấu vân tay cố định—có độ dài 32 byte nhị phân. Các mã băm này được hợp nhất từng lớp để tạo ra mã gốc 32 byte lưu trong tiêu đề khối.
Trên các nền tảng giao dịch như Gate, chi tiết nạp tiền sẽ hiển thị mã băm giao dịch (TXID) hoặc địa chỉ bắt đầu bằng 0x. Đây là các biểu diễn thập lục phân của dữ liệu nhị phân gốc, giúp người dùng dễ kiểm tra và sao chép thông tin.
Chữ ký mật mã và địa chỉ đều được sinh ra từ mã nhị phân máy tính. Khóa riêng là một số ngẫu nhiên 256 bit—có thể hình dung như một tổ hợp duy nhất trong 256 công tắc. Khóa công khai tương ứng được tính toán từ khóa riêng và dùng để xác thực chữ ký.
Trên Ethereum, địa chỉ thường được tạo bằng cách lấy 20 byte cuối (160 bit) của mã băm Keccak-256 của khóa công khai, rồi hiển thị dưới dạng chuỗi thập lục phân bắt đầu bằng 0x và có 40 ký tự. EIP-55 đưa ra định dạng “kiểm tra tổng hợp chữ hoa-thường” nhằm phát hiện lỗi nhập tay.
Trên Bitcoin, địa chỉ phổ biến bắt đầu bằng “1” hoặc “3” dùng mã hóa Base58Check: sau khi thêm mã kiểm tra vào dữ liệu nhị phân gốc, sẽ được hiển thị bằng 58 ký tự dễ phân biệt nhằm giảm nhầm lẫn. Địa chỉ Bech32 bắt đầu bằng “bc1” cũng tích hợp sẵn mã kiểm tra để tăng khả năng chống lỗi.
Bản thân chữ ký là tổ hợp các số nhị phân. Ví dụ, chữ ký dựa trên đường cong secp256k1 gồm hai số—r và s—mỗi số thường có độ dài bằng tham số bảo mật 256 bit của hệ thống. Các giá trị này cuối cùng được mã hóa thành chuỗi dễ đọc để truyền tải.
Bước 1: Nhận biết tiền tố và kiểu mã hóa. Chuỗi bắt đầu bằng “0x” thường là thập lục phân; “0b” là nhị phân; địa chỉ Bitcoin bắt đầu bằng “1” hoặc “3” dùng Base58Check; bắt đầu bằng “bc1” dùng Bech32; địa chỉ Ethereum thường bắt đầu bằng “0x”.
Bước 2: Chuyển đổi giữa các hệ số. Mỗi ký tự thập lục phân tương ứng với bốn ký tự nhị phân; nhóm dữ liệu thành từng bộ bốn rồi ánh xạ sang giá trị từ 0 đến f hoặc chuyển ngược về nhị phân.
Bước 3: Tách trường theo byte. Ví dụ, địa chỉ Ethereum dài 20 byte; các mã băm phổ biến như SHA-256 dài 32 byte. Việc tách theo byte giúp đối chiếu tài liệu và tiêu chuẩn.
Bước 4: Kiểm tra mã kiểm tra tổng. Cả Base58Check và Bech32 đều tích hợp mã kiểm tra giúp phát hiện phần lớn lỗi nhập liệu. Với địa chỉ EIP-55, kiểm tra xem mẫu chữ hoa/thường có khớp quy tắc kiểm tra tổng không.
Bước 5: Phân tích bytecode hợp đồng. Khi gặp chuỗi bytecode hợp đồng dài bắt đầu bằng “0x”, có thể dùng công cụ mã nguồn mở để ánh xạ từng byte sang opcode và xác thực các lệnh như PUSH, JUMP, SSTORE... Trên Gate, luôn kiểm tra tên chuỗi và kiểu mã hóa địa chỉ trước khi sử dụng trình khám phá blockchain để phân tích sâu hơn.
Một hiểu lầm phổ biến là coi thập lục phân là “mã hóa”. Thập lục phân chỉ là định dạng hiển thị—ai cũng có thể chuyển ngược về nhị phân; không mang lại quyền riêng tư hay bảo mật.
Bỏ qua mã kiểm tra phân biệt chữ hoa/thường mang lại rủi ro. Với địa chỉ Ethereum EIP-55, định dạng chữ hoa-thường là lớp xác thực; chuyển tất cả sang chữ thường sẽ loại bỏ lớp bảo vệ này và tăng nguy cơ sai sót khi nhập tay.
Hiểu sai thứ tự byte có thể dẫn đến đọc dữ liệu sai. Một số hệ thống dùng thứ tự little-endian bên trong nhưng hiển thị theo big-endian; đảo byte không cẩn thận có thể khiến trường dữ liệu bị hiểu nhầm.
Nhầm lẫn mạng lưới hoặc kiểu mã hóa có thể gây mất tài sản. USDT tồn tại trên nhiều mạng; tiền tố địa chỉ tương tự có thể không tương thích. Khi nạp tiền trên Gate, luôn chọn mạng phù hợp với chuỗi nguồn và kiểm tra kỹ từng dòng tiền tố, định dạng địa chỉ.
Khóa riêng và cụm từ ghi nhớ là bí mật tuyệt đối, được mã hóa thuần nhị phân; để lộ sẽ dẫn đến mất mát không thể khôi phục. Không chụp ảnh màn hình hoặc tải lên đám mây; nên giữ ngoại tuyến khi có thể và sử dụng giao dịch thử nhỏ cùng xác nhận nhiều bước để giảm thiểu rủi ro vận hành.
Mã nhị phân máy tính quy mọi thông tin về chuỗi số 0 và 1—bit và byte là nền tảng của mọi dữ liệu; thập lục phân là lớp hiển thị thân thiện với con người. Địa chỉ blockchain, mã băm, bytecode hợp đồng thông minh và chữ ký đều là các dạng khác nhau của mảng nhị phân này. Khi nắm được cách nhận biết tiền tố, chuyển đổi hệ số, tách byte và kiểm tra mã tổng, bạn sẽ xác thực thông tin nạp, chuyển tiền an toàn hơn. Khi thao tác với tài sản, luôn ưu tiên kiểm tra tương thích mạng, kiểu mã hóa và bảo mật khóa riêng—thành thạo cả đọc hiểu dữ liệu lẫn kiểm soát rủi ro đều quan trọng như nhau.
Trong phần cứng máy tính, 0 và 1 là hai trạng thái điện: 0 nghĩa là không có dòng điện hoặc điện áp thấp; 1 nghĩa là có dòng điện hoặc điện áp cao. Phần cứng có thể phân biệt chính xác hai trạng thái này—đó là lý do máy tính sử dụng hệ nhị phân thay vì thập phân. Mọi chương trình, dữ liệu, hình ảnh cuối cùng đều được lưu trữ và xử lý dưới dạng chuỗi số 0 và 1 này.
Một byte là đơn vị cơ bản của lưu trữ máy tính, được định nghĩa là tám bit. Quy ước này xuất phát từ kinh nghiệm thiết kế phần cứng ban đầu—tám bit có thể biểu diễn 256 giá trị khác nhau (2^8 = 256), đủ để mã hóa chữ cái, số và ký hiệu thông dụng. Đây là tiêu chuẩn ngành được duy trì đến nay; mọi dung lượng lưu trữ hiện đại đều đo bằng byte (ví dụ, 1KB = 1024 byte).
Do hệ nhị phân chỉ dùng hai chữ số (0 và 1) nên cần nhiều ký tự để biểu diễn giá trị. Ngành công nghiệp sử dụng ký hiệu thập lục phân để rút gọn: bốn ký tự nhị phân tương ứng một ký tự thập lục phân—giúp chiều dài mã rút xuống còn một phần tư. Ví dụ, nhị phân 10110011 có thể viết thành thập lục phân B3; ký hiệu ngắn gọn này phổ biến trong trình soạn mã và địa chỉ blockchain.
Không cần phải thành thạo chuyển đổi thủ công—nhưng hiểu nguyên lý sẽ có ích. Bạn chỉ cần biết hệ nhị phân và thập phân có quan hệ, trong đó trọng số tăng dần từ phải sang trái. Trong thực tế, ngôn ngữ lập trình và công cụ sẽ tự động chuyển đổi—điều quan trọng là phát triển “tư duy nhị phân”: hiểu rằng mọi dữ liệu về bản chất đều là tổ hợp của 0 và 1.
Chỉ một lỗi bit cũng có thể làm dữ liệu vô hiệu hoặc gây kết quả bất ngờ—ví dụ, đảo một bit trong giá trị số có thể thay đổi hoàn toàn kết quả. Vì vậy, hệ thống blockchain và tài chính sử dụng mã kiểm tra tổng, sao lưu dự phòng và xác thực mật mã—để phát hiện, sửa lỗi bằng phương pháp toán học, đảm bảo toàn vẹn và an toàn thông tin.


