Gần đây mới thấy tin này, NVIDIA cuối năm ngoái đã mua lại mảng xử lý chip suy luận của Groq, thương vụ này thực ra khá thú vị về mặt logic.



Huang Renxun tại hội nghị GTC năm nay lần đầu tiên giải thích chi tiết lý do tại sao muốn mua lại Groq. Nói đơn giản, là vì nhận thấy thị trường suy luận đang phân hóa. Trước đây, mọi người tối ưu hóa chip suy luận chỉ có một mục tiêu: tăng throughput. Nhưng giờ thì khác, các người dùng khác nhau sẵn sàng trả mức giá khác nhau cho tốc độ phản hồi.

Logic ở đây rất quan trọng — nếu tôi có thể cung cấp cho các nhà phát triển tốc độ phản hồi token nhanh hơn, nâng cao hiệu quả công việc của họ, họ sẽ sẵn sàng trả tiền cho điều đó. Thị trường này, với giá trị cao và độ trễ thấp, thực ra mới xuất hiện gần đây. Huang gọi đây là mở rộng biên của thị trường suy luận theo Pareto: ban đầu là các giải pháp có throughput cao, giờ thêm một lĩnh vực mới, đó là các giải pháp độ trễ thấp, giá cao.

Và Groq chính xác là chuyên gia trong lĩnh vực này. Kiến trúc LPU của họ nổi tiếng với độ trễ thấp, tính xác định cao, hoàn toàn bổ sung cho hướng throughput cao của GPU NVIDIA. Phiên bản Groq 3 LPU ra mắt tháng 3 sử dụng công nghệ của Samsung 4nm, khả năng suy luận trên các mô hình hàng nghìn tỷ tham số cao hơn 35 lần so với Blackwell NVL72, sự khác biệt về hiệu năng thực sự rất ấn tượng.

Xét về dòng sản phẩm, lần mua này đã lấp đầy một chỗ trống của NVIDIA trên thị trường suy luận. Bạn nghĩ xem, cùng một mô hình, dựa vào thời gian phản hồi khác nhau, có thể áp dụng các chiến lược định giá khác nhau — throughput có thể nhỏ hơn một chút, nhưng giá đơn có thể bù đắp lại. Việc Groq gia nhập giúp NVIDIA có một phạm vi phủ rộng hơn trong thị trường suy luận. Thương vụ này về mặt chiến lược rõ ràng là rất hợp lý.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim