Kết quả tìm kiếm cho "WEB"
Hôm nay
04:54

Perplexity 公布网页搜索代理的后训练方法;基于 Qwen3.5 的模型在准确率与成本上优于 GPT-5.4

Perplexity 使用在 Qwen3.5 模型上先进行 SFT、再进行带有 RL 的后训练,并借助多跳 QA 数据集与评分标准校验来提升搜索的准确性和效率,从而实现同级最佳的 FRAMES 表现。 摘要:Perplexity 面向网页搜索代理的后训练流程,将监督微调 (SFT) 结合在线强化学习 (RL),并通过 GRPO 算法来强制指令遵循与语言一致性。强化学习阶段使用专有的多跳可验证问答数据集以及基于评分标准的对话数据,以防止 SFT 漂移,并采用奖励门控与组内效率惩罚。评估显示,Qwen3.5-397B-SFT-RL 在 FRAMES 上达到顶级表现:单次工具调用准确率为 57.3%,四次调用为 73.9%,成本为每次查询 $0.02;在这些指标上,其表现优于 GPT-5.4 和 Claude Sonnet 4.6。定价基于 API,且不包含缓存。
Xem thêm
02:22

Microsoft tích hợp Claude Mythos Preview của Anthropic để phát hiện lỗ hổng phần mềm

Tin tức từ Gate, ngày 23 tháng 4 — Microsoft đang tích hợp mô hình AI Claude Mythos Preview của Anthropic vào Vòng đời Phát triển An ninh của mình để phát hiện lỗi phần mềm sớm hơn và đẩy nhanh việc khắc phục. Thử nghiệm của công ty trên các bộ điểm chuẩn mã nguồn mở cho thấy Mythos vượt trội hơn các mô hình trước đó trong
Xem thêm
10:29

Microsoft Ra Mắt Hạ Tầng Thương Mại Cho Tác Nhân AI: Thị Trường Dành Cho Nhà Xuất Bản, Giao Thức Cho Thương Nhân và Công Cụ Quảng Cáo

Tin tức từ Gate, ngày 22 tháng 4 — Phó chủ tịch phụ trách thương mại hóa AI của Microsoft Tim Frank đã công bố một loạt cập nhật hạ tầng thương mại nhằm phục vụ kỷ nguyên “web tác nhân”, giúp các nhà xuất bản, thương nhân và nhà quảng cáo vẫn có thể được phát hiện và giao dịch khi các tác nhân AI đưa ra quyết định mua sắm thay mặt người dùng trên
Xem thêm
09:25

Hugging Face phát hành mã nguồn mở ml-intern, một tác nhân AI cho nghiên cứu ML tự chủ

Phát hành mã nguồn mở cho ml-intern, tác nhân nghiên cứu ML tự chủ của Hugging Face có khả năng đọc bài báo, tuyển chọn dữ liệu, huấn luyện, đánh giá và lặp lại qua các lĩnh vực khoa học, y học và toán học. Tóm tắt: ml-intern của Hugging Face là một tác nhân nghiên cứu ML tự chủ mã nguồn mở có thể đọc các bài báo, tuyển chọn tập dữ liệu, huấn luyện trên GPU tại chỗ hoặc trên đám mây, đánh giá kết quả và lặp lại để cải tiến. Được xây dựng dựa trên smolagents với giao diện dòng lệnh (CLI) và web, nó điều hướng qua arXiv/HF Papers, HF Hub và HF Jobs. Các bản demo bao quát khoa học, y học và toán học, cho thấy khả năng tự động hóa đầu-cuối và mức tăng hiệu năng.
Xem thêm
07:51

AWS mở rộng các quy trình AI nhiều tác nhân, hỗ trợ Claude Opus 4.7 trên Bedrock

Tin tức từ Gate, ngày 22 tháng 4 — Amazon Web Services đã công bố việc mở rộng các sáng kiến AI mang tính tác nhân thông qua các quy trình làm việc nhiều tác nhân, hỗ trợ Anthropic's Claude Opus 4.7 trên Amazon Bedrock để giúp khách hàng đi xa hơn các thử nghiệm AI sinh thành. Công ty đang mở rộng quan hệ đối tác khi khách hàng chuyển từ các công cụ AI đơn lẻ sang các hệ thống kết nối nhiều tác nhân chuyên biệt.
Xem thêm
03:43

X ra mắt tính năng Chủ đề Tạm hoãn cho thuê bao Premium

Tính năng Chủ đề Tạm hoãn cao cấp (Premium Snooze Topics) ẩn các chủ đề đã chọn trong phần Dành cho bạn (For You) trong 24 giờ, kèm tùy chọn đặt lại; hỗ trợ từ Chính trị (Politics) đến Trí tuệ nhân tạo (AI), hiện có trên iOS và web cùng với Dòng thời gian tùy chỉnh (Custom Timelines). Tóm tắt: Nikita Bier đã công bố Chủ đề Tạm hoãn (Snooze Topics), một tính năng Premium để ẩn các chủ đề đã chọn khỏi trang Dành cho bạn (For You) trong 24 giờ; các chủ đề bao gồm Chính trị, Video (Videos), Thể thao (Sports), Kinh doanh & Tài chính (Business & Finance), Khoa học & Công nghệ (Science & Technology), Giải trí & Nghệ thuật (Entertainment & Arts) và Trí tuệ nhân tạo (Artificial Intelligence), có sẵn trên iOS và web cùng với Dòng thời gian tùy chỉnh (Custom Timelines).
Xem thêm
23:57

OpenClaw Phát Hành v2026.4.20 với Kimi K2.6 làm Model Mặc Định

Tin tức từ Gate, ngày 21 tháng 4 — OpenClaw, một nền tảng tác nhân AI mã nguồn mở, đã phát hành v2026.4.20 vào ngày 20 tháng 4, giới thiệu các cập nhật đáng kể cho việc chuyển đổi model mặc định, xử lý hợp đồng plugin và tối ưu hóa lưu trữ gateway. Bản phát hành chuyển model mặc định cho các kênh tích hợp của Moonshot
Xem thêm
08:31

Hoa Kỳ thúc Hàn Quốc giảm phụ thuộc vào công nghệ Trung Quốc, yêu cầu mở cửa thị trường cho các công ty Mỹ

Tin tức từ Gate, ngày 21 tháng 4 — Michael DeSombre, trợ lý bộ trưởng Ngoại giao Hoa Kỳ phụ trách các vấn đề Đông Á và Thái Bình Dương, đã kêu gọi Hàn Quốc giảm sự phụ thuộc vào công nghệ Trung Quốc và sửa đổi các quy định được cho là bất lợi cho các công ty của Mỹ. DeSombre nêu ra các rủi ro an ninh liên quan đến
Xem thêm
05:01

AWS hợp tác với SHI Ấn Độ để hỗ trợ phát triển mô hình AI địa phương dưới Sứ mệnh IndiaAI

Amazon Web Services hợp tác với SHI Ấn Độ để nâng cao việc phát triển mô hình AI tại Ấn Độ, cung cấp quyền truy cập các công cụ AWS cho các tổ chức. Sáng kiến này hỗ trợ việc ứng dụng AI trong khi đồng thời phù hợp với chiến lược AI chủ quyền của Ấn Độ, nhấn mạnh hạ tầng tại chỗ và tuân thủ quy định.
Xem thêm