Model AI Terbaru Alibaba QwQ-32B-Preview Melampaui O1 dari OpenAI dalam Beberapa Benchmark

Cryptopolitan
MATH1,69%

Seiring dengan intensitas persaingan di bidang AI, raksasa ritel Tiongkok Alibaba memperkenalkan QwQ-32B-Preview-nya yang dilaporkan lebih unggul dari seri o1 OpenAI.

Model terbaru dilaporkan mengungguli model o1-preview dan o1-mini dari OpenAI dalam beberapa benchmark tertentu, seperti tes AIME dan MATH, yang mengevaluasi performa model AI dalam teka-teki logika dan masalah matematika.

Alibaba telah membuat QwQ-32B-Preview untuk diunduh.

Menurut raksasa ritel, model baru Alibaba mampu mengatasi masalah yang kompleks dan rumit dibandingkan dengan model bahasa besar (LLM) biasa seperti ChatGPT-4 dan Claude 3.5.

Sebuah artikel oleh Benzinga menunjukkan bahwa QwQ-32B-Preview adalah salah satu dari sedikit yang tersedia di bawah lisensi yang memungkinkan pengguna untuk mengunduh dan menggunakannya. Model ini kini tersedia di platform pengembangan AI Hugging Face.

Namun, Alibaba merilis komponen tertentu dari model tersebut untuk membatasi replikasi penuh dari model atau wawasan tentang cara kerjanya.

Model terbaru Alibaba memiliki 32,5 miliar parameter yang memungkinkannya mengatasi masalah hingga 32.000 kata. Dengan kemampuan signifikan dan aksesibilitas yang semi-terbuka, produk baru Alibaba ini membuka jalan bagi terobosan yang transformatif dalam teknologi penalaran AI.

Pengumuman transparan dari Alibaba, yang menekankan pada kecanggihan modelnya, OpenAI telah menjaga hitungan parameter mereka tetap rahasia.

Kedatangan model ini datang pada saat OpenAI sedang membuat kemajuan signifikan dalam sektor AI. Pada bulan Oktober, valuasi OpenAI melonjak menjadi $157 miliar setelah putaran pendanaan yang sukses.

Minggu lalu, SoftBank Group SFTBF dilaporkan meningkatkan kepemilikan sahamnya dalam pembuat ChatGPT melalui pembelian saham karyawan senilai $1,5 miliar.

OpenAI juga dikatakan sedang menjelajahi pengembangan web browser sendiri untuk menantang browser Google Chrome milik Alphabet setelah tekanan dari Departemen Kehakiman AS untuk melepaskannya.

Alibaba mengakui bahwa model ini juga memiliki kekurangan

Meskipun memiliki beberapa keunggulan yang unik, model baru ini juga memiliki keterbatasan. Menurut kelompok tersebut, QwQ-32B-Preview memiliki isu seperti perpindahan bahasa yang tak terduga, yang berpotensi membingungkan pengguna. Model juga kurang baik dalam tugas-tugas yang memerlukan penalaran akal sehat, hal ini umum terjadi pada banyak kecerdasan buatan.

Menurut AutoGPT, model ini mungkin terjebak dalam perulangan logis, yang mengakibatkan penundaan dalam memberikan respons.

Meskipun memiliki kekurangan, kemampuan penalarannya memungkinkannya untuk memeriksa fakta sendiri, sehingga mengurangi kesalahan tetapi meningkatkan waktu resolusi.

Dengan merenungkan tugas dan merencanakan langkah-langkah, model Alibaba menghindari beberapa kesalahan yang mempengaruhi AI tradisional. Namun, pendekatan ini membutuhkan waktu ekstra yang mungkin membatasi aplikasi real-time.

Menurut Benzinga, respons ‘QwQ-32B-Preview’ sejalan dengan standar regulasi China, menghindari topik yang sensitif secara politik.

Sebagai contoh, topik yang sensitif secara politik seperti Taiwan akan memberikan respons yang sejalan dengan sikap pemerintah China.

Selain itu, berita tentang peristiwa seperti Tiananmen Square tidak menghasilkan respons apa pun, menunjukkan desain hati-hati model ini.

Meskipun ini mungkin ideal untuk pasar Tiongkok, hal ini juga dapat membatasi daya tariknya di pasar global. Namun, model ini merupakan langkah penting ke dalam dunia AI penalaran. Meskipun keterbatasannya mungkin membatasi daya tarik globalnya, komponen lain seperti logika dan sifat semi-terbuka membuatnya menjadi pesaing yang besar bagi OpenAI.

Menurut AutoGPT, QwQ-32B-Preview menyoroti potensi, dan tantangan, dari ujung yang menarik ini di mana laboratorium AI di seluruh dunia sedang bekerja untuk menyempurnakan teknologi penalaran.

Dari Nol ke Web3 Pro: Rencana Peluncuran Karier 90 Hari Anda

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
GateUser-a578b9cfvip
· 2024-11-29 23:43
Buy the Dip 🤑
Balas0