Sebuah syarikat China yang sebelum ini kurang dikenali telah menggegarkan dunia teknologi dengan pendekatan revolusionernya dalam latihan model bahasa besar dan kebolehan akses, setanding dengan gergasi AI AS pada kos yang jauh lebih rendah.
Syarikat AI yang berpangkalan di Hangzhou, DeepSeek, mendakwa bahawa mereka hanya mengambil masa dua bulan dan membelanjakan kurang daripada $6 juta untuk membina model AI menggunakan cip H800 Nvidia yang kurang maju, manakala OpenAI, Meta, dan Google telah menghabiskan berbilion dolar untuk model AI yang serupa.
Namun, apa yang membuatkan DeepSeek menonjol bukan sahaja kos rendahnya, tetapi juga falsafah sumber terbukanya, langkah radikal yang telah mencetuskan kegemparan dalam sektor yang berkembang pesat ini.
Model R1, yang dikeluarkan di bawah lesen MIT, membenarkan sesiapa sahaja untuk memuat turun, menyesuaikan, dan memperhalusinya. Walaupun ia mematuhi peraturan moderasi kandungan domestik China, pengguna di luar China menikmati kebebasan penuh untuk mengubah suai model tersebut — ciri yang juga diangkat oleh Perplexity AI.
Selepas pengumuman model R1, saham syarikat teknologi besar Amerika, termasuk Nvidia dan firma yang disokong OpenAI, mengalami penurunan mendadak, dengan kerugian gabungan nilai pasaran mencecah $1 trilion.
Presiden AS Donald Trump menggambarkan DeepSeek sebagai "perkembangan positif" tetapi memberi amaran bahawa ia sepatutnya menjadi satu peringatan untuk industri Amerika mengekalkan kelebihan daya saing mereka.
Walaupun Nvidia menggambarkan R1 sebagai "kemajuan AI yang cemerlang", salah seorang pelabur terkemuka dalam bidang teknologi di Lembah Silikon, Marc Andreessen, menyifatkannya sebagai "Sputnik AI".
Ketua Pegawai Eksekutif OpenAI, Sam Altman, juga memuji pesaing China itu, dengan menyatakan bahawa ia "menyegarkan untuk mempunyai pesaing baharu."
Kini, pendekatan mesra kos syarikat China itu menimbulkan kemungkinan yang menarik: adakah ini menandakan permulaan era AI yang lebih inklusif dan boleh diakses, di mana inovasi bukan lagi hak istimewa gergasi teknologi sahaja?
Pembelajaran pengukuhan
Kejayaan DeepSeek berpunca daripada pergantungannya pada pembelajaran pengukuhan atau reinforcement learning (RL), satu pendekatan yang membolehkan syarikat itu mengelakkan kaedah yang memakan banyak sumber seperti yang digunakan oleh pesaingnya.
Kaedah RL membolehkan sistem membangunkan kemahiran penaakulan lanjutan dengan memberi ganjaran kepada hasil yang betul tanpa memerlukan set data yang telah dilabel terlebih dahulu.
Kertas kerja R1 syarikat itu mendedahkan bahawa modelnya dilatih sepenuhnya melalui kaedah cuba jaya ini.
Walaupun menggunakan kaedah yang tidak konvensional, model itu mencapai hasil yang setanding dengan keluaran terkini OpenAI, cemerlang dalam bidang seperti cabaran pengkodan, penyelesaian masalah matematik, dan tugas penaakulan umum.
"Model sumber terbuka mungkin menghadapi perkembangan awal yang lebih perlahan disebabkan sumber yang terhad, tetapi ia mendapat manfaat daripada pelbagai sumbangan dan perspektif, yang berpotensi membawa kepada penyelesaian yang lebih kukuh dan boleh disesuaikan dalam jangka panjang," kata Cagatay Odabasi, seorang jurutera penyelidikan di Fraunhofer IPA di Stuttgart, Jerman.
Beliau menambah bahawa syarikat besar tidak dapat menandingi "skala besar sumber manusia" yang secara semula jadi datang daripada pendekatan berasaskan komuniti, sementara mereka juga mungkin kekurangan dana besar yang dimiliki oleh syarikat besar.
Model sumber terbuka syarikat itu, yang bermula pada harga hanya $0.50 sebulan, telah mula mencabar dominasi model AI berbayar dan tertutup, menjadi aplikasi percuma nombor satu yang paling banyak dimuat turun di App Store Apple pada hari Isnin.
"Keterbukaan ini sudah pasti memberi tekanan kepada pembekal AI untuk berinovasi dengan lebih agresif bagi kekal kompetitif, mengurangkan harga, dan menawarkan terma yang lebih baik berkaitan privasi pengguna," kata Odabasi kepada TRT World.
"Ia mendemokrasikan akses kepada AI yang berkuasa, membolehkan pemain kecil dan penyelidik membina atas kerja yang sedia ada dan menyumbang kepada kemajuan bidang ini."
Gangguan ini amat ketara apabila dibandingkan dengan kenyataan lalu oleh Sam Altman, Ketua Pegawai Eksekutif OpenAI.
Pada tahun 2023, Altman menolak idea bahawa pasukan kecil dengan bajet $10 juta boleh bersaing dalam AI, menggelarnya sebagai "tiada harapan".
Pencapaian DeepSeek kini mencabar dakwaan itu, menunjukkan bahawa inovasi bukanlah hak eksklusif gergasi teknologi.
"Saya percaya bahawa sebaik sahaja model yang begitu berkuasa dijadikan sumber terbuka, komuniti akan sentiasa mencari cara inovatif untuk memanfaatkan malah meningkatkannya dengan cekap," tambah Odabasi.
SUMBER: TRTWORLD dan Agensi
















