Qwen3-8B adalah model yang diluncurkan oleh Alibaba dan digunakan sebagai dasar untuk pelatihan model DeepSeek-R1-0528-Qwen3-8B. Model ini dirancang untuk memberikan kinerja yang lebih baik dalam tugas-tugas pemecahan masalah matematika.
Teknologi
8 hari lalu
DeepSeek R1 Versi Ringan Lebih Unggul di Tes Matematika dan Hemat GPU
Tentang Halaman Ini
Qwen3-8B adalah model yang diluncurkan oleh Alibaba dan digunakan sebagai dasar untuk pelatihan model DeepSeek-R1-0528-Qwen3-8B. Model ini dirancang untuk memberikan kinerja yang lebih baik dalam tugas-tugas pemecahan masalah matematika.