entitas

RLHF

RLHF (reinforcement learning from human feedback) adalah teknik pelatihan model AI yang menggunakan umpan balik dari manusia untuk meningkatkan kinerja model. Ini merupakan salah satu metode yang digunakan dalam proses penyelarasan model.

AI dan Kita: Peran Preferensi Manusia dalam Penyesuaian Model

Teknologi

8 bulan lalu

RLHF

AI dan Kita: Peran Preferensi Manusia dalam Penyesuaian Model

Tentang Halaman Ini