Penilai AI baharu META akan mengubah latihan model bahasa yang besar, begini caranya

Penilai AI baharu META akan mengubah latihan model bahasa yang besar, begini caranya
Harsh Vardhan
23 Okt 2024, 01:54 PG
  • Model ini menggunakan pembelajaran autonomi, memberi dan menilai tugasan semasa dalam perjalanan untuk meningkatkan hasil.
  • Ia menghapuskan keperluan untuk campur tangan manusia pada pelbagai peringkat pembangunan model AI.
  • Masa akan menentukan sama ada melatih sistem AI menggunakan sistem AI lain akan terbukti berjaya.

Hanya dua bulan yang lalu, Ketua Pegawai Eksekutif OpenAI Sam Altman kedengaran berkata bahawa latihan AI pada data sintetik (iaitu data yang dijana oleh AI) boleh membawa kepada model AI yang tidak boleh dipercayai.

Penilai AI terbaharu META, yang diumumkan pada masa yang sama, sudah pun membuktikan Altman salah.

Penilai AI Belajar Sendiri Meta direka untuk membantu pembangunan model bahasa yang besar dengan membenarkan mereka menilai kendiri dan memperbaiki diri tanpa campur tangan manusia.

Pada masa ini, penambahbaikan LLM memerlukan proses yang tidak cekap di mana manusia mahir menyemak jawapan untuk ketepatan, yang dengan ketara meningkatkan masa dan kos penggunaannya.

Selain itu, proses tersebut memerlukan data yang dijana manusia, sesuatu yang hanya tersedia dalam kuantiti yang terhad.

Model baharu META kini boleh menjana data yang boleh digunakan untuk melatih model AI lain, yang bermaksud satu masalah sudah diselesaikan.

Ini juga bermakna bahawa manusia tidak akan diperlukan untuk mengawasi kualiti data yang disalurkan kepada model AI. Penilai AI akan mengurusnya juga.

Ciri-ciri utama Penilai Belajar Kendiri

Model baharu ini mempunyai dua ciri utama yang boleh mengubah industri AI.

Pertama, ia menggunakan ciri pembelajaran autonomi untuk menjana tugasan dan menilai prestasinya, menghapuskan keperluan untuk manusia mahir untuk mengesahkan data yang digunakan dan jawapan yang diberikan untuk menyelesaikan tugasan yang ada.

Ini mengurangkan masa dan kos yang berkaitan dengan pembangunan dan penambahbaikan model, membawa kebolehskalaan, keperluan utama oleh syarikat yang perlu menggunakan model merentasi pelbagai platform dan untuk keperluan pengguna yang berbeza.

Selain itu, pengurangan penyertaan manusia ini juga mengurangkan potensi bias yang diperkenalkan ke dalam model oleh manusia.

Kedua, teknik penaakulan "Rantai Pemikiran" digunakan untuk mencontohi penaakulan manusia dengan menyediakan satu siri langkah perantaraan ke arah menyelesaikan tugas yang kompleks, bukannya memberikan jawapan yang lurus.

Untuk ini, model mungkin belajar daripada penaakulan yang berjaya sebelum ini yang digunakan untuk menyelesaikan masalah yang sama.

Mengapa ini masalah besar?

Mampu menjana data sintetik untuk melatih dan menilai model AI lain adalah masalah besar bagi syarikat yang ingin menggunakan AI dalam sokongan pelanggan, latihan pekerja atau analisis undang-undang.

Sebagai contoh, digunakan dalam chatbot sokongan pelanggan, model boleh memecahkan isu tersebut kepada satu siri langkah yang lebih kecil untuk mengesahkan kemungkinan punca masalah dan membimbing pelanggan mencari penyelesaian.

Dalam senario lain, model itu boleh menyahbina peraturan dan prosedur dalaman syarikat untuk menambah baik program latihan untuk pekerja baharu.

Syarikat boleh melaraskan model ini dengan cepat mengikut keperluan mereka sendiri tanpa terlebih dahulu membina model mereka sendiri, sesuatu yang perlu mereka lakukan sehingga sekarang.

Risiko pelaksanaan

Pelaksanaan sistem AI sedemikian mempunyai risiko dan cabaran yang, jika tidak dipertimbangkan, boleh mengakibatkan masalah yang lebih besar pada masa hadapan.

Kualiti model benih akan sentiasa menentukan keberkesanannya dan sejauh mana ia boleh dipercayai apabila digunakan dalam aplikasi kehidupan sebenar: jika model itu cacat, maka jawapannya mungkin juga cacat.

Sebaliknya, kekurangan pengawasan manusia boleh membawa kepada maklumat palsu yang dianggap sebagai input yang boleh dipercayai yang akan menghasilkan jawapan yang salah atau tidak optimum. Model ini juga boleh memberikan jawapan yang tepat selepas menggunakan logik yang salah.

Walaupun model itu nampaknya berfungsi dengan baik dalam teori, hanya masa yang akan menentukan sama ada ia boleh melaksanakan tugas yang kita harapkan dengan pasti.

Memandangkan kadar pembangunan AI, kita mungkin tidak perlu menunggu lama.