Nowy ewaluator AI firmy META przekształci szkolenie dużych modeli językowych. Oto jak

Zaledwie dwa miesiące temu dyrektor generalny OpenAI, Sam Altman, powiedział, że trenowanie sztucznej inteligencji na danych syntetycznych (tj. danych generowanych przez sztuczną inteligencję) może prowadzić do powstawania zawodnych modeli sztucznej inteligencji.

Najnowszy program META do oceny sztucznej inteligencji, który został zaprezentowany w tym samym czasie, już teraz ma na celu udowodnienie, że Altman się mylił.

Narzędzie Meta Self-Taught AI Evaluator zostało zaprojektowane, aby wspomóc rozwój dużych modeli językowych, umożliwiając ich samoocenę i samodoskonalenie bez ingerencji człowieka.

Obecnie udoskonalenie LLM wymaga nieefektywnego procesu, w którym wykwalifikowani ludzie sprawdzają poprawność odpowiedzi, co znacznie wydłuża czas i podnosi koszty wdrożenia.

Co więcej, proces ten wymaga danych generowanych przez człowieka, a ilość tych danych jest ograniczona.

Nowy model META może teraz generować dane, które można wykorzystać do trenowania innych modeli sztucznej inteligencji, co oznacza, że jeden problem został już rozwiązany.

Oznacza to również, że ludzie nie będą potrzebni do nadzorowania jakości danych dostarczanych do modeli AI. Ewaluator AI również się tym zajmie.

Kluczowe cechy Samouczka Ewaluatora

Nowy model ma dwie główne cechy, które mogą przekształcić branżę sztucznej inteligencji.

Po pierwsze, korzysta z funkcji autonomicznego uczenia się, aby generować zadania i oceniać ich wykonanie, eliminując potrzebę weryfikacji danych i odpowiedzi udzielonych w celu rozwiązania danego zadania przez wykwalifikowanych ludzi.

Skraca to czas i obniża koszty związane z opracowywaniem i udoskonalaniem modeli, a jednocześnie zapewnia skalowalność, która jest kluczowym wymogiem dla korporacji, które muszą wykorzystywać modele na wielu platformach i dostosowując je do potrzeb różnych użytkowników.

Ponadto, mniejszy udział człowieka zmniejsza również potencjalne błędy wprowadzone do modelu przez człowieka.

Po drugie, technika rozumowania oparta na „łańcuchu myśli” służy do emulowania ludzkiego rozumowania poprzez dostarczanie serii pośrednich kroków w celu rozwiązania złożonych zadań, zamiast podawania prostej odpowiedzi.

W tym celu model może uczyć się z poprzednich skutecznych rozumowań użytych do rozwiązania podobnych problemów.

Dlaczego to takie ważne?

Możliwość generowania danych syntetycznych w celu szkolenia i oceny innych modeli sztucznej inteligencji jest niezwykle istotna dla firm, które chcą wykorzystywać sztuczną inteligencję w obsłudze klienta, szkoleniu pracowników lub analizie prawnej.

Przykładowo, model ten, użyty w chatbocie obsługi klienta, może rozbić problem na serię mniejszych kroków, co pozwala zweryfikować możliwe przyczyny problemu i pomóc klientowi znaleźć rozwiązanie.

W innym scenariuszu model może dokonać dekonstrukcji wewnętrznych zasad i procedur firmy w celu udoskonalenia programu szkoleniowego dla nowych pracowników.

Przedsiębiorstwa mogą szybko dostosować te modele do własnych potrzeb bez konieczności wcześniejszego tworzenia własnego modelu, co do tej pory musiały robić.

Ryzyka wdrożenia

Wdrożenie takich systemów sztucznej inteligencji wiąże się z ryzykiem i wyzwaniami, które, jeśli nie zostaną wzięte pod uwagę, mogą skutkować poważniejszymi problemami w przyszłości.

Jakość modelu zalążkowego zawsze będzie decydować o jego skuteczności i stopniu wiarygodności w rzeczywistych zastosowaniach: jeśli model jest wadliwy, odpowiedź również może być wadliwa.

Z drugiej strony brak nadzoru ze strony człowieka może prowadzić do fałszywych informacji uznawanych za wiarygodne dane wejściowe, które dadzą błędne lub suboptymalne odpowiedzi. Model może również dać dokładną odpowiedź po użyciu złej logiki.

Choć w teorii model ten wydaje się działać dobrze, tylko czas pokaże, czy będzie w stanie niezawodnie wykonywać zadania, których się po nim spodziewamy.

Biorąc pod uwagę tempo rozwoju sztucznej inteligencji, być może nie będziemy musieli czekać zbyt długo.

Nowy ewaluator AI firmy META przekształci szkolenie dużych modeli językowych. Oto jak

Kluczowe cechy Samouczka Ewaluatora

Dlaczego to takie ważne?

Ryzyka wdrożenia

Co dalej z kursem akcji Taylor Wimpey po obniżce wypłat?

Ceny ropy WTI i Brent cofają się na Hyperliquid po wstrzymaniu działań USA–Iran

Najważniejsze spółki CAC 40 do obserwacji: LVMH, Kering, Hermes, Airbus, Société Générale

Spółki DAX do obserwacji: Deutsche Bank, Adidas, BMW, Mercedes‑Benz

CAC 40, FTSE MIB, IBEX 35 i DAX: rentowności rosną przed decyzją EBC