ПЕРЕВІРКА ТЕКСТУ ПІСЛЯ ГЕНЕРАЦІЇ ЗА ДОПОМОГОЮ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ ДЛЯ ФІЛЬТРУВАННЯ НЕПРАВИЛЬНИХ ВІДПОВІДЕЙ

Петро Васильович Здебський; Андрій Юліанович Берко

doi:10.31649/2307-5376-2024-1-1-6

Автор(и)

Здебський Петро Васильович Національний університет “Львівська політехніка”
Берко Андрій Юліанович Національний університет “Львівська політехніка”

DOI:

https://doi.org/10.31649/2307-5376-2024-1-1-6

Ключові слова:

gpt-4, задача узгодження, генерація тексту, обробка природної мови, задача логічного висновку

Анотація

Сьогодні особливо актуальною є задача узгодження великих мовних моделей. Моделі настільки здатні, що можуть вирішити багато різних завдань, використовуючи підхід zero-shot. Але оскільки вони стали більш здатними, вони знаходять обхідні шляхи для вирішення завдань не так, як очікують дослідники. Це особливо небезпечно у виробничому середовищі, оскільки важко контролювати вихід моделі, яка була навчена бути універсальною. У цій роботі пропонується використовувати одну і ту ж модель кілька разів в різній формі з метою покращення якості згенерованого тексту.

Подальший розвиток отримав метод підвищення точності моделей генерації текстового контенту. Це дозволяє користувачеві не наводити десятки прикладів бажаної та небажаної поведінки моделі, оскільки сама модель може робити це автоматично. Тобто, на відміну від звичайних методів підвищення точності моделі, які вимагають навчального набору моделей, запропонований підхід включає етап ідентифікації. В результаті ідентифікації ми отримуємо набір прикладів, на яких модель автоматично навчається і тим самим підвищує свою точність.

У цій роботі було запропоновано два конкретні методи. Перший метод просто використовує модель дискримінатора для перевірки результатів моделі генератора та запитує повторно створити текст, якщо результати не відповідають критеріям користувача. За допомогою цього підходу вдалося видалити всі неправильні генерації, але за рахунок позначення третини правильних як неправильні. Другий підхід більш складний, він окрім дискримінатора також використовує модель імітатора. Процес вимагає, щоб модель імітатора генерувала зразки введених користувачем даних, потім генератор генерував текст відповіді для кожного зразка, після чого дискримінатор перевіряв згенеровані результати та додавав їх до навчальних даних. Це підвищило точність з 56 % до 66 % у задачі логічного висновку.

Біографії авторів

Здебський Петро Васильович, Національний університет “Львівська політехніка”

аспірант кафедри інформаційних систем та мереж

Берко Андрій Юліанович, Національний університет “Львівська політехніка”

д-р техн. наук, професор кафедри інформаційних систем та мереж

ПЕРЕВІРКА ТЕКСТУ ПІСЛЯ ГЕНЕРАЦІЇ ЗА ДОПОМОГОЮ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ ДЛЯ ФІЛЬТРУВАННЯ НЕПРАВИЛЬНИХ ВІДПОВІДЕЙ

Автор(и)

DOI:

Ключові слова:

Анотація

Біографії авторів

Здебський Петро Васильович, Національний університет “Львівська політехніка”

Берко Андрій Юліанович, Національний університет “Львівська політехніка”

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Метрики

Завантаження

Мова