Чому прогрес AI нерівномірний? Засновники a16z та Replit: перевірка є ключовою різницею

robot
Генерація анотацій у процесі

Відомий венчурний капіталіст a16z, засновник Марк Андріссен та засновник Replit Амджад Масад 25 жовтня провели бесіду, зосередившись на поточному стані розвитку ШІ. Андріссен зазначив, що ШІ досяг вражаючого прогресу в написанні програм, виконанні математичних обчислень та моделюванні фізичних явищ, але в таких сферах, як медицина та право, спостерігається стагнація. Масад відповів, що ключ не в складності, а в перевіряємості. Тобто, завдання, для яких можна об'єктивно оцінити правильність, прогресують найшвидше, а в більш розмитих сферах важче досягти прориву.

Штучний інтелект має дві швидкості: той, що може перевіряти, бігає швидше за всіх.

Спочатку Masad переглянув методи навчання моделей: ранні мовні моделі просто дивилися на текст, а потім вгадували наступну букву. Хоча вони могли говорити, але не могли справжнім чином міркувати. Лише після впровадження навчання з підкріпленням (Reinforcement Learning, RL) штучний інтелект почав навчатися у перевірених середовищах. Він пояснив:

«Якщо є помилки в програмному забезпеченні, є модульні тести або завдання, які можуть дати чіткий результат, ШІ може безпосередньо знати, чи він правий, чи ні.»

Цей метод навчання з миттєвим зворотним зв'язком дозволяє ШІ швидко покращити свої навички вирішення задач.

Чому медична та юридична сфери не можуть встигнути?

Андрессен запитав: «А як щодо медицини та права? Чому прогрес виглядає таким повільним і спостерігається стагнація?» Мазад відповів:

«Бо через них немає єдиної відповіді.»

Наприклад, медичні діагнози можуть мати кілька причин хвороби та змінюватися в процесі, а правові рішення можуть відрізнятися в залежності від суддів та справ, тобто вони є занадто гнучкими і не мають чіткої стандартної відповіді. Це ускладнює самоперевірку моделі і не дає можливості створити зміцнюючий цикл.

Хоча можна допомогти моделі за допомогою навчання з підкріпленням на основі зворотного зв'язку від людини (RLHF), це все ще є суб'єктивною оцінкою, а не настільки прямим і зрозумілим, як математика чи програми.

(Примітка: Посилене навчання на основі зворотного зв'язку від людей (RLHF) є технологією машинного навчання (ML), яка використовує зворотний зв'язок від людей для вдосконалення ML моделей, щоб підвищити ефективність самонавчання.)

Справжнім ключем є не «складність», а «перевірність»

Андресен після обробки спостережень сказав: “Отже, суть не в тому, складна чи легка проблема, а в тому, чи можемо ми підтвердити правильну відповідь?” Масад зазначив:

“Так, вибух AI в програмуванні та математиці не є наслідком того, що це простіше, а тому, що можна перевірити результати.”

Наприклад, під час написання програми, як тільки програма може компілюватися і тестування проходить, ШІ може негайно отримати відгук «правильного рішення», що дозволяє моделі щодня автоматично виконувати тисячі практик і швидко еволюціонувати.

Які ще сфери мають верифікацію?

Двоє людей перерахували кілька галузей, в яких штучний інтелект розвивається найшвидше:

Математика та фізика: є чіткі рівняння та результати моделювання.

Хімія та біологія: такі як складання білків, генетичні послідовності, можуть бути перевірені експериментально або за допомогою моделювання.

Робот: успішність або невдача місії може бути безпосередньо кількісно оцінена.

Це все належить до сфери “об'єктивно перевіряємого”, тому це є найкрутішою кривою навчання для AI на даний момент.

AI для програмування спочатку злетить, а медицина і право ще в дорозі.

Masad підсумував свої погляди, сказавши:

“Штучний інтелект, що пише програми, спочатку швидко досягне успіху, за ним слідуватимуть математика, фізика, хімія. Але такі абстрактні сфери, як медицина та право, потребуватимуть часу для розвитку.”

Андріссен також погодився:

«Це природне явище. ШІ спочатку вибухає в тих місцях, де можна виміряти, а в сферах, де людське судження є неясним, він запізнюється на один крок.»

Чому прогрес ШІ нерівномірний? a16z, засновник Replit: перевірка є ключовою відмінністю. Спочатку з'явилося в Chain News ABMedia.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити