«У традиційній розробці програмного забезпечення ви плануєте версії 1, v2, v3 нового продукту залежно від глибини функцій або потреб користувача. У системах штучного інтелекту об'єктив зміщується. Натомість кожна версія визначається тим, скільки свободи волі має система і від якого контролю ви готові відмовитися. Почніть з визначення набору функцій, які є високим контролем і низьким рівнем свободи волі (версія 1 на зображенні нижче). Вони мають бути невеликими, придатними для тестування та легкими для спостереження. Звідси подумайте про те, як ці можливості можуть розвиватися з часом, поступово збільшуючи свободу вибору, по одній версії за раз. Мета полягає в тому, щоб розбити високий кінцевий стан на ранню поведінку, яку ви можете оцінити, повторити та розвинути вгору. Наприклад, якщо ваша кінцева мета — автоматизувати підтримку клієнтів у вашій компанії, початковим способом з високим контролем було б розширити діапазон v1 (версія 1) як просте маршрутизацію заявок до потрібного відділу, потім перейти до версії 2, де система пропонує можливі рішення, і лише у версії 3 дозволити їй автоматично вирішувати з людським запасним варіантом. Ось ще кілька прикладів: Асистент з маркетингу v1: Чернетка електронного листа, реклами або соціальної копії з підказок v2: Створюйте багатоетапні кампанії та запускайте їх v3: запуск, A/B-тестування та автоматична оптимізація кампаній у різних каналах Асистент з кодування v1: Пропонуйте вбудовані доповнення та шаблонні фрагменти v2: Створюйте більші блоки (наприклад, тести або рефактори) для перевірки людиною v3: Автономно застосовуйте зміни області видимості та відкривайте запити на пул (PR) Якщо ви стежили за тим, як розвивалися такі інструменти, як GitHub, Copilot або Cursor, то це саме той сценарій, який вони використовували. Більшість користувачів бачать лише поточну версію, але система, що лежить в її основі, поступово піднімалася цією драбиною. Спочатку завершення, потім блоки, потім PR, причому кожен крок заробляється використанням, зворотним зв'язком та ітерацією». Більше тут:
Lenny Rachitsky
Lenny Rachitsky21 години тому
Ви не можете створювати продукти зі штучним інтелектом, як інші продукти. Продукти штучного інтелекту за своєю суттю не детерміновані, і вам потрібно постійно домовлятися про компроміс між агентством і контролем. Коли команди не визнають цих відмінностей, їхні продукти стикаються з несподіваними збоями, вони застрягають у налагодженні великих складних систем, які не можуть відстежити, а довіра користувачів до продукту непомітно підривається. Побачивши, що ця закономірність проявляється в 50+ впровадженнях штучного інтелекту в таких компаніях, як @OpenAI, @Google, @Amazon і @Databricks, Айшварія Нареш Реганті та Кіріті Бадам розробили рішення: фреймворк безперервного калібрування/безперервного розвитку (CC/CD). Назва є посиланням на Continuous Integration/Continuous Deployment (CI/CD), але, на відміну від свого тезки, вона призначена для систем, де поведінка не є детермінованою і потрібно заслужити свободу волі. Цей фреймворк показує, як: - Почніть з функцій з високим контролем і низьким рівнем агентства - Створювати eval системи, які дійсно працюють - Масштабуйте продукти зі штучним інтелектом, не підриваючи довіру користувачів Він розроблений, щоб визнати унікальність систем штучного інтелекту та допомогти вам створювати більш цілеспрямовані, стабільні та надійні продукти зі штучним інтелектом. Вони вперше оприлюднюють його:
40,58K