7,5% задач і перемога: що турнір з вайбкодингу каже про майбутнє ШІ у розробці
Відбувся перший у світі турнір з вайбкодингу під назвою K Prize. На початковому етапі переможцем став бразильський інженер Едуардо Роша де Андрадо, який вирішив лише 7,5% задач (9 зі 120).
Вайбкодинг (від англ. vibe coding) — це жартівливий або неформальний термін, що описує процес програмування, під час якого розробник менше зосереджується на чіткій структурі або плануванні й більше покладається на натхнення, інтуїцію або настрій — по вайбу.
Турнір K Prize — це проєкт некомерційної організації Laude Institute, започаткований співзасновником Databricks та ШІ-стартапу Perplexity Енді Конвінські. Його особливість у тому, що розробники розв’язують завдання з GitHub з допомогою ШІ-моделі (але задачі нові, аби системи ще не мали можливості підігнати під тест).
Підписуйтеся на наші соцмережі
Результат Андрадо у 7,5% разюче контрастує з показниками SWE-Bench, де у найпростішому тесті Verified найвищий бал сягає 75%, а в найскладнішому Full — 34%. Очевидно, постають питання щодо ефективності кодування із ШІ у реальному світі.
Конвінські обіцяє виплату до $1 млн за моделі з відкритим кодом, які зможуть вирішити 90% задач. Призовий фонд першого етапу становив $50 тис. і завершився 12 березня.