AGI 2030: агенти, Gemini і нова наукова ера DeepMind

7 хвилин читання

AGI більше не виглядає віддаленою теорією — але до нього бракує кількох критичних компонентів. Про це в інтерв’ю на YouTube-каналі Y Combinator заявив засновник і керівник Google DeepMind Деміс Гассабіс, окресливши горизонт появи AGI приблизно у 2030 році.

Його позиція чітка: більшість архітектурних компонентів уже існують, однак одна-дві відсутні ідеї можуть визначити фінальний прорив.

Що реально бракує для AGI: пам’ять, сталість і довге мислення

Сучасні великі моделі спираються на масштабне попереднє навчання, RLHF та ланцюги міркувань. На думку Гассабіса, ці компоненти майже напевно стануть частиною фінальної архітектури AGI. Відкотитися назад і визнати їх тупиком уже неможливо.

Читайте також: Науковці з Університету Копенгагена з'ясували, що фізична активність може стати ефективним інструментом для вивчення складних математичних тем. Про це пише Popular Science. 

Але є слабкі місця.

По-перше, безперервне навчання. Моделі залишаються фактично «статичними» — вони не інтегрують нові знання так, як це робить людський мозок. По-друге, довгострокове міркування і стабільність поведінки. По-третє, механізми пам’яті.

Контекстні вікна на мільйон токенів здаються великими, але якщо записувати відео або повсякденну взаємодію, цього вистачить лише приблизно на 20 хвилин. Брутальне «завантаження всього в контекст» не є елегантним рішенням. Потрібні ефективніші механізми вибору релевантного досвіду — аналог нейробіологічної консолідації пам’яті.

Деміс Гассабіс нагадує: перший Atari-агент DeepMind (DQN) у 2013 році вже використовував replay — відтворення досвіду, запозичене з досліджень гіпокампа. Але нинішні підходи все ще виглядають як тимчасові конструкції.

Агенти — не хайп, а стратегічний шлях до AGI

Від самого заснування DeepMind у 2010 році Деміс Гассабіс визначав агентність як центральний принцип. Система має не лише відповідати на запити, а формувати цілі, планувати дії й активно вирішувати задачі. Саме так працювали Atari-агенти, AlphaGo, AlphaZero та AlphaStar.

За словами Гассабіса, до AGI неможливо дійти без «активної системи, що активно розв’язує проблеми». Пасивні мовні моделі — лише частина архітектури. Агенти є операційною формою інтелекту.

Попри хвилю експериментів із десятками агентів, які працюють годинами, він визнає: ринок ще не побачив продукту масштабу AAA, створеного повністю агентними системами. Прототип — так. Хіт, що продається мільйонами копій, — ні. Це означає, що технологія перебуває у фазі експерименту, а не зрілості.

Засновник DeepMind очікує, що протягом 6–12 місяців з’являться приклади фундаментальної цінності — спершу через різке зростання продуктивності людей (ефект «1000×»), а вже потім через більшу автономність систем.

Чому Gemini збудували мультимодальним із першого дня

Підписуйтеся на наші соцмережі

Gemini від Google DeepMind із самого початку проєктувався як мультимодальна система. Деміс Гассабіс прямо визнає: це ускладнило старт, адже було простіше сфокусуватися лише на тексті. Але стратегічно це рішення створює перевагу.

Мультимодальність потрібна для побудови world models — внутрішніх симуляцій світу. Вона критична для робототехніки, автономних систем, пристроїв доповненої реальності, цифрових асистентів, які працюють у фізичному середовищі.

Gemini уже інтегрується в екосистему Google — від Search з AI Overviews до Android, YouTube, Maps і Waymo. Для таких сценаріїв система має розуміти просторовий контекст, інтуїтивну фізику та навколишнє середовище.

Саме тому, за словами Гассабіса, мультимодальні фундаментальні моделі стануть базою для робототехнічних систем нового покоління.

Маленькі моделі стають стратегічно сильними: дистиляція як зброя

Google DeepMind традиційно будує найбільші frontier-моделі, але ключова компетенція команди — дистиляція. Засновник DeepMind наголошує: через пів року — рік після виходу флагманської моделі її можливості з’являються у компактних версіях.

Flash-моделі досягають близько 90–95% якості флагманів за значно нижчої вартості й затримки. Це критично для масштабування: продукти Google обслуговують мільярди користувачів.

Модель Gemma стала прикладом цієї стратегії — близько 40 млн завантажень за 2,5 тижні. Він не бачить фундаментальної інформаційної межі для дистиляції. Теоретичний ліміт може існувати, але, за його оцінкою, галузь ще далека від нього.

Компактні моделі відкривають нові сценарії: локальна обробка даних, підвищена приватність, робототехніка, edge-пристрої. Великі моделі залишаються «оркестраторами», але значна частина інтелекту переноситься ближче до користувача.

AlphaFold як шаблон наукового прориву

AlphaFold став прикладом того, як AI вирішує «кореневі» наукові проблеми. Сьогодні понад 3 млн дослідників використовують його результати, а практично кожна нова розробка ліків проходить через етап із застосуванням AlphaFold.

Деміс Гассабіс описує патерн успіху:

  • масивний комбінаторний простір пошуку;
  • чітка цільова функція;
  • достатній обсяг даних або симулятор.

Той самий принцип застосовний до пошуку молекул для лікування хвороб — якщо фізика дозволяє існування рішення, AI здатен знайти його ефективніше.

Наступний горизонт — «віртуальна клітина». DeepMind оцінює, що до повноцінної симуляції клітини залишається близько 10 років. Поки що компанія працює над моделлю ядра клітини як самодостатнього підсистемного зрізу.

Чи здатен AI на справжні наукові відкриття?

Моделі вже розв’язують складні математичні задачі, але Деміс Гассабіс проводить чітку межу між розв’язанням задачі та створенням нової гіпотези.

Він формулює так званий «тест Ейнштейна»: якщо систему навчити знанням до 1901 року, чи зможе вона самостійно прийти до відкриттів 1905 року? Поки що таких прикладів немає.

За його словами, сучасні системи переважно працюють у межах відомих патернів або їх екстраполяції. Наступний рівень — аналогічне мислення та створення нових концептуальних рамок.

На його думку, це не магічний бар’єр, а, ймовірно, відсутність однієї-двох ключових ідей у архітектурі.

AGI посеред 10-річного deep tech циклу

Якщо горизонт AGI — 2030 рік, це означає, що він з’явиться всередині нинішніх 10-річних deep tech циклів. Засновники мають це враховувати.

Майбутнє, ймовірно, не буде «одним гігантським мозком». Радше це буде система інструментів: загальна модель, яка використовує спеціалізовані модулі на кшталт AlphaFold як окремі інструменти.

Він переконаний: найперспективніша зона — перетин AI з матеріалознавством, біологією, фізикою та іншими складними дисциплінами. Саме там народжуються прориви, які складно повторити просто оновленням API.

AGI 2030: чому поява загального інтелекту змінить deep tech у середині циклу

Деміс Гассабіс оцінює горизонт появи AGI приблизно у 2030 році. Якщо deep tech-проєкт триває 10 років, це означає, що AGI з’явиться всередині поточного циклу, а не після нього.

Він підкреслює: потрібно будувати такі компанії та інфраструктуру, які зможуть інтегрувати AGI, якщо він з’явиться посеред їхнього розвитку.

AGI 2030 — це не фінал, а початок наступної фази. І саме це робить нинішній момент стратегічним: ті, хто врахує появу загального інтелекту в архітектурі своїх рішень сьогодні, отримають системну перевагу завтра.