Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Що таке Figure 01 та як стартап у співпраці з OpenAI створює справді корисного робота

0
7 хвилин читання

Стартап Figure AI, який два тижні тому оголосив про співпрацю з OpenAI, представив гуманоїдного робота Figure 01, який використовує штучний інтелект для обробки звукової та зорової інформації. SPEKA з’ясовувала у чому кардинальна відмінність робота від аналогів та чи означає це новий етап в робототехніці. 

Що таке Figure 01 та як стартап у співпраці з OpenAI створює справді корисного робота зображення 1

Як працює Figure 01 та для чого призначений робот

Про розробку компанії Figure AI поки що відомо не надто багато. Їх гуманоїдний робот Figure 01 позиціюється як домашній помічник.  

Компанія заявляє, що їх мета створити «повністю електромеханічного гуманоїдного» робота, який би справлявся з усіма фізичними завданнями, які мають виконувати люди. 

Наразі Figure 01 має зріст 168 см важить близько 60 кг та може витримувати корисне навантаження до 20 кг та рухатись із непоганою для робота швидкістю у 4,3 км. 

Його батарей вистачає на п’ять годин роботи, тому він не зовсім призначений для задоволення ваших потреб 24/7.

Демонстрація можливостей Figure 01

Які технічні новації є у Figure 01

Однак це далеко не перший робот, який мав би допомагати із побутовими справами. Демонстрація його роботи та деякі оприлюднені технічні деталі демонструють принципову відмінність від більшості інших моделей на ринку. 

Підписуйтеся на наші соцмережі

На відео Figure 01 повноцінно взаємодіє з людьми — сприймає запити зором і слухом і дає повні відповіді. Наприклад, бачить об’єкти довкола себе та розрізняє їх призначення. Подібну функцію, раніше демонстрував ШІ від Gemini (хоча згодом виявилось, що компанія зманіпулювала у демонстрації). 

Коли людина на відео просить у робота щось поїсти, а Figure 01 простягає яблуко, оскільки визначає його як єдиний їстівний предмет. Далі робот самостійно прибирає посуд, ставить його у посудомийку, тобто самостійно опрацьовує інформацію з контексту. 

Зір і мова робота обробляються технологіями GPT-4Vision і ChatGPT відповідно, тоді як слух забезпечує WhisperJAX. Figure AI створив скелет робота та моделі, які відповідають за рух та орієнтацію у просторі. 

Те, як рухається робот, викликало окреме захоплення у фахівців. Його рухи плавні, хоча спостерігається незначна затримка, однак відео демонструють у реальному часі, тоді як більшість інших розробників робототехніки зазвичай пришвидшують його у кілька разів, щоб рух робота здавався природним.

Подібного прогресу чекали від Tesla з її роботом Optimus. Компанія досить швидко запустила прототипи, але поки що Optimus рухається не так добре, як його конкурент. До того ж він зовсім не автономний. У пізніших демонстраціях Optimus’а виявили телеоперацію — чоловік за кадром за допомогою спеціального обладнання імітував рухи для того, щоб робот їх повторював.   

Що відомо про Figure AI  

Figure AI — компанія з Саннівейла, Каліфорнія, з 50 співробітниками, яка розробляє автономних гуманоїдних роботів загального призначення, керованих штучним інтелектом. За словами компанії, її «творіння» призначені для розв'язання проблем з нестачею робочої сили, виконання небажаних або небезпечних завдань у глобальному масштабі.

У Figure AI залучив $675 млн у рамках чергового раунду фінансування. Стартап підтримали OpenAI та Microsoft, Джеф Безос через свою фірму Explore Investments LLC інвестував $100 млн. Microsoft — $95 млн, а Nvidia і фонд, пов'язаний з Amazon, — по $50 млн.

Зараз компанія оцінюється у $2,6 млрд. У серпні стартап оголосив про комерційну угоду, згідно з якою його перший людиноподібний робот, Figure 01, працюватиме на єдиному заводі BMW у США.

Брет Едкок, засновник компанії, опублікував тред у X(Twitter), де розповів, що «вбудовані камери Figure 01 подають дані у велику візуально-мовну модель (VLM), навчену OpenAI». Наразі інформації про цю модель у відкритих джерелах немає. Але кількома деталями поділився Корі Лінч, який відповідає за впровадження ШІ у Figure AI. 

За його словами VLM зображення з камер передаються роботу, а звук транскрибується у велику мультимодальну модель, навчену OpenAI, яка розуміє як зображення, так і текст.

Модель обробляє всю історію розмови, включно з минулими зображеннями, щоб отримати відповіді, які повертаються до людини через мовлення робота. Та сама модель відповідає за прийняття рішення про те, яку вивчену замкнуту поведінку запустити на роботі, щоб виконати задану команду.

Уся поведінка робота керується політикою візуально-моторного трансформатора нейронної мережі. Ці мережі приймають вбудовані зображення з частотою 10 Гц і генерують дії з 24 поз зап’ястя та кутів суглобів пальців робота з частотою 200 Гц.

Ці дії служать високошвидкісними «установленими значеннями», щоб контролер міг відстежувати положення робота з більшою швидкістю.

«Ще кілька років тому я міг би подумати, що на повну розмову з людиноподібним роботом, який водночас планує та виконує власну повністю навчену поведінку, доведеться чекати десятиліттями. Очевидно, багато чого змінилося», — ділиться прогресом Корі Лінч. 

Коли Figure 01 стане доступним та якою буде ціна 

У компанії стверджують, що на відеодемонстрації був не прототип, а вже модель для серійного виробництва. Хоча поки що дата виходу на ринок та масового виробництва невідома у Figure AI заявили про намір масового виробництва та очікують зробити мільярд роботів. Орієнтовна вартість теж поки невідома, але собівартість робота оцінюють у $20 тис.

А на сайті Figure у «генеральному плані» Едкока зазначено, що «мета Figure: розробити гуманоїдів загального призначення, які позитивно впливають на людство та створюють краще життя для майбутніх поколінь. Ці роботи можуть усунути потребу в небезпечних і небажаних роботах, що зрештою дозволить нам жити щасливішим і цілеспрямованішим життям».

Разом з тим компанія усвідомлює труднощі. «Шлях нашої компанії триватиме десятиліття — і для досягнення впливу на масовий ринок знадобиться команда першокласних професіоналів, відданих місії, інвестовані мільярди доларів та інженерні інновації. Ми стикаємося з високим ризиком і надзвичайно низькими шансами на успіх».

Також є сфери у яких компанія обіцяє не використовувати своїх роботів. Зокрема це оборонні чи військові призначення, а  також будь-які ролі, які потребуватимуть завдання шкоди людям.

0
Icon 0

Підписуйтеся на наші соцмережі