Figure 02 получил усовершенствованные технологии искусственного интеллекта и компьютерного зрения. Благодаря использованию GPT-4o Voice с роботом можно разговаривать максимально естественно и перебивать его.
Стартап Fig уверяет, что роботы смогут обучаться и действовать независимо, наблюдая за людьми. Андроиды могут использоваться не только для бытовых задач, но и выполнять за человека неприятную или опасную работу и в целом “улучшать качество жизни людей”.
По наполнению имеем шесть RGB-камер с системой искусственного зрения и руки с 16 степенями свободы и уровнем силы, идентичным человеческим рукам, а самым главным обновлением стало использование системы VLM (Visual Language Model) — это расширенная модель искусственного интеллекта, которая объединяет компьютерное зрение и обработку естественного языка, благодаря чему может интерпретировать и создавать контент как из визуальной, так и из текстовой информации. Эта продвинутая система позволит роботу лучше оценивать контекст и принимать решения для действий, которые невозможно запрограммировать заранее.
На видео робот “устроился на работу” на завод BMW в Южной Каролине.
UPD. Добавила картинку-сравнение первого и второго поколения
Пока эти кнопки заработают, пройдут года, может даже века, но вы не отчаивайтесь, ждите и вам воздастся! Хочешь ускорить процесс разработки? Делай репосты страниц сайта в соцсети и рассказывай о нас друзьям!
Помните робота, совмещенного с чат-ботом от OpenAI? Уже в первом поколении он выглядел довольно интересно, а второе стало еще лучше.
Figure 02 получил усовершенствованные технологии искусственного интеллекта и компьютерного зрения. Благодаря использованию GPT-4o Voice с роботом можно разговаривать максимально естественно и перебивать его.
Стартап Fig уверяет, что роботы смогут обучаться и действовать независимо, наблюдая за людьми. Андроиды могут использоваться не только для бытовых задач, но и выполнять за человека неприятную или опасную работу и в целом “улучшать качество жизни людей”.
По наполнению имеем шесть RGB-камер с системой искусственного зрения и руки с 16 степенями свободы и уровнем силы, идентичным человеческим рукам, а самым главным обновлением стало использование системы VLM (Visual Language Model) — это расширенная модель искусственного интеллекта, которая объединяет компьютерное зрение и обработку естественного языка, благодаря чему может интерпретировать и создавать контент как из визуальной, так и из текстовой информации. Эта продвинутая система позволит роботу лучше оценивать контекст и принимать решения для действий, которые невозможно запрограммировать заранее.
На видео робот “устроился на работу” на завод BMW в Южной Каролине.
UPD. Добавила картинку-сравнение первого и второго поколения
Спойлер