Microsoft открывает исходный код мультимодального ИИ-агента - Magma
В 3 часа ночи по сингапурскому времени Microsoft открыла исходный код базовой модели мультимодального AI-агента - Magma на своем официальном сайте. По сравнению с традиционными агентами, Magma обладает мультимодальными возможностями в цифровом и физическом мирах, способна автоматически обрабатывать различные типы данных, такие как изображения, видео, тексты и т.д. Например, вы можете использовать Magma для автоматического размещения заказов в электронной коммерции или проверки погоды; она также может автоматически управлять физическими роботами или оказывать помощь при игре в настоящие шахматные партии. Кроме того, Magma также имеет встроенные функции психологического прогнозирования, которые улучшают ее понимание пространственно-временной динамики в будущих видеокадрах и точно предсказывают намерения и будущие действия персонажей или объектов в видео.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Советник экосистемы Solana Никита Бир стал руководителем продуктового направления X
Популярное
ДалееЦены на крипто
Далее








