Apple представила нейросеть для редактирования изображений с помощью текстовых команд
Apple выпустила новую ИИ-модель с открытым исходным кодом под названием MGIE, которая позволяет редактировать изображения с помощью текстовых команд.
MGIE (MLLM-Guided Image Editing) использует большие мультимодальные языковые модели (MLLM) для интерпретации пользовательских команд и внесения изменений на уровне пикселей.
Модель может предложить различные варианты редактирования – модификацию в стиле Photoshop (обрезка, поворот, добавление фильтров, удаление объектов), общую оптимизацию фотографий (яркость, контрастность, цветовой баланс) и локальные правки (редактирование определенных областей или объектов).
MGIE доступна в качестве проекта с открытым исходным кодом на GitHub. Проект также предоставляет демонстрационный блокнот, который показывает, как использовать MGIE для различных задач редактирования. Пользователи также могут протестировать возможности MGIE онлайн через демоверсию, размещенную на Hugging Face Spaces – платформе для обмена и совместной работы над проектами машинного обучения (ML).