MGIE штучний інтелект від Apple для редагування фото
Apple відома своїм постійним прагненням до інновацій, і на цей раз вони не розчарували своїх шанувальників. Компанія представила своє останнє досягнення у сфері фотографії – інструмент штучного інтелекту, який дозволяє редагувати зображення, описуючи їх.
Нова модель, розроблена спільно з Університетом Каліфорнії в Санта-Барбарі, отримала назву MGIE, що означає Модель Провідного Редагування Зображень на Основі Мультимодальних Мовних Моделей. Цей інноваційний інструмент дозволяє користувачам описувати свої потреби щодо змін на фотографіях простою мовою, не вдаючись до використання складних програм для редагування.
За допомогою текстових вказівок, MGIE може обрізати, змінювати розмір, перевертати та додавати фільтри до зображень. Це відкриває широкі можливості як для простих, так і для складніших завдань редагування, наприклад, зміни форми об’єктів на фотографії або покращення освітлення. Що робить MGIE унікальним, так це те, що він поєднує два різних підходи до використання мультимодальних мовних моделей. Спочатку він розуміє інструкції користувача, а потім “уявляє” результат редагування, що дозволяє досягти точності та задоволення потреб користувача.
Одним із прикладів використання є зміна зображення піци з пепероні на більш здорову версію за допомогою простого текстового запиту. Крім того, зображення темних тигрів у Сахарі може стати яскравішим після команди “додати більше контрасту для імітації більшого світла”.
Ця нова технологія відкриває шлях до майбутніх досліджень у галузі бачення та мови, стверджують дослідники з Apple. Вони планують робити MGIE доступним для широкої аудиторії через платформи, такі як GitHub та Hugging Face Spaces.
Хоча в області генеративного штучного інтелекту Apple може не бути лідером, компанія продовжує рухатися вперед, щоб додати більше інтелектуальних функцій до своїх пристроїв. І це лише один з кроків у напрямку до більш яскравого майбутнього фотографії.