Прощай, Photoshop? Google представил ИИ, который делает всю работу за секунды.

Google заменяет Photoshop

Компания Google совершила новый виток в гонке искусственного интеллекта, представив не просто обновление, а настоящий квантовый скачок в генерации изображений. Модель под кодовым названием Gemini 2.5 Flash Image уже успела вызвать ажиотаж в среде дизайнеров и технологических энтузиастов, обещая превратить сложнейший графический редактор в простой голосовой помощник.

Представьте: вы делаете две отдельные фотографии — себя и стул. Загружаете их в приложение и просто говорите: «Нарисуй меня, сидящим в этом красном кресле». Через несколько секунд ИИ не только совмещает объекты, но и дорисовывает недостающие части тела — руки, ноги, детали одежды, создавая бесшовное и реалистичное изображение. Это не фантастика, а реальность, которую нам удалось протестировать.

От слов к магии: Как это работает?

Суть нововведения в том, что Gemini 2.5 Flash понимает контекст и пространство на совершенно новом уровне. Вместо простого наложения объектов ИИ анализирует сцену, свет, тени и перспективу, чтобы интегрировать новые элементы так, будто они всегда там были.

Яркий пример: журналист Авраам Пилтч сфотографировал свой торс и два стула. Попросив ИИ усадить его в красное кресло, он получил результат, который поразил воображение:

  • Gemini реалистично сгенерировал руки и ноги, которых не было на исходном фото.
  • Дорисовал логотип на футболке, который на оригинале был обрезан.
  • Единственной небольшой погрешностью был цвет джинсов, который ИИ исправил по дополнительному запросу без переделки всего изображения.

«Просто дайте Gemini фотографию и скажите, что изменить. Вы можете поместить себя на фото с питомцем, сменить фон комнаты или перенестись в любую точку мира, сохраняя реалистичность», — отмечает Google.

Не только добавление, но и удаление

Мощь инструмента не ограничивается «дорисовкой». В другом тесте пользователь сфотографировал дочь на фоне двух статуй и попросил их убрать. ИИ не просто стёр объекты, но и естественным образом продлил тень от дерева на освободившееся место, что требует глубокого понимания физики света.

Затем девочку «перенесли» к пирамидам в Египте. ИИ не только корректно совместил объекты, но и немного изменил позу человека, чтобы она лучше вписалась в новую среду.

Скорость, цена и безопасность

Одно из ключевых преимуществ — невероятная скорость. Обработка даже сложных запросов происходит за считанные секунды, так как все вычисления идут в облаке.

Вопрос безопасности также не остался без внимания. Google интегрировал в изображения невидимый водяной знак SynthID, позволяющий идентифицировать их как созданные ИИ. Это важный шаг в борьбе с дезинформацией и deepfake-контентом. Система имеет встроенные ограничения на создание неприемлемого контента, в том числе с изображениями известных личностей.

Что касается стоимости, для разработчиков модель доступна через Gemini API, Google AI Studio и Vertex AI по цене $30 за 1 млн выходных токенов. Создание одного изображения обходится примерно в 1290 токенов ($0.039).

Кому бросил вызов Google?

С выходом Gemini 2.5 Flash Image Google напрямую бросает вызов таким гигантам, как OpenAI (DALL-E) и Adobe (Firefly). Если раньше на сложный фотошоп уходили часы, теперь ИИ справляется с этой задачей за секунды. Это не просто инструмент для развлечений, а мощный бизнес-инструмент, который может democratize дизайн и контент-производство.

Пока это промежуточная версия, и Google активно сотрудничает с платформами вроде OpenRouter.ai и fal.ai, чтобы сделать технологию доступнее. Одно можно сказать точно: планка в мире AI-генерации изображений только что была поднята, и конкурентам придется изрядно постараться, чтобы догнать «шоколадную фабрику» Google.