ChatGPT Images 2.0: не понравилась картинка? Скажи ИИ, что бесит — и он исправит мгновенно

Изображения теперь можно править голосом. Не нужно перегенерировать с нуля.


oawu24qp7ma788b00ok2wlqzb8ocr7ou.jpg

OpenAI решила, что генерация картинок не должна сводиться к схеме ввел запрос, получил результат, начал заново. Компания представила ChatGPT Images 2.0 и явно двигает продукт в сторону более удобной и управляемой работы с изображением. Теперь пользователь не просто запускает генерацию, а может последовательно доводить результат до нужного вида в диалоге.

В OpenAI называют релиз крупным обновлением image-модели. Главные изменения касаются точности следования инструкциям, качества текста внутри изображения, компоновки сложных сцен и общей пригодности результата для практических задач, а не только для быстрых экспериментов. В техническом описании компания отдельно отмечает лучшее понимание запросов, более уверенную работу с деталями и более стабильную сборку сложных макетов.

У новой версии два режима. Instant рассчитан на быстрый результат, когда картинка нужна сразу. Thinking работает медленнее и сначала тратит больше времени на построение сцены. В справке OpenAI говорится, что images with thinking доступны на платных тарифах ChatGPT при выборе Thinking и Pro models, а сама ChatGPT Images 2.0 доступна на всех планах.

Разница между режимами не только в скорости, но и в типе задач. Thinking рассчитан на случаи, где важно сохранить персонажей, предметы и логику сцены от кадра к кадру. OpenAI показывает, что модель лучше справляется с многошаговым визуальным повествованием, страницами манги, сторибордами, листами персонажей и сериями изображений, где ранние генераторы часто теряли лицо героя, детали одежды или связность сюжета.