OpenAI представила ChatGPT Images 2: покращена генерація зображень з текстом

Зображення: iTechua

Компанія OpenAI анонсувала нову модель ChatGPT Images 2, яка значно покращує генерацію зображень із текстовими елементами та дрібними деталями, посилюючи конкуренцію на ринку ШІ-інструментів.

На початку 2025 року OpenAI суттєво оновила ChatGPT у напрямі генерації зображень, представивши нову модель. Вона швидко набула вірусної популярності та, за наявними даними, допомогла залучити мільйони нових користувачів. У квітні 2025 року OpenAI відкрила доступ до цієї технології для розробників через API gpt-image-1. Вже у грудні 2025 року компанія представила gpt-image-1.5, що принесла помітні вдосконалення порівняно з попередньою версією.

Водночас Google з вересня минулого року активно розвиває власну лінійку моделей для генерації зображень Gemini Nano Banana. Раніше цього року компанія презентувала Nano Banana 2, також відому як Gemini 3.1 Flash Image. Ця модель забезпечує рівень якості, близький до Nano Banana Pro, але з додатковими покращеннями.

Представлення ChatGPT Images 2

У відповідь на Gemini Nano Banana 2, OpenAI сьогодні анонсувала ChatGPT Images 2. Під час прямої трансляції генеральний директор Sam Altman разом із командою продемонстрували можливості нової системи. За словами компанії, ChatGPT Images 2 значно краще справляється з генерацією зображень, що містять текст. Наприклад, користувачі тепер можуть створювати зображення інтерфейсу macOS або чатів із набагато точнішим відображенням текстових елементів.

У OpenAI також зазначили, що Images 2.0 здатна точніше дотримуватися інструкцій, зберігати потрібні деталі й коректно відтворювати дрібні елементи. До таких елементів належать текст, іконки, елементи інтерфейсу, складні композиції та навіть ледь помітні стилістичні нюанси. Модель підтримує створення зображень із роздільною здатністю до 2K у різних співвідношеннях сторін – від широкого 3:1 до вертикального 1:3.

Можливості та мовна підтримка

Буде доступно дві версії Images 2.0:

Зображення ChatGPT 2.0 миттєво
Мислення ChatGPT Images 2.0

Якщо в ChatGPT обрано режим мислення або Pro, Images 2.0 може підключатися до інтернету для отримання актуальної інформації за запитом. Це дозволяє створювати ще точніші зображення. Крім того, модель здатна генерувати кілька окремих варіантів із одного запиту та додатково перевіряти результати.

Загалом Images 2.0 отримала краще розуміння багатьох мов і значно точніше відтворює нелатинські тексти, зокрема японською, корейською, китайською, хінді та бенгальською.

Доступність та тарифи API

Модель gpt-image-2 доступна через API для розробників за такими тарифами:

8,00 доларів США за вхід
2,00 долара США за кешований вхід
30,00 доларів США за результат

Миттєва версія ChatGPT Images 2.0 вже відкрита для всіх користувачів ChatGPT і Codex. Водночас версія з режимом мислення доступна лише для підписників ChatGPT Plus, Pro та Business.

За матеріалами: iTechua

⚡ ОНОВЛЕНО 23.04.2026 12:45 (iTechua): OpenAI представила Workspace Agents у ChatGPT