БЛОГ

GPT Image 2 утёк: что это значит для перевода манги

Опубликовано 5 апреля 2026 г./3 мин чтения/Niko D., Founder/Read in English

4 апреля 2026 года на LM Arena и Design Arena появились три модели генерации изображений под кодовыми именами maskingtape-alpha, gaffertape-alpha и packingtape-alpha. За пару часов тестеры разобрались, чьи это модели — OpenAI. И «ленты» обыгрывали в слепых голосованиях Nano Banana Pro от Google — то есть ту самую модель, что стоит за Gemini 3.1 Flash и большинством продакшн-пайплайнов перевода манги сегодня.

OpenAI ничего не подтвердила. Нет ни API, ни цен, ни анонса. Но если вы редактируете страницы манги, две способности из утечки заслуживают внимания.

Что именно утекло

Три модели на Arena, в метаданных всплыли два продакшн-кодовых имени: Hazelnut (флагман) и Chestnut (мини). Цифры — из слепых тестов сообщества:

~99% точности рендеринга текста, включая нелатинские шрифты.
Отдельный апскейлер до 4K.
Инпейнтинг примерно в 4 раза быстрее GPT Image 1.5 и заметно бережнее к деталям лица.
Стилевая консистентность держится через несколько последовательных правок одного изображения.

Параллельно OpenAI подтвердила: поддержка DALL-E 2 и DALL-E 3 заканчивается 12 мая 2026 года. Бренд DALL-E уходит в архив, всё переезжает в линейку GPT Image — генерация изображений сливается с языковыми моделями, а не живёт отдельным продуктом.

Как она редактирует изображения (то, что важно для манги)

Полезность модели внутри манга-пайплайна решают ровно два навыка. По обоим GPT Image 2, по слухам, сильнее — и только они здесь несущие, остальное приятно, но не критично.

1. Текст как нативный пиксель, а не наклейка поверх. Современные модели, Gemini в том числе, рисуют переведённый текст оверлеем — присмотришься, и он лежит на странице. GPT Image 2 встраивает текст в само изображение: перспектива, освещение, вес штриха, лёгкая «впечатанность» в фактуру бумаги. Это разница между «свёрстанным баблом» и «нарисованным от руки». Для SFX, где ドドド и バキ — это сама графика, разница ещё заметнее.

2. Инпейнтинг, который не плавит соседнее. Снять японский текст и восстановить под ним рисунок — самый видимый провал почти любого пайплайна: размазанные лица, потерянные толщины линий, призрачные фоны. Громкая цифра — 4× ускорение, но полезнее другая претензия: сохранение деталей, особенно вокруг лиц и тонкого лайн-арта.

Вот и весь актуальный смысл утечки для манги. Стилевая консистентность, мировое знание, фотореализм — пригодятся, но решают не они.

Что меняется для инструментов перевода

Прямо сейчас — ничего. API нет, интегрировать нечего. Инструменты на Gemini, включая Инковер / Inkover, остаются на Gemini, потому что Gemini шипится, а GPT Image 2 — нет.

Когда выйдет, прагматичный ход — мультимодельный роутинг: тяжёлые по тексту рендеры отдавать той модели, у которой в этом месяце чище типографика, OCR оставлять там, где сильнее японский. Однопровайдерные пайплайны в этой индустрии стареют быстро.

Для переводчиков честная формулировка — меньше ручного клина-апа: меньше расплывшихся фонов, меньше кривых SFX, меньше проходов правок по баблам. Культурная адаптация и тон от этого дешевле не становятся. Это всё ещё на вас.

Источники

Обсуждения утечки на LM Arena и Design Arena — X и Reddit, 4 апреля 2026.
Объявление OpenAI о закрытии DALL-E 2/3 — 12 мая 2026.

GPT Image 2 официально не анонсирована. Все цифры выше — из слепого голосования сообщества на Arena, а не из маркетинга OpenAI.

Читайте также:

← Назад к блогу