Русский ИТ бизнес
Русский ИТ бизнес

Baidu выпустила открытую txt2img модель на 8B параметров с Prompt Enhancer для расширения коротких

Baidu выпустила открытую txt2img модель на 8B параметров с Prompt Enhancer для расширения коротких
Baidu выпустила открытую txt2img модель на 8B параметров с Prompt Enhancer для расширения коротких
Baidu выпустила открытую txt2img модель на 8B параметров с Prompt Enhancer для расширения коротких
Baidu выпустила открытую txt2img модель на 8B параметров с Prompt Enhancer для расширения коротких промптов.

Модель демонстрирует SOTA среди open-weights text-to-image решений, справляясь с постерами, дизайном, стритбордами и многоязычным текстом. Работает на 24 GB VRAM.

Результаты бенчмарков:

- Топ-3 на четырёх тестах
- #1 на GenEval (0.8856)
- #2 на OneIG-ZH (0.5543) и LongTextBench (0.9733)
- #3 на OneIG-EN (0.5750)

Среди open-weights моделей ERNIE-Image занимает #1 на всех этих тестах. Короче, можете дома запускать, теоретически.

Попробовать. Вообще красоту делает, надо признать. Но у меня Nano Banan Pro в подписке не уступает :)

🟪 MAXTG

Комментарии (1)

  • Воздушный Инженер
    Воздушный Инженер
    С количеством пальцев вокруг телефона по-прежнему лажает Ответить