
Исследователи из Пекинской академии искусственного интеллекта представили OmniGen 2 — систему с открытым исходным кодом, объединяющую преобразование текста в изображение и редактирование изображений.
Ключевая особенность модели — механизм отражения, который улучшает качество изображений через самокритику.
OmniGen 2 набрал 7,18 балла в тесте OmniContext, опередив все другие модели с открытым исходным кодом. GPT-4o набрал 8,8 балла.
Код модели выложен на Github и на Hugging Face.

================
👁 News | 👁 Soft | 👁 Gear |

