
Новая модель SignGemma интерпретирует Американский жестовый язык в текст или синтезированную речь с задержкой менее 200 мс.

Одним из главных преимуществ является то, что модель не требует постоянного интернет-соединения и работает эффективно даже на мобильных устройствах.
SignGemma основана на архитектуре Gemini Nano и обучена на более чем 10,000 часах аннотированного видео.
В будущем Google планирует добавить поддержку других жестовых языков.

Однако есть и ограничения: производительность может снижаться в плохом освещении, а также возникают проблемы с региональными вариациями жестов.
Полная доступность модели ожидается в четвертом квартале 2025 года.
================
👁 News | 👁 Soft | 👁 Gear |
