Skip to Content
Голос (TTS/STT)

Голос (TTS/STT)

ETRL Chat умеет озвучивать ответы (Text-to-Speech) и принимать голосовой ввод (Speech-to-Text).

Озвучивание (TTS)

По умолчанию используется Edge TTS — бесплатные голоса Microsoft с отличной русской поддержкой. Без API-ключа, без дополнительной оплаты.

Включение

В каждом сообщении агента — кнопка «Озвучить». Нажмите, и вы услышите ответ. Голос подбирается по языку интерфейса (русский — русские голоса).

Замена голоса

В Настройки → Агент → TTS можно выбрать:

  • Edge (по умолчанию) — бесплатно, RU-голоса.
  • OpenAI TTS — требует API-ключ OpenAI (платный); недоступен в бизнес-режиме ETRL по умолчанию.

Голосовой ввод (STT)

По умолчанию — Browser STT: распознавание речи силами браузера, без серверной обработки. Работает во всех современных браузерах.

Включение

В панели ввода — кнопка микрофона. Нажмите и говорите; текст появится в поле ввода.

OpenAI Whisper (опционально)

Для Pro-пользователей можно включить серверный Whisper (лучшее качество, особенно для шумных сред). Требует OPENAI_API_KEY — админ включает отдельно.

Скрытие микрофона

Если голосовой ввод не нужен, скройте кнопку через feature flag -speech_to_text (на уровне деплоя, не в пользовательских настройках).

Языки

Edge TTS и Browser STT поддерживают десятки языков. Язык интерфейса определяет голос/распознавание по умолчанию; можно выбрать вручную в настройках.

Last updated on