Система умеет распознавать речь в реальном времени (speech-to-text) — удобно для голосового ввода, звонков, диктовки и автоматической транскрипции; озвучивать текст с эмоциями и характером (text-to-speech) — подстраивая стиль речи, акцент и тембр под нужды бизнеса.
Ранее OpenAI пришлось удалить один из голосов, который пользователи сочли похожим на голос актрисы Скарлетт Йоханссон. Компания это отрицает, но голос убрали. Сейчас всё настраивается пользователем вручную — имитация кого-то конкретного исключена.