Сервис 1С:Распознавание речи

1С:Распознавание речи

«1С:Распознавание речи» — сервис автоматического преобразования речи в текст. Механизмы распознавания доступны из встроенного языка «1С:Предприятие» и могут быть встроены в прикладные решения 1С для оптимизации бизнес-процессов: голосовой ввод текста (письма, задачи, комментарии), расшифровка аудиозаписей, голосовое управление, обработка звонков и опросов.

Сервис постоянно развивается: новые улучшения и возможности сначала появляются в облачном режиме, а затем становятся доступными в локальном варианте. Поэтому качество распознавания в облаке и локально может отличаться.

Цена

Сервис доступен в двух вариантах: облачном и локальном. Локальное распознавание не тарифицируется (ограничение определяется ресурсами оборудования). В облачном режиме стоимость зависит от типа распознавания и длительности аудио и списывается во внутренних единицах тарификации.

Тариф	Объем (примерно)	Цена в год
100 000 единиц	около 27 часов потокового аудио около 110 часов файлового аудио	1 000 руб.
1 000 000 единиц	около 270 часов потокового аудио около 1 100 часов файлового аудио	9 000 руб.
10 000 000 единиц	около 2 700 часов потокового аудио около 11 000 часов файлового аудио	80 000 руб.
50 000 000 единиц	около 13 500 часов потокового аудио около 55 000 часов файлового аудио	350 000 руб.

Для ознакомления доступен тестовый тариф (3600 единиц) сроком до 1 года с момента активации и предоставляется однократно. Лимита обычно хватает примерно на 1 час потокового распознавания или на обработку аудиофайлов суммарной длительностью около 4 часов.

Как рассчитывается списание единиц

Потоковое распознавание: 1 единица = 1 секунда. Списание выполняется с шагом 20 секунд (за неполные 20 секунд также списывается 20 единиц).
Файловое распознавание: 1 единица = 4 секунды. Списание выполняется по каждому полному или неполному интервалу 20 секунд аудиофайла.

Преимущества

Быстрый ввод текста голосом. Удобно для писем, задач, комментариев и текстовых блоков, особенно при работе с мобильных устройств или когда заняты руки.
Расшифровка записей. Можно преобразовывать в текст записи звонков, совещаний и интервью (качество результата зависит от качества записи; для лучшего эффекта рекомендуется раздельная запись каналов собеседников).
Голосовое управление. Сценарии управления интерфейсом по командам: открытие форм, поиск, построение отчетов, заполнение реквизитов.
Поддержка отраслевой терминологии. В потоковом режиме можно передавать “грамматику” и специфичные термины (ФИО, названия номенклатуры, контрагентов) для более уверенного распознавания.
Речевые сценарии для сервисных процессов. Подходит для роботизации звонков, опросов, голосовых систем самообслуживания и речевой аналитики.

Совместимость и требования

Готовые сценарии использования: 1С:Документооборот 3 (диктовка текста писем, задач, отчетов и резолюций, голосовой подбор адресатов).
Облачный режим: доступен средствами встроенного языка платформы «1С:Предприятие 8» начиная с версии 8.3.23 и может быть встроен в любое пользовательское приложение 1С.
Обязательное условие: программа 1С, в которую встраивается сервис, должна быть на официальной поддержке.

Видео про сервис 1С:Распознавание речи

Основные возможности

Потоковое распознавание

Аудио передается в режиме реального времени, а распознанный текст возвращается частями с заданным интервалом. Удобно для диктовки текста и голосового управления.

В облачном режиме длительность одного сеанса потокового распознавания ограничена 120 минутами.
В локальном режиме ограничений по длительности сеанса нет.

Файловое распознавание

Аудиофайл отправляется на обработку, а результат формируется с задержкой, зависящей от длительности записи и загрузки сервиса.

Поддержка многоканальных аудиозаписей: каждый канал распознается и тарифицируется отдельно.
Поддерживаемые форматы: WAV (signed 16 bit little-endian), Opus (в контейнере OGG).
Частота дискретизации: 8–48 кГц.
Ограничения: до 1 ГБ и до 4 часов на файл.
Результаты доступны для скачивания в течение 7 суток после выполнения задания.

Разделение по спикерам

Функция позволяет получить расшифровку аудиозаписи с разделением текста по участникам разговора. Подходит для собеседований, опросов, совещаний и оценки качества звонков.

Языки

Поддерживаются русский и английский языки. Перечень доступных языков может расширяться.

1С:Распознавание речи

1С:Распознавание речи

Цена

Как рассчитывается списание единиц

Преимущества

Совместимость и требования

Рекомендованные ресурсы для локального распознавания

Видео про сервис 1С:Распознавание речи

Основные возможности

Потоковое распознавание

Файловое распознавание

Разделение по спикерам

Языки

1С:Документооборот 8

1С:CRM

1C:Документооборот холдинга

Сопутствующие сервисы

1С-Коннект

1С Доки

1C:Share

1С:Распознавание речи

1С:Распознавание речи

Цена

Как рассчитывается списание единиц

Преимущества

Совместимость и требования

Рекомендованные ресурсы для локального распознавания

Видео про сервис 1С:Распознавание речи

Основные возможности

Потоковое распознавание

Файловое распознавание

Разделение по спикерам

Языки

Сопутствующие продукты

1С:Документооборот 8

1С:CRM

1C:Документооборот холдинга

Сопутствующие сервисы

1С-Коннект

1С Доки

1C:Share