创新的语音转文本答录机

语音转文本自动回复允许使用移动运营商的“语音信箱”服务的用户以音频文件(mp3)和从音频录音转换而来的文本形式接收其他用户的语音留言。此外,消息可以转发到其他便捷的渠道,例如即时通讯应用程序(Telegram)、短信,以及订户自助移动应用程序(尤其是“订户助手”)。

OLSOFT与移动运营商的广泛合作经验,对其活动的特点和问题非常了解。我们与俄罗斯联邦的STC集团合作,提供基于语音识别技术的创新语音转文本自动回答机解决方案,旨在提升订户的忠诚度并扩大他们对“语音信箱”服务的使用。

日期

2020年8月

解决方案的组成部分

Speech-to-Text Auto-Responder是一个客户端-服务器解决方案。服务器承载数据库,存储系统运行所需的所有必要信息,包括Web应用程序,允许客户端应用程序接收必要信息,语音消息交换机,一组用于交换机和内部外部系统的API。

客户端部分包括针对订户的移动自助服务应用程序。还可以使用即时通讯应用程序,如Telegram,作为客户端应用程序的选项。

系统功能

  • 语音识别服务
  • 渠道分发服务
  • FreeSwitch API
  • "Mobile Assistant"系统的API
  • 数据库“STT Autoresponder”
  • 一组用于外部系统的API
  • 统计和监控服务(指标)
  • 报告服务
解决方案的功能可以根据客户的额外要求进行显著扩展。
  • ЦРТ speechpro

    ЦРТ speechpro

  • FreeSWITCH

    FreeSWITCH

业务逻辑

The FreeSwitch ALLO 接收来自运营商系统的呼叫,然后发出 API 请求以验证被叫方是否可以记录语音消息。如果被叫方的号码具有有效订阅且消息限额尚未过期,FreeSwitch 会为被叫方录制最长为30秒的语音消息。之后,录制的 WAV 文件和呼叫元数据将被传输到 API。


The speech-to-text agent translates speech into text format:

  • 该服务作为操作系统的后台进程运行。
  • 该代理程序以每秒钟1次的间隔检查消息队列,每次迭代处理10条消息。从每条消息中获取文件路径,并使用配置的识别器对语音进行识别,并根据所需的语言转录成文本。语音识别可以在线进行(使用API服务)或离线进行。
  • 抱歉,我误解了您的请求。以下是对应的中文翻译:"语音识别的库和服务:CRT SpeechPro、Mozilla Deepspeech"
  • 支持的语言:俄语、英语、哈萨克语
  • 识别的文本将写入与消息绑定的数据库,并发送一条消息到"Recognized Speech Dispatch Agent"的队列中。

The agent for distributing recognized voice messages at intervals of 1 second checks for the presence of a message in the queue, accepting 10 messages per 1 iteration for processing. From each message, the text and subscriber number are taken using the configured message channel, the message is transmitted using the channel API to the account, according to the subscriber number. The message is delivered if the subscriber’s number is linked to a channel:

  • 支持的通道包括:Telegram Messenger和Beeline乌兹别克斯坦移动应用程序。
  • 对于Telegram通道,通过在代理配置中指定的号码进行账户邮件发送。邮件发送账户的号码可能没有在邮件接收账户的联系人中注册。
  • Telegram消息包括文本信息和MP3文件。MP3文件在发送消息之前生成,发送后会被删除,如果发生错误也会删除。

您喜欢这个项目吗?请请求演示!