针对语音识别的产品,分别记录设计、开发过程中的决策点。 实时语音识别 对于实时语音识别来说,客户端和服务端之间实时交换语音数据和识别的结果。客户端在启动识别时,即开始发送语音数据,期望在等待较短的时间后,即收到最初的识别结果。第一段语音数据和第一个识别结果之间的时延,一般称为首字时延。客户端在停止识别后,期望在等待较短的时间后,即收到最终的识别结果。最后一段语音数据和最后一个识别结果之间的时延,一般称为尾字时延。 决策点 对开发者提供实时语音识别服务时,使用什么样的协议来传输数据。在实时语音识别的过程中,客户端和服务端均会主动发送数据,因此服务端需要提供一个全双工的协议,以支撑前述要求。业界...

  s5EH7MiXPf4U   2023年12月30日   21   0   0 机器学习

对于语音识别产品的实施方案,给出简易的业务流程,仅供参考。如下流程图,可以使用如下两个站点查看。 webchart WebSequenceDiagrams 文件转写 创建文件转写任务 客户应用->接入网关:发送创建文件转写的请求 接入网关->安全网关:转发请求 安全网关->安全网关:对请求进行鉴权 安全网关->业务网关:转发请求 业务网关->业务网关:校验业务请求 业务网关->业务网关:选择算法服务 业务网关->数据库:保存任务信息 业务网关->任务队列:将文件转写请求放入任务队列 业务网关-->安全网关:返回响应消息 安全网关--&g...

  s5EH7MiXPf4U   2023年12月30日   18   0   0 机器学习
关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~