摩杜云开发者社区-摩杜云

ASR项目实战-决策点

针对语音识别的产品，分别记录设计、开发过程中的决策点。实时语音识别对于实时语音识别来说，客户端和服务端之间实时交换语音数据和识别的结果。客户端在启动识别时，即开始发送语音数据，期望在等待较短的时间后，即收到最初的识别结果。第一段语音数据和第一个识别结果之间的时延，一般称为首字时延。客户端在停止识别后，期望在等待较短的时间后，即收到最终的识别结果。最后一段语音数据和最后一个识别结果之间的时延，一般称为尾字时延。决策点对开发者提供实时语音识别服务时，使用什么样的协议来传输数据。在实时语音识别的过程中，客户端和服务端均会主动发送数据，因此服务端需要提供一个全双工的协议，以支撑前述要求。业界...

s5EH7MiXPf4U 2023年12月30日 21 0 0 机器学习

ASR项目实战-方案设计

对于语音识别产品的实施方案，给出简易的业务流程，仅供参考。如下流程图，可以使用如下两个站点查看。 webchart WebSequenceDiagrams 文件转写创建文件转写任务客户应用->接入网关:发送创建文件转写的请求接入网关->安全网关:转发请求安全网关->安全网关:对请求进行鉴权安全网关->业务网关:转发请求业务网关->业务网关:校验业务请求业务网关->业务网关:选择算法服务业务网关->数据库:保存任务信息业务网关->任务队列:将文件转写请求放入任务队列业务网关-->安全网关:返回响应消息安全网关--&g...

s5EH7MiXPf4U 2023年12月30日 18 0 0 机器学习

关注更多

空空如也 ~ ~

粉丝更多

空空如也 ~ ~