四虎网站在线,中文日韩无码欧,日韩A级黄片,日韩电影网站久久久

幫助與文檔 > 產(chǎn)品文檔 > 智能語音服務 > API文檔 > 實時語音評測
實時語音評測

實時語音評測 API 簡介

概念解釋

實時語音評測:實時語音口語評測服務可實現(xiàn)對連續(xù)音頻流的實時識別,并最終對用戶的讀音進行評測。

說明

Hi,您好,歡迎使用有道智云智能語音評測服務。

如果您想快速體驗服務,建議您前往 實時語音評測體驗中心 或者在體驗中心右下側找到小程序二維碼,掃描進行體驗。

本文檔主要針對需要集成實時語音識別服務HTTP API的開發(fā)工程師,詳細描述有道智云實時語音評測能力及如何集成的技術內(nèi)容。

如果您有與我們商務合作的需求,可以通過以下方式聯(lián)系我們:

商務郵箱: AIcloud_Business@corp.youdao.com

如果您對文檔內(nèi)容有任何疑問,可以通過以下幾種方式聯(lián)系我們:

客服QQ:1906538062

智云語音技術交流QQ群:861723255

聯(lián)系郵箱: zhiyun@corp.youdao.com

溫馨提示:

  • 本文檔主要針對開發(fā)人員,接入測試前需要在后臺創(chuàng)建API應用,獲取應用ID應用密鑰;如果您還沒有,請按照 新手指南 獲取。
  • 平臺向每個賬戶贈送50元的體驗金,供用戶集成前測試所用,具體資費規(guī)則詳見 實時語音評測服務報價 。

接口說明

有道實時評測服務對用戶發(fā)音的完整度、流利度、準確度進行全方位評測,并能對發(fā)音錯誤、缺陷進行定位。

支持的音頻格式為16K 采樣率、16bits 精度的 pcm_s16le 音頻,目前支持中、英文。

服務接口的調(diào)用分為認證、實時通信兩階段。

接口地址:

wss://openapi.youdao.com/stream_capt?{請求參數(shù)}

請求參數(shù)格式: key1=value1&key2=value2&key3=value3&key4=value4

音頻格式要求

格式支持:wav(不壓縮、pcm編碼) 采樣率:推薦16k。 編碼:16bit位深的單聲道

接口調(diào)用參數(shù)

調(diào)用API需要向接口發(fā)送以下字段來訪問服務。

字段名 類型 含義 必填 備注
appKey String 已申請的應用ID ID
salt String 隨機數(shù) uuid
curtime String 時間戳,1970-1-01 00:00:00 至當前的秒數(shù) 1522292849
sign String 加密數(shù)字簽名。
signType String 數(shù)字簽名類型 v4
langType String 語言選擇,接口目前支持中文(zh-CHS)、英文(en) zh-CHS, en
format String 音頻格式,支持wav wav
channel String 聲道,支持1 1
version String api版本 v1
rate String 采樣率 16000
vadHeadSil String 前端靜音檢測,單位ms.范圍:[100,10000] 1000
vadTailSil String 后端靜音檢測,單位ms.范圍:[100,10000] 2000
strictness String 注:該參數(shù)僅中文接口支持。打分嚴格程度 1(兒童) 2(中等)3(嚴格 成人母語者),默認:2 1,2,3

簽名sign生成方法如下: sign=sha256(應用ID+salt+curtime+應用密鑰)。

輸出結果

響應結果是以json形式輸出,包含字段如下表所示:

| 字段 | 含義 |說明 | |:-----|:-------|---- | |errorCode | String | 狀態(tài)碼,詳見狀態(tài)碼說明| |action | String | 狀態(tài)標識,started:握手,capt:評測,error:錯誤,close:關閉| |requestId | String |請求ID| |result | String | 識別結果數(shù)據(jù)| |closeCode| String|關閉的狀態(tài)碼 0正常關閉;1:前置靜音超時;2:后置靜音超時|

輸出結果示例

服務端通過 text message 返回 json字符串的認證結果,參數(shù)示例:

成功:

{
	"result": [],
	"action": "started",
	"errorCode": "0"
}

失敗:

{
	"result": "[]",
	"action": "error",
	"errorCode": "202"
}

實時通信階段

認證成功之后,進入實時通信階段,實時通信分為兩個階段: 1) 客戶端發(fā)送待評測文本,如果不發(fā)送,會返回沒有發(fā)送評測文本的異常 2)客戶端發(fā)送音頻流和結束標識,并接收轉(zhuǎn)寫結果或錯誤。

發(fā)送評測文本

此階段客戶端通過 text message 發(fā)送評測文本。示例:

{"text":"have a good day"}

文本長度限制:英文不超過1000單詞。音頻時長不超過120s。

發(fā)送音頻流

此階段客戶端通過 binary message 發(fā)送音頻流,內(nèi)容為音頻的二進制數(shù)據(jù),此過程的發(fā)送頻率將影響文字結果展示的實時性。

建議以 200ms 間隔發(fā)送音頻數(shù)據(jù),若間隔超時 15s 以上,服務端將停止識別。

發(fā)送結束標識

客戶端完成所有音頻數(shù)據(jù)的發(fā)送后,需發(fā)送一個特殊的 binary message 到服務端作為音頻流 發(fā)送結束的標識,內(nèi)容為:

{"end": "true"}

接收評測結果

響應結果是以json形式輸出,包含字段如下表所示:

字段 含義
errorCode 識別結果錯誤碼,一定存在。
詳細信息可見 錯誤代碼列表
refText 請求的文本
start 音頻中句子開始時間,單位是秒
end 音頻中句子結束時間,單位是秒
isFinal 是否是最后一次返回
integrity 句子完整度得分
fluency 句子流利度得分
pronunciation 句子準確度得分
speed 語速,單詞/分鐘
overall 句子綜合評分
words 單詞評分數(shù)組
-word 單詞
-index 詞序,從0開始
-start 單詞開始時間,單位是秒
-end 單詞結束時間,單位是秒
-pronunciation 單詞準確度得分
-phonemes 音素數(shù)組
--phoneme 音素
--start 音素開始時間,單位是秒
--end 音素結束時間,單位是秒
--judge 判斷音素是否錯誤,true為發(fā)音正確,false為發(fā)音錯誤,同時calibration給出提示
--calibration 如果發(fā)音錯誤,提示用戶該發(fā)音像什么
--prominence 重音程度,分數(shù)越高,當前音標越可能是重音,分數(shù)在[0,1]
--stressRef 元音重音參考/標準答案,如果為true,說明參考答案認為該元音應該發(fā)重音,輔音時無意義
--stressDetect 在一個單詞中,用戶該音標發(fā)音為重音

示例

{
	"result": {
		"refText": "day",
		"pronunciation": 73.799362,
		"start": 1.530000,
		"words": [{
			"pronunciation": 73.799362,
			"start": 1.530000,
			"index": 3,
			"end": 1.950000,
			"word": "day",
			"phonemes": [{
				"stressDetect": false,
				"pronunciation": 48.216797,
				"phoneme": "d",
				"start": 1.530000,
				"end": 1.650000,
				"judge": false,
				"calibration": "e",
				"prominence": 0.920839,
				"stressRef": false
			}, {
				"stressDetect": false,
				"pronunciation": 99.381935,
				"phoneme": "e",
				"start": 1.680000,
				"end": 1.950000,
				"judge": true,
				"calibration": "e",
				"prominence": 1.000000,
				"stressRef": false
			}]
		}],
		"fluency": 86.899673,
		"speed": 133.333313,
		"integrity": 99.999992,
		"service": "capt",
		"overall": 92.249207,
		"end": 1.950000,
		"isFinal": false,
		"status": "success"
	},
	"requestId": "9ad0101c-25f1-4336-90c2-e15d5c748e86",
	"errorCode": "0",
	"action": "capt"
}

支持語言

目前支持中英文的語音評測。

語言 代碼
英文 en
中文 zh-CHS

服務配置

支持格式 單次最大請求時長(s) 支持語言
wav 120 中、英

錯誤代碼列表

錯誤碼 含義
101 缺少必填的參數(shù),首先確保必填參數(shù)齊全,然后,確認參數(shù)書寫是否正確。
102 不支持的語言類型
103 翻譯文本過長
104 不支持的API類型
105 不支持的簽名類型
106 不支持的響應類型
107 不支持的傳輸加密類型
108 應用ID無效,注冊賬號,登錄后臺創(chuàng)建應用并完成綁定,可獲得應用ID和應用密鑰等信息
110 無相關服務的有效實例,應用沒有綁定服務實例,可以新建服,綁定服務。注:某些服務的結果發(fā)音需要tts服務,需要在控制臺創(chuàng)建語音合成服務綁定應用后方能使用。
111 開發(fā)者賬號無效
112 請求服務無效
113 q不能為空
201 解密失敗,可能為DES,BASE64,URLDecode的錯誤
202 簽名檢驗失敗,如果確認應用ID和應用密鑰的正確性,仍返回202,一般是編碼問題。請確保翻譯文本 q 為UTF-8編碼.
203 訪問IP地址不在可訪問IP列表
205 請求的接口與應用的平臺類型不一致,確保接入方式(Android SDK、IOS SDK、API)與創(chuàng)建的應用平臺類型一致。如有疑問請參考入門指南
206 因為時間戳無效導致簽名校驗失敗
207 重放請求
303 服務端的其它異常
304 會話閑置太久超時
401 賬戶已經(jīng)欠費停止
9001 不支持的語音格式
9002 不支持的語音采樣率
9003 不支持的語音聲道
9004 不支持的語音上傳類型
9005 不支持的語音識別 Language類型
9301 ASR識別失敗
9303 服務器內(nèi)部錯誤
9411 訪問頻率受限(超過最大調(diào)用次數(shù))
9412 超過最大處理語音長度
403507 沒有發(fā)送文本
403508 文本過長
403512 15s沒有發(fā)送消息
403514 發(fā)送音頻過短,請超過
熟女亚洲日韩在线| 国产一级成人办公室| 中文 国产 一区| 久久日本欧美tv| 日本不卡的一区二区| 欧美女人3p视频| 17p日韩精品一区| 精品久久经典| 91麻豆精品一区二区三区久久| 国产不卡一区在线| www久久久久久久久久| av福利频道| 少妇人妻在线播放| 久久精品日韩福利视频免费| 老公鸡巴插逼逼视频| 一区二区综合亚洲欧美| 日本激情三级视频| 一逼双鸡巴视频| 亚洲色吧色图| 在线新黄片| 欧美日韩性生活免费观看| 欧美好紧好湿| 一色一伦一区二区三区在线观看| 欧美大骚逼被操| 午夜婷婷六月丁香| 日处女B视频| 美女的破处视频在线观看| 无码国精品一区二区免费jazz| 在线视频 亚洲精品综合| 黄色AV免费在线上观看| 日韩无码,高清无码| 91精品视频无码| 无码免费婬AV片在线小黄书| 日韩一区中文精品在线资源| 日韩三级精品| 天天日天天艹天天日| 日韩欧美韩系列| 日本三及久久久| 国产精品自拍视屏| 亚洲AV线福利| 亚洲欧洲涉黄网站在线观看|