(1)用戶(語(yǔ)音) -大于語(yǔ)音識(shí)別:電話機(jī)器人不能識(shí)別語(yǔ)音,第一步驟是將用戶發(fā)出的語(yǔ)音轉(zhuǎn)換為字符,該步驟需要依賴于語(yǔ)音識(shí)別技術(shù)。 僅僅是語(yǔ)音識(shí)別,是一種復(fù)雜且需要持續(xù)投入的技術(shù),因此電話機(jī)器人的制造商很多,使用這些大制造商的語(yǔ)音識(shí)別技術(shù)。
(2)語(yǔ)音識(shí)別–(文本)–>自然語(yǔ)言理解:此時(shí),用戶說(shuō)的話已經(jīng)通過語(yǔ)音識(shí)別轉(zhuǎn)換成了文字,而電話機(jī)器人拿到文字后,需要利用自然語(yǔ)言理解,來(lái)識(shí)別用戶的意圖,通俗的來(lái)說(shuō)就是理解用戶在講什么。
(3)語(yǔ)言識(shí)別–(意圖)–>對(duì)話管理:這時(shí)候,機(jī)器人已經(jīng)識(shí)別了用戶的意圖,下面電話機(jī)器人就需要決定改如何回復(fù)用戶的問題了。比如說(shuō)是繼續(xù)按照正常對(duì)話流程往下走,還是需要先回答用戶的疑問?抑或者需要重新把剛才說(shuō)的話再說(shuō)一遍?
(4)對(duì)話管理–(觸發(fā))–>預(yù)置話術(shù):此時(shí)的機(jī)器人已經(jīng)知道該回復(fù)用戶的具體內(nèi)容了,這時(shí)候就該組織回復(fù)的語(yǔ)言了。而一般來(lái)說(shuō),這些話術(shù)都是預(yù)先設(shè)置好的,等需要用到這塊內(nèi)容的時(shí)候,從這塊內(nèi)容對(duì)應(yīng)的話術(shù)中抽取一條出來(lái)回復(fù)就好。在回答同一個(gè)話題時(shí),話術(shù)不重復(fù),給用戶更好的體驗(yàn)。
(5)事先講話- (調(diào)用) -大于人工錄音:當(dāng)然,如果知道機(jī)器人需要回答哪個(gè)講話,就必須調(diào)用與這個(gè)講話對(duì)應(yīng)的錄音。 結(jié)果,我們?cè)诖螂娫挕?此時(shí),為了使?fàn)I銷效果更好,大多數(shù)客戶都選擇播放真人錄音。 結(jié)果,這個(gè)效果更真實(shí)。 正因?yàn)槿绱?,人工錄音的效果,很大程度上左右著前端用戶接電話時(shí)的體驗(yàn)。