主頁 > 知識(shí)庫 > 2021年語音技術(shù)產(chǎn)業(yè)狀況——語音開發(fā)平臺(tái)的現(xiàn)狀

2021年語音技術(shù)產(chǎn)業(yè)狀況——語音開發(fā)平臺(tái)的現(xiàn)狀

熱門標(biāo)簽:河南智能電銷機(jī)器人加盟 菏澤智能外呼系統(tǒng)平臺(tái) 百度地圖標(biāo)注怎么調(diào)整 電話機(jī)器人對(duì)電銷行業(yè)的影響 寧津縣地圖標(biāo)注app 微碼科技電銷機(jī)器人 許昌自動(dòng)外呼系統(tǒng)怎么收費(fèi) 400電話申請(qǐng)的主要特點(diǎn) 小R電話機(jī)器人
  • 老秦夜譯
  CTI論壇(ctiforum.com)(編譯/老秦):語音應(yīng)用程序開發(fā)市場(chǎng)主要由消費(fèi)產(chǎn)品驅(qū)動(dòng)。最近,對(duì)于公司來說,構(gòu)建自己的語音解決方案變得越來越容易,盡管這一領(lǐng)域并不像企業(yè)所希望的那樣完全明確。   到目前為止,供應(yīng)商主要專注于創(chuàng)建消費(fèi)者語音應(yīng)用程序。Alexa擁有超過10萬種技能,但其中很少有用于嚴(yán)肅業(yè)務(wù)用例的,會(huì)話技術(shù)負(fù)責(zé)人、萬維網(wǎng)聯(lián)盟多模式交互工作組主席Deborah Dahl解釋道。很多技能都是學(xué)生項(xiàng)目和各種類型的實(shí)驗(yàn)。在構(gòu)建工業(yè)級(jí)應(yīng)用程序方面投入的精力還不夠多。
  年度回顧
  事實(shí)上,亞馬遜、蘋果和谷歌等頂級(jí)供應(yīng)商通過創(chuàng)建消費(fèi)者解決方案來打造自己的業(yè)務(wù)。2020年,一個(gè)企業(yè)平臺(tái)出現(xiàn)了。通過Nuance Communications'Mix,公司現(xiàn)在可以構(gòu)建自己的企業(yè)智能助理。
  該解決方案包括許多組件,使組織能夠創(chuàng)建通過應(yīng)用程序編程接口(APIs)與企業(yè)軟件集成的語音應(yīng)用程序。通過Mix。nlu,一個(gè)自定義自然語言理解(NLU)系統(tǒng),公司編寫從Mix項(xiàng)目?jī)x表板部署的語音模型。Mix的自動(dòng)語音識(shí)別(ASR)功能由Krypton提供支持,Krypton是一個(gè)用于轉(zhuǎn)錄音頻的實(shí)時(shí)語音到文本引擎。Krypton使用域語言模型和詞集來定制特定環(huán)境的識(shí)別。
  Dahl指出:Nuance Mix與Alexa Skills Kit在功能上非常相似,它為希望構(gòu)建語音應(yīng)用程序的第三方提供了這些功能。由于Nuance解決方案剛剛開始發(fā)布,它在可用技能的數(shù)量和豐富性方面遠(yuǎn)遠(yuǎn)落后于更大、更成熟的消費(fèi)者平臺(tái)。
  大多數(shù)企業(yè)開發(fā)人員都使用過傳統(tǒng)的文本應(yīng)用程序,需要熟悉語音APIs中提供的功能。Nuance似乎意識(shí)到了這種需要。Dahl說:Nuance創(chuàng)造了非常精良和有用的培訓(xùn)材料。一個(gè)視頻引導(dǎo)新手完成開發(fā)過程,最佳實(shí)踐和技巧提供了額外的指導(dǎo)。
  供應(yīng)商還繼續(xù)調(diào)整他們的語音引擎。例如,今年10月,Artificial Solutions更新了Teneo語言,該語言以Teneo NLU本體和語義網(wǎng)絡(luò)為特征,并將語言映射到聲音。
  Teneo現(xiàn)在也應(yīng)用句法條件,比如理解一個(gè)詞在句子中何時(shí)被用作名詞或動(dòng)詞。附加的會(huì)話模塊提供了預(yù)構(gòu)建的解決方案,具有用于常見對(duì)話的后端集成,例如實(shí)時(shí)聊天切換或預(yù)訂會(huì)議室。
  即使在用戶保持沉默的情況下,該產(chǎn)品仍能繼續(xù)進(jìn)行對(duì)話;保持與公司品牌價(jià)值相一致的個(gè)性;即使在用戶偏離主題的情況下,該產(chǎn)品也能保持動(dòng)力。
  另一家開發(fā)平臺(tái)提供商Voiceitt首先通過與具有非典型語音模式的人合作,建立了自己的語音識(shí)別算法和語音數(shù)據(jù)庫。去年12月,供應(yīng)商讓殘疾人可以使用Alexa。Voiceitt移動(dòng)應(yīng)用程序應(yīng)用機(jī)器學(xué)習(xí)和語音識(shí)別技術(shù),幫助因中風(fēng)、退行性疾病或發(fā)育障礙導(dǎo)致的語音障礙患者進(jìn)行交流。
  此前,Inglis House是一個(gè)長(zhǎng)期護(hù)理輪椅社區(qū),它的試點(diǎn)取得了成功。兩者開發(fā)了一個(gè)應(yīng)用程序,幫助腦癱患者使用自己的聲音獨(dú)立完成常見任務(wù),比如控制電視頻道或播放音樂。
  不過,總的來說,語音解決方案在很大程度上是自主發(fā)展的,盡管企業(yè)希望將它們相互連接起來。
  8月份,Genesys加強(qiáng)了Engage,它的云聯(lián)絡(luò)中心語音解決方案,因此它在多云部署中運(yùn)行。
  Engage的容器化體系結(jié)構(gòu)支持私有、公共或混合云部署。該產(chǎn)品與領(lǐng)先的基礎(chǔ)設(shè)施即服務(wù)提供商合作,如Amazon Web Services(AWS)、GoogleCloud和MicrosoftAzure。有了它,組織可以在不同的云之間移動(dòng)他們的軟件,或者使用多個(gè)提供者來滿足不同的系統(tǒng)需求、地理需求或數(shù)據(jù)主權(quán)法規(guī)。
  展望未來
  到目前為止,語音開發(fā)平臺(tái)主要是由大型成功技術(shù)公司推出的專有解決方案。有很多產(chǎn)品可用,但它們有不同的目標(biāo)、設(shè)計(jì)基礎(chǔ)和接口,而且很少在緊密結(jié)合的生態(tài)系統(tǒng)之外工作。
  因此,企業(yè)無法輕松地將在其中一個(gè)平臺(tái)上完成的工作應(yīng)用到在另一個(gè)平臺(tái)上運(yùn)行的具有類似需求的應(yīng)用程序。慢慢地,這個(gè)行業(yè)正以幾種不同的方式轉(zhuǎn)向標(biāo)準(zhǔn)的、開放的系統(tǒng)。
  其中一個(gè)重點(diǎn)領(lǐng)域是開源解決方案。Rasa是一家通過風(fēng)險(xiǎn)投資籌集了4000萬美元的初創(chuàng)公司,它開發(fā)了一個(gè)開源的語音開發(fā)平臺(tái)。供應(yīng)商提供程序員用來創(chuàng)建聊天機(jī)器人、語音應(yīng)用程序和會(huì)話服務(wù)的基礎(chǔ)設(shè)施和編程工具。
  Rasa在其會(huì)話AI套件中提供三種產(chǎn)品。Rasa Open Source于2019年發(fā)布,創(chuàng)建了語音AI軟件。RasaX是一個(gè)免費(fèi)的工具集,幫助開發(fā)人員在Rasa開源平臺(tái)上構(gòu)建智能語音助手。RasaEnterprise提供企業(yè)級(jí)IVA開發(fā)平臺(tái)。
  Dahl認(rèn)為,開源軟件有優(yōu)缺點(diǎn)。價(jià)格始終是部署的考慮因素,開源解決方案幾乎總是免費(fèi)提供的。此外,這些產(chǎn)品是柔韌的,人們可以用任何他們想要的方式使用它們。他們反應(yīng)迅速。有了自己動(dòng)手的工具包,企業(yè)可以立即更改軟件,而不是等待供應(yīng)商添加所需的功能。
  但開源解決方案也有其局限性。核心升級(jí)通常需要一段時(shí)間,因?yàn)樗鼈冃枰@得社區(qū)的同意,而社區(qū)對(duì)如何改進(jìn)功能可能有很大不同的看法。通常,這些系統(tǒng)很復(fù)雜,企業(yè)缺乏部署和維護(hù)它們所需的專業(yè)知識(shí)。如果出現(xiàn)問題,用戶通常無法拿起電話并獲得技術(shù)支持。
  另一個(gè)新興趨勢(shì)是推動(dòng)行業(yè)標(biāo)準(zhǔn)的發(fā)展,這也使得組織構(gòu)建和連接語音軟件變得更加簡(jiǎn)單。開放語音網(wǎng)絡(luò)(OVN)是由麻省理工學(xué)院(MIT)汽車識(shí)別實(shí)驗(yàn)室、凱捷咨詢公司和英特爾公司在2016年夏天進(jìn)行的研究開發(fā)出來的。我們認(rèn)識(shí)到語音用戶界面有可能改變?nèi)祟惻c計(jì)算機(jī)系統(tǒng)的交互方式,開放語音網(wǎng)絡(luò)的執(zhí)行董事JonStine解釋說。
  OVN是Linux基金會(huì)的一個(gè)定向基金,去年春天推出。目前,大約有十幾家企業(yè)和150多名設(shè)計(jì)師、開發(fā)人員和戰(zhàn)略家正在研究創(chuàng)建通用語音軟件體系結(jié)構(gòu)的方法。它們有四個(gè)目標(biāo):安全;提供用戶、生態(tài)系統(tǒng)和體系結(jié)構(gòu)選擇;具有包容性和可訪問性;支持開放式軟件和硬件,但仍能實(shí)現(xiàn)商業(yè)差異化。
  該集團(tuán)計(jì)劃解決一個(gè)市場(chǎng)限制。目前,企業(yè)沒有辦法注冊(cè)他們的語音產(chǎn)品。Stine指出:沒有用于語音的DNS[域名服務(wù)]。
  OVN已經(jīng)開始研究如何建立一個(gè)數(shù)據(jù)庫和流程,這樣公司就可以注冊(cè),比如他們的名字。有了它,例如,消費(fèi)者可以區(qū)分Delta Airlines和Delta Dental語音技能。
  到目前為止,消費(fèi)類應(yīng)用已經(jīng)推動(dòng)了語音開發(fā)市場(chǎng)。新的以企業(yè)為中心的平臺(tái)已經(jīng)開始出現(xiàn),向開源和基于標(biāo)準(zhǔn)的系統(tǒng)的轉(zhuǎn)移有可能使公司在2021年更容易創(chuàng)建更多業(yè)務(wù)質(zhì)量的語音應(yīng)用程序。
  聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
  作者:Paul Korzeniowski
  原文網(wǎng)址:
  https://www.speechtechmag.com/Articles/ReadArticle.aspx?ArticleID=145091

標(biāo)簽:宣城 資陽 怒江 鄂州 保定 南昌 珠海 隴南

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《2021年語音技術(shù)產(chǎn)業(yè)狀況——語音開發(fā)平臺(tái)的現(xiàn)狀》,本文關(guān)鍵詞  2021年,語音,技術(shù),產(chǎn)業(yè),狀況,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《2021年語音技術(shù)產(chǎn)業(yè)狀況——語音開發(fā)平臺(tái)的現(xiàn)狀》相關(guān)的同類信息!
  • 本頁收集關(guān)于2021年語音技術(shù)產(chǎn)業(yè)狀況——語音開發(fā)平臺(tái)的現(xiàn)狀的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章