亚洲日本va中文字幕在线不卡_亚洲在线小视频_国产成人在线电影_高清在线一区二区

| 加入桌面 | 手機版
免費發布信息網站
貿易服務免費平臺
 
 
當前位置: 貿易谷 » 資訊 » IT互聯網 » 三大語音助手為何不支持完全語音控制?

三大語音助手為何不支持完全語音控制?

放大字體  縮小字體 發布日期:2014-07-01 10:22  來源:搜狐IT  瀏覽次數:26
  7月1日,科技博客網站phoneArena刊載Michael H.的文章,對三大語音助手不提供完全語音控制功能進行了闡釋。以下為文章全文:
  我是作家,這意味著我最擅長通過文字而非說話表達自己的思想。但我同時是個“懶人”,在完成工作時喜歡盡量減少使用計算設備。為此,我心中難免會有一個疑問:為什么Google Now、蘋果Siri和微軟Cortana不能提供完全語音控制功能?
  我喜歡語音控制,這也是我換用Moto X的主要原因之一——喜歡其Touchless Controls(無須觸控操作)功能。用上Moto X的Touchless Controls后,我有些“得寸進尺”。麻煩在于,只使用語音控制功能,我能完成的工作受到一定限制。語音命令有很多類,我可以通過語音命令發送電子郵件、瀏覽網站、提問、問路、設置定時、設置提醒、播放音樂等。麻煩在于,計算設備完成第一條命令后,我就不能通過語音命令未完成其他任務了。
  最近數年最好的創新之一是,Google把傳統的語音識別技術應用在搜索領域。從技術角度看,這意味著Google能夠理解代詞,并把它們與之前的請求聯系起來。因此,如果用戶在一個語音命令中提到科懷?倫納德(Kawhi Leonard),在下一個問題中提到“him”(他),Google能理解用戶的意思,向用戶提供所需要的信息。盡管大多數人沒有完全意識到,但這是一項令人吃驚的技術。它使用戶能與設備自然地交流。令人遺憾的是,這種交流無法拓展到更加有用的場景。
  自然控制
  語音控制技術能執行后續的命令,但目前的技術還存在相當多的限制。我沒有遇到大量需要連續詢問一個人或一個地方信息的情況。我的問題在于,其他語音控制命令不包含相似的后續場景選項。例如,我讓Moto X播放Me'Shell Ndegéocello的一首歌曲,因為我尚未有機會聽取其新專輯。第一條命令的執行不存在任何問題,問題在于,一旦開始播放后,可供我使用的語音命令就幾乎沒有了,只能通過語音命令播放其他歌手的歌曲。但我真正的意圖是讓設備完成下述功能之一,例如“暫停”、“下一首”、“調高/低音量”或重復播放。令人遺憾的是,我無法通過語音命令完成這些功能。
  我不明白造成這一問題的原因。從技術角度看,完全通過語音命令控制設備幾乎不存在任何障礙。語音識別技術已經相當成熟。所有語音命令系統都能理解簡單的詞匯,例如,播放、暫停、下一個、上一個、重復等。Google最近拓展了其熱詞的使用范圍,使用戶能從任何地方啟動“OK, Google”。有傳言稱新款iPhone中的Siri將包含有相似的功能,Cortana沒有理由不能為Windows Phone用戶提供相似的功能。始終接收語音命令已經成為標準,因此這不應當成為一個問題。
  我知道,更多地使用語音命令意味著電池續航時間的縮短,這令廠商感到擔憂。但這似乎是一個相對容易解決的問題。設備始終處于語音命令接收狀態是可能的,尤其是在設備配置協處理器或針對語音命令優化的處理器的情況下。解決這一問題的另一個方法是簡單的API(應用編程接口)。
  Ubuntu Touch就計劃解決這一問題。打開一款應用后,用戶希望使用的語音命令是有限的。新聞和其他閱讀類應用不大量使用語音命令,但提供簡單的語音命令——例如“后退”、“向下/向上滾動”、“搜索”、“分享給”,能給絕大多數應用增添豐富的功能。打開支持更多標準語音命令的應用——例如媒體消費類應用,支持的語音命令就更明確了,例如“播放/暫停”、“下一個/上一個”、“快退/快進”、“調高/調低音量”,甚至“跳至(某一時間)”。當然,即使動態命令也不會是個問題,因為應用內部的命令通常是1或2個單詞,許多應用的命令甚至是重合的,能更便利地部署標準API。識別這樣的命令不是個問題。
  誰會成為第一個吃螃蟹者?
  這并非是全新的功能。Windows 7和8提供了范圍廣泛得多的語音命令功能,用戶只需使用語音命令即可操縱桌面。許多人會認為桌面系統的語音功能要強大得多,移動設備是另外一回事兒,但是,這種想法需要改變了。移動平臺越來越先進,在許多方面彌補了與桌面系統之間的差距。Ubuntu Touch的目標之一是在應用內支持更多語音命令,Canonical展示了可以通過語音命令控制的下拉菜單,支持“打開”、“保存”等命令。
  Google Now、Siri和Cortana緣何不能提供完全語音控制?
  Ubuntu Touch尚不支持完全語音控制功能。坦率地說,Ubuntu Touch中的許多功能都尚未達到預期的目標。我的疑問是,緣何主流平臺也做不到。
  蘋果和Google分別在不斷地擴展Siri和Google Now的功能,Cortana發布時就帶有給人留下深刻印象的功能。但是,三家公司無一計劃提供完全語音控制功能,這頗令人感到失望。目前,我們最大的希望是,反復使用能提高語音命令被正確執行的機率,系統能包含全部相關信息。
  終有一天完全語音控制功能會問世,問題是哪家公司會首先提供這一功能。微軟在Windows而非Windows Phone中提供了完全語音控制功能。微軟曾表示計劃為其平臺提供“類Kinect”控制功能,但尚未披露時間表。明年發布的Windows Phone 9可能提供完全語音控制功能。
  Canonical在為Ubuntu開發完全語音控制功能,但尚未完成開發工作。目前沒有明顯的證據表明蘋果在開發完全語音控制功能,但它可能至少在研發相關技術。三星也沒有披露在開發完全語音控制功能的消息。三星已經提供了部分類似功能,S Voice采用Nuance的技術
  在多段Android Wear視頻中,Google都表示在擴大語音命令使用范圍。在一段視頻中,一名用戶在自行車上發出“OK Google, open the garage door”(OK Google,打開車庫門)的命令。令人遺憾的是,目前還很難判斷視頻的真正含義。
  Google可能向開發者開放語音命令,使語音命令更深入地整合在應用中,使開發者能創建定制的語音命令;Google也可能提供一套應用能執行的標準語音命令集,供其他應用使用。Google的展示表明,用戶可以發出“OK Google, call me a car”(OK Google,幫我叫輛車)命令,并選擇一款應用執行這一命令。盡管會有些亂,第一種選項會催生更多功能;第二種選項會使功能受到一定限制,但會帶來更高的便利性。Google可能會選擇第一種選項,增添更多完全語音控制功能。
  結論
  “什么”和“為什么”的問題很好回答:完全語音控制,因為我們都希望生活在《星際迷航》(Star Trek)中。“如何實現”的答案是:始終接受語音命令和API。“誰”問題的答案是所有公司,其中Google可能會首先提供完全語音控制功能。最后一個問題就是“時間”了。
  根據披露的信息,Google很難在今年底前提供完全語音控制功能。完全語音控制功能可能是Android L的一部分,Google在最近的I/O開發者會議上沒有提及完全語音控制功能。完全語音控制功能與應用的深度整合需要在系統層面而非僅僅在API調用層面完成。Google似乎至少在為完全語音控制功能奠定基礎。
  令人的遺憾的是,完全語音控制功能至少明年才會問世。
分享與收藏:  資訊搜索  告訴好友  關閉窗口  打印本文 本文關鍵字:
 
推薦圖文
贊助商鏈接
推薦資訊
贊助商鏈接
 
站內信(0)     新對話(0)