現在的智慧助手是否真的稱得上助手?

在如今這個時代裡,智慧助手的存在已經是司空見慣了,很多品牌的手機和智慧音箱都有自己專屬的智慧助手,我們平時會讓它們幫忙定個鬧鐘或者播放喜歡的音樂等簡單的事。

最早出現在手機裡的智慧助手非Siri莫屬,當年和iPhone4s一起面世,讓所有人都覺得新奇。隨著科技的進步,小愛同學和天貓精靈陸續出現在我們的生活裡。

現在的智慧助手是否真的稱得上助手?

當我們在使用這些智慧助手時,對於我們說的很多話,它們都能進行反饋。這是基於它們具備很多AI能力。

它們可以透過語音識別技術來聽懂我們發出的指令,當它聽見你的聲音時,將會馬上進行文字轉換和指令轉換,其中的轉換流程主要採用的是“輸入—編碼—解碼—輸出”的流程。

做到這一步時,智慧助手只能簡單的接受指令。如果要想它能像人一樣與我們交流,那還需要具備自然語言理解能力。是否能理解我們說的話,是語音互動的核心。當它具備了自然語言理解能力,便能基於文字來理解及預測使用者的需求,並做出相應的反饋操作。

當你問語音助手,明天出門需不需要帶傘時,它會先識別詞語和句子的含義,然後再分析理解。透過語言理解技術,將“帶傘”和“天氣預報”結合起來,最後給你是否需要帶傘的建議。

現在的智慧助手是否真的稱得上助手?

智慧助手在溝通中不止會聽,還要能回答。這就需要他具備語音合成技術,語音合成技術中主要分成語言分析部分和聲學系統部分。

語言分析部分主要是對輸入的文字資訊進行分析,然後思考該如何讀出來。聲學系統部分則在語言分析的基礎上,生成對應的音訊,然後發出聲音。

例如我們在讓小愛同學或者天貓精靈幫忙關燈、拉上窗簾時,它會迅速幫你處理起來。這就表明我們與智慧助手完成了一次人機互動,它明白了你所說的話,並作出了反饋。

整個人機互動的過程,簡而言之就是智慧助手在前端降噪的基礎上,讓語音識別技術能更清楚的聽到聲音,然後再透過語言理解技術來聽的明白,最後再透過語音合成技術來發出聲音進行回答。

現在的智慧助手是否真的稱得上助手?

但是現在存在的問題是,我們使用手機中智慧助手的次數其實很少。當螢幕作為現在智慧互動的主要渠道時,人們還不習慣語音操控的存在。

正因為如此,智慧助手的無屏化將是未來的發展趨勢之一。當沒有螢幕的存在時,人們使用智慧助手會更有沉浸感,更容易培養與其交流的習慣。

現在的智慧助手是否真的稱得上助手?

另外我們常常會發現,當我們在使用語音助手時,你在讓它買機票、訂酒店或者打車時,它都不能幫你完成。並不是因為它們聽不懂你所說的話,而是因為它們並沒有接入相關的資訊。你讓它去買機票、訂酒店,但它並不能接入相關的軟體,所以沒有對應的資訊提供給你。

像出行,娛樂這些服務資訊,並不在智慧助手所能掌控的範圍內,屬於非中心資訊。在未來只有讓資訊去中心化,才能讓智慧助手接入相關的軟體,來幫我們比價購物,買機票訂酒店。

智慧助手的發展潛力還很大,相信隨著科技的進步,智慧助手有一天真的能變成你的助手。讓生活中很多瑣碎的事在語音交流中,就快速的幫你解決。