現在的智慧助手是否真的稱得上助手？

在如今這個時代裡，智慧助手的存在已經是司空見慣了，很多品牌的手機和智慧音箱都有自己專屬的智慧助手，我們平時會讓它們幫忙定個鬧鐘或者播放喜歡的音樂等簡單的事。

最早出現在手機裡的智慧助手非Siri莫屬，當年和iPhone4s一起面世，讓所有人都覺得新奇。隨著科技的進步，小愛同學和天貓精靈陸續出現在我們的生活裡。

當我們在使用這些智慧助手時，對於我們說的很多話，它們都能進行反饋。這是基於它們具備很多AI能力。

它們可以透過語音識別技術來聽懂我們發出的指令，當它聽見你的聲音時，將會馬上進行文字轉換和指令轉換，其中的轉換流程主要採用的是“輸入—編碼—解碼—輸出”的流程。

做到這一步時，智慧助手只能簡單的接受指令。如果要想它能像人一樣與我們交流，那還需要具備自然語言理解能力。是否能理解我們說的話，是語音互動的核心。當它具備了自然語言理解能力，便能基於文字來理解及預測使用者的需求，並做出相應的反饋操作。

當你問語音助手，明天出門需不需要帶傘時，它會先識別詞語和句子的含義，然後再分析理解。透過語言理解技術，將“帶傘”和“天氣預報”結合起來，最後給你是否需要帶傘的建議。

智慧助手在溝通中不止會聽，還要能回答。這就需要他具備語音合成技術，語音合成技術中主要分成語言分析部分和聲學系統部分。

語言分析部分主要是對輸入的文字資訊進行分析，然後思考該如何讀出來。聲學系統部分則在語言分析的基礎上，生成對應的音訊，然後發出聲音。

例如我們在讓小愛同學或者天貓精靈幫忙關燈、拉上窗簾時，它會迅速幫你處理起來。這就表明我們與智慧助手完成了一次人機互動，它明白了你所說的話，並作出了反饋。

整個人機互動的過程，簡而言之就是智慧助手在前端降噪的基礎上，讓語音識別技術能更清楚的聽到聲音，然後再透過語言理解技術來聽的明白，最後再透過語音合成技術來發出聲音進行回答。

但是現在存在的問題是，我們使用手機中智慧助手的次數其實很少。當螢幕作為現在智慧互動的主要渠道時，人們還不習慣語音操控的存在。

正因為如此，智慧助手的無屏化將是未來的發展趨勢之一。當沒有螢幕的存在時，人們使用智慧助手會更有沉浸感，更容易培養與其交流的習慣。

另外我們常常會發現，當我們在使用語音助手時，你在讓它買機票、訂酒店或者打車時，它都不能幫你完成。並不是因為它們聽不懂你所說的話，而是因為它們並沒有接入相關的資訊。你讓它去買機票、訂酒店，但它並不能接入相關的軟體，所以沒有對應的資訊提供給你。

像出行，娛樂這些服務資訊，並不在智慧助手所能掌控的範圍內，屬於非中心資訊。在未來只有讓資訊去中心化，才能讓智慧助手接入相關的軟體，來幫我們比價購物，買機票訂酒店。

智慧助手的發展潛力還很大，相信隨著科技的進步，智慧助手有一天真的能變成你的助手。讓生活中很多瑣碎的事在語音交流中，就快速的幫你解決。