關於引爆全球的ChatGPT,AI演算法工程師和分析師們的看法並不相通|數智前瞻

隨處可見,AI 對話機器人 ChatGPT 正在引爆全球。

關於引爆全球的ChatGPT,AI演算法工程師和分析師們的看法並不相通|數智前瞻

圖源網路

然而關於它的應用,AI演算法工程師的看法和產業分析師們卻並不相通。

ChatGPT 作為低門檻、高效的 AIGC 文字內容生產工具,被認為將在智慧客服、虛擬人、遊戲等領域得到更大落地應用,也對很多算力、資料標註、自然語言處理等底層技術公司利好。

而在產業應用側,似乎還在觀望。作為一項剛剛出現的新技術,企業的AI演算法工程師會認為,錯誤率和高成本仍然是阻擋快速落地的最大阻礙。

行業分析師看到的是技術帶來的未來想象力,產業裡的AI工程師看到的是具體的困難。而技術的長期進步不應該被低估,技術短期的進展也無需高估,兩者相結合或許是看待ChatGPT商業機會更合理的方式。

此刻,想要透過ChatGPT真正賺錢,可能還需要考慮開源、成本、倫理、監管等諸多問題。AI 代表的未來已經迅速到來,它將怎樣改變科技程序和商業模式?

01 ChatGPT有哪些商業化可能性,企業如何上車?

作為 OpenAI 在11月30日剛剛推出的免費機器人對話模型, ChatGPT 是在GPT-3。5系列中的一個模型上進行微調而成,有著多達1750億個模型引數。模型中首次採用 RLHF(從人類反饋中強化學習)方式,已在今年初完成了訓練。目前處於測試階段,面世一週便已有超過一百萬使用者使用。

聊天、寫程式碼、寫小說、寫論文,以 ChatGPT 為代表的 AI 聊天機器人似乎已經無所不能,甚至即將會取代很多人的工作。

而我們更關心,哪些場景更有可能真正應用起來?

內容創作、客服機器人、虛擬人、機器翻譯、遊戲、社交、教育、家庭陪護等領域,或許是 ChatGPT 能快速落地的方向。

浙商證券認為,ChatGPT 模型的出現對於文字模態的 AIGC 應用具有重要意義。包括但不限於程式碼機器人、小說衍生器、對話類搜尋引擎、語伴、語音工作助手、對話虛擬人等下游應用,都將受益於 ChatGPT 技術的逐漸成熟。

關於引爆全球的ChatGPT,AI演算法工程師和分析師們的看法並不相通|數智前瞻

圖源網路

在智慧客服領域,因為ChatGPT可用於建立能與使用者進行對話的聊天機器人,這將對客戶服務很有幫助。同時,由於ChatGPT可以進行微調,以回答特定型別的問題,可以幫助建立虛擬助手或其他型別的資訊提供系統。

而實際上,新技術從出現到落地的應用,要有一段很大的鴻溝需要跨越,行業真實的聲音或許並不那麼熱烈。

樂言科技的智慧問答技術負責人邱傑博士告訴36氪,對於智慧客服行業來說,目前對於ChatGPT的應用還處於觀望和保守的階段。一方面是由於電商客服行業需要依據固定SOP,提供確定性和高準確率的回答,ChatGPT展現的創造性反而不適用於這個場景;另一方面,目前的高成本和不明確的收益點,也使智慧客服行業仍然需要等待找到一個更好的落地方向。邱傑也提到,儘管如此仍然會對ChatGPT相關技術保持關注,同時在強化學習、多模態內容等方面不斷嘗試和應用。

在遊戲和社交媒體等偏虛擬的場景,ChatGPT可以用於建立與使用者進行對話的虛擬代理或虛擬化身,也可以根據輸入資料生成類似人類的文字響應。這對於相關應用程式建立內容很有幫助。

特別是在文娛寫作領域,騰訊、百度、中文線上和閱文集團等公司,都在嘗試 AI 相關的寫作專案——騰訊的寫稿機器人,百度集團的文心大模型,中文線上的 AI 文字輔助創作功能,閱文集團攜手微軟打造 AI 賦能網路文學等。ChatGPT將對文字生成領域帶來新的創作模式。

不僅改變創作,ChatGPT還有可能改變獲取資訊的主要方式。

國盛證券指出,相比於此前的 AI 繪畫,ChatGPT 更具有將 AI 能力與工作流程相結合的潛力。

如果將 ChatGPT 與 Midjourney 、Stable Diffusion等創作工具融合,把它輸出的結果作為一箇中間變數輸入其他模型,有可能直接輸出設計圖稿等內容。文字生成是基礎,而使用者要做的儘量調整自己的輸入,以促使 AI 輸出更質量的內容,這本身也是一種訓練和反饋過程。 部分使用者已在社交媒體上表達了對 ChatGPT 的付費訂閱意願,C 端使用者的需求也將帶來更大的商業化可能性。

程式設計機器人也是備受關注的一個應用場景。

海通證券的研究提到,作為一種對話式大型語言模型,ChatGPT 最擅長的就是回答使用者提出的問題,其中最關鍵的是 ChatGPT 具備與程式設計相關的基礎知識。這就讓 ChatGPT 成為類似於 Stack Overflow 的程式設計問答工具,只不過回答問題的主體是AI。如OpenAI官網展示,面對使用者對於debug的請求,ChatGPT會先和使用者互動確認debug過程中需要關注具體問題,從而給出正確的程式碼。

值得注意的是,因為ChatGPT自動生成的答案質量太低,錯誤太多,Stack Overflow 宣佈臨時性禁止ChatGPT 生成的內容釋出在其社群。

同時,算力、資料標註、自然語言處理(NLP)等上游需求,也將推動相關技術公司的發展。

專業機構預計到2025年,AIGC將佔所有生成資料的10%,甚至有潛力產生數萬億美元的經濟價值。

隨著 AIGC 技術在全球的興起,算力需求將越來越顯著。目前 OpenAI 等巨頭已著手自建計算叢集來滿足 AIGC 的要求,這種集中式的訓練對 GPU、 儲存、機房、供電等基礎設施均有巨大需求。國內部分創業團隊目前基於公有云訓練, 隨著需求的增加,也有望轉向自建叢集。

一流科技的創始人兼CEO袁進輝告訴36氪,ChatGPT背後一整套的技術也意味著很多重塑的機會。算力、演算法、系統、晶片可以透過購買得到,但資料還不是有錢就能買到的。

他認為,ChatGPT在預訓練模型上又近了一步,透過InstructGPT技術使用了人類對模型訓練進行反饋和指導的強化學習方法,也就是需要資料標註員來調教模型,實現了比無標註資料基礎上預訓練模型更好的效果。

因此,雲廠商、晶片、算力公司等,特別是資料標註公司都將迎來新的機會。

Web3.0 圈子同樣非常關注 ChatGPT 的出現。

以太坊創始人 Vitalik Buterin 釋出了使用ChatGPT進行編碼試驗的文章。根據其試驗結果,ChatGPT在編碼過程中會出現錯誤,但也提出一些新的編碼模式,並且會加快編碼速度,作為程式設計輔助工具很有幫助。他表示,「AI正在迅速改進,我希望它能繼續進一步最佳化,並隨著時間的推移消除此類錯誤。然而,AI遠不能替代人類程式設計師。」

有分析認為,ChatGPT和Web3之間存在多個可能的結合點。

包括學習 Web3 基礎知識,但僅限於2021年之前的資料;自動編寫一些基礎程式碼;輔助寫作;用作 discord、電報等 Web3 社群的聊天機器人;使用 ChatGPT 生成 AI 作圖所需的 prompt 提示詞,然後用於 AI 畫作;接入 Web3 遊戲,用於 NPC 對話系統等。

有人也利用ChatGPT進行了從理論到編碼的Web3實踐測試。

他們改變了提案-投票的DAO治理機制,由ChatGPT提供可以基於自然語言,對智慧合約進行需求撰寫、自動建立與鏈上部署的自動化能力。測試者認為,「ChatGPT將幫助原創深度內容的創造者,邁入職業生涯的新臺階,ChatGPT與Web3的結合,是內容創作者與產品開發者的黃金時代。」

每一個顛覆性技術的出現,都是一次洗牌的機會。抓住機會「上車」是幾乎所有企業的必選項。

一流科技的創始人兼CEO袁進輝認為,將ChatGPT作為技術基礎設施,加上自身行業資料進行訓練,會成為某種實踐的方向。

應用側企業也有相似的感受。矽基智慧的創始人&CEO司馬華鵬告訴36氪,ChatGPT將會成為一個技術生態,但它學習的是網際網路上公有域的知識,不能解決具體行業企業的個性問題。因此更多創業公司應該在AI技術基礎上,提出更貼近客戶具體需求和痛點的解決方案和產品。

例如,作為虛擬人公司,可以針對醫療、銀行等某個行業中的企業,單獨形成解決方案,再用ChatGPT等AI技術將對應的私有化知識加進去進行模型訓練,從而解決實際問題。

02 距離賺錢,還有多遠?

想要真正實現收益,在成本、技術和倫理等方面,ChatGPT還有很多需要關注的問題。

首先,在規模化之前,要面對訓練成本持續上升的問題。

根據 ChatGPT,其單輪對話平均費用在 0。01-0。2 美元。創始人Sam Altman稱,

「我們將不得不在某個時候以某種方式將其貨幣化,計算成本太大。」

OpenAI很注重商業化應用,但並不急於創收;背靠微軟,也並不缺錢。這次ChatGPT是免費不限量向公眾開放,而此前GPT-3是根據使用量(token)來收費的,已經擁有大量客戶。

在使用過程中,使用者可以提供反饋,這些反饋互動是對OpenAI最有價值的資訊,也是推動進步的關鍵一環。這種免費使用的方式,能夠以低成本的方式大量獲得真實樣本,同時擴大 ChatGPT 的影響力。袁進輝同樣認為,成本在技術的顛覆突破面前只是時間問題。

除了成本,ChatGPT仍存在一些技術侷限性。

儘管相比GPT-3,ChatGPT在模型表現方面形成突破,但目前可能仍需要進一步的除錯和訓練,從而達到商業使用的標準。

很多使用者反應,ChatGPT偶爾會犯錯誤,提供的資訊有一定誤導性;並且會過度揣測人的偏好。

還有一個致命缺點是,它不能透過網際網路進行實時檢索資訊。

出門問問的創始人兼CEO李志飛就在朋友圈提到,「相對於語音助手和搜尋引擎,ChatGPT目前還不能幹或幹不好的: 1。 最重要的,不能給你查附近的川菜館;2。 不能幫你打電話、定日曆、播放歌曲等手機本地操作;3。 大機率不能回答訓練時它沒有看到的最新網頁知識,比如說不一定能正確回答一個五年前活躍但今天不再活躍的政治人物今年的年齡;4。 大機率不能做對簡單的邏輯題和加減乘除題。總結來說,ChatGPT的『認知』建立在虛擬訓練文字上,沒有跟實時的資料庫或資訊連線,沒有語義理解需要的grounding,也沒有顯式的邏輯推理,還是有點空中樓閣的味道,所以特別適合一本正經的胡說八道和插科打諢。當然,上面這些問題可以透過hack的方式解決,但是就喪失了GPT的優雅、簡單和通用性了,那跟『傳統』的方法也就沒太大差別了。再當然,ChatGPT表現出來的能力是驚人的和偉大的,只是跟所有新技術hype一樣,也沒有想象的那麼驚人,路漫漫其修遠兮,AI還得不停探索!」

由於其學習的知識僅限於 2021 年之前的網際網路離線文字,因此很多最新的問題是無法得到解答。對於中文使用者而言,語料的不足也導致它在中文對話能力上要稍遜於英文。

但在MIT Technology Review對OpenAI科學家的採訪中,他們提到了後續有可能將ChatGPT和WebGPT的能力結合起來。ChatGPT+WebGPT可以對資訊進行實時更新,並且對於事實真假的判斷將更為準確。ChatGPT具有強大的工程化、迭代反饋的能力,並且作為AI能夠跟人類目標統一。

模型訓練的資料來源也是一大問題。

ChatGPT這樣的大規模預訓練模型,需要利用人工智慧,對網際網路上海量的語言、文字資料進行資訊挖掘和內容理解。然而如今複雜的資訊場景中,資料質量參差不齊,語言模型的訓練和學習更加困難。

當ChatGPT帶來種種新的技術需求出現,像一流科技等可以為訓練大模型提供軟體演算法支撐的底層架構公司,也將有新的機遇。

AI 的發展始終伴隨著懸而未決的科技倫理問題。

OpenAI 背靠微軟, 使用傳統的API方式,中心化地管理 AI 倫理道德、版權等安全問題。

Dall-E2的使用協議中規定了其影象版權歸屬OpenAI;同時,其訓練模型的資料也是封閉的,無法檢視。

但由於聊天機器人和文字生成工具等很可能會不分質量好壞和是非觀地對網路上的所有文字進行學習,進而生產出錯誤的、惡意冒犯的、甚至是攻擊性的語言輸出。OpenAI還要不斷摸索,結合使用者反饋,模型還需要遮蔽掉這幾天大家試驗出來的繞過系統限制產生負面資訊的方法,避免社會偏見、錯誤資訊和毒害資訊等內容。

在袁進輝看來,目前存在這些問題是很正常的,長遠來看,隨著時間和投入一定可以被解決。在ChatGPT未來將產生的商業應用價值和當下的投入來比,是必然會被解決的。

在開源問題上,業內普遍不認為OpenAI會將ChatGPT模型開源化,就像GPT-3也並沒有開源一樣。

但袁進輝認為一年時間左右,市場上巨頭都會投入競爭,在社群出現開源版本,逐漸成為一種 AI 基礎設施。

03 放眼望去,哪些事情將被改變?

「從上學開始做AI的研究也有20年了,所以無論群眾對AI多麼熱情,自己一直覺得AI沒有什麼神秘感,也不覺得它能創造奇蹟,但最近AIGC 和 OpenAI ChatGPT還是讓人非常吃驚。的確就像有人說的,大模型和BERT雖然都是transformer,但已經不是一個物種了。」這是一流科技的CEO袁進輝對ChatGPT出現的直觀感受。

ChatGPT 在尋找答案、解決問題的效率上,已經部分超越瞭如今的搜尋引擎。許多人都在擔心,我們的下一代搜尋引擎或許不再是Google。

業內人士認為,ChatGPT 替代Google其實還有點遙遠。

儘管模型能夠提升搜尋的準確性和互動性,但其成本比較高,免費的試用期過後,從價效比角度考慮,ChatGPT在短時間內替代谷歌難度較大。但它可以作為當前搜尋引擎服務的一種補充,也會對現有的搜尋引擎公司產生一定衝擊,促進巨頭間競爭。

同時,由於 ChatGPT 仍無法很好解決提供虛假資訊和過度猜測使用者意圖的問題,因此仍更偏向 AIGC 內容生產工具,而不是搜尋引擎這樣的尋找資訊集合和答案的工具。

ChatGPT被業界視為 AIGC 的顛覆式里程碑。

最近風靡的 AIGC 應用包括自動生成文章、文字生成圖片等,如MidJourney、Stable Diffusion、Jasper等平臺。AI內容生產工具,正沿著「文字-圖片-聲音-影片」的數字媒介演進的路徑爆發式湧現。

同時,信通院的《人工智慧生成內容(AIGC)白皮書(2022年)》也指出,近年來超級深度學習的發展也帶來了深度神經網路技術在大模型和多模態兩個方向上的不斷突破,支撐AIGC不斷升級,可以完成更豐富和生動的數字內容生成。

在 OpenAI 的 CEO Sam Altman 看來,我們能夠透過 ChatGPT 與計算機交談、並獲得我們想要的東西,這使得軟體從命令驅動轉向了意圖驅動。ChatGPT 作為一種語言介面

將是我們實現神經介面之前的最好方案。

更進一步,由於ChatGPT將人對結果的反饋成為其學習過程的一部分,每走一步都觀察人類的反饋,朝著人類期望的方向進發。

因此ChatGPT代表的AI技術將有可能拓展到更多領域,比如人的情感。

司馬華鵬告訴36氪,未來如果AI可以與使用者產生情感互動,將在遊戲、電商、搜尋、社交等商業領域產生非常大的革命。特別是對於矽基智慧正在做的數字虛擬人來說,如果可以連線到ChatGPT這樣的引擎上,現在的虛擬人短影片、直播等內容將呈現出新的面貌。對於抖音這樣的內容平臺來說,原有的生產模式會被打破,因為AI生產的內容將是無限的。

除了具體的應用場景,ChatGPT為代表的國際性AIGC平臺很有可能成為未來新的 AI 基礎設施,同時也向更垂直和專業化的方向發展。

上一次給世界帶來如此大震撼的AI還是擊敗李世石的AlphaGo,轉眼新的革命又在眼前。OpenAI 的 CEO Sam Altman在推特上寫道:「Trust the exponential。 Flat looking backwards, vertical looking forwards。」

ChatGPT 或許正讓我們處在某個起飛的點上。