AI加持的WPS來了:金山開源全球首個辦公DL框架KSAI-Lite

機器之心原創

作者:澤南

自動生成 PPT,自動圖片轉文字 + 翻譯,甚至自動輔助寫文章…… 辦公自動化的未來已來。

WPS 是個已有超過 30 年曆史的辦公軟體,但它最近的使用者數量增長卻越來越快——這款工具目前已有接近 4。9 億活躍使用者,其中還包括 1 億海外使用者。

如此受歡迎的原因當然是因為最近的大幅升級,如今在 WPS 上你會發現不少 AI 能力的加持。

7 月 22 日,金山辦公在珠海舉行了首次技術開放日。在活動中這家公司不僅展示了 WPS 上最新應用的技術,還發布了 KSAI-lite,業內第一個面向辦公領域的深度學習框架。

AI加持的WPS來了:金山開源全球首個辦公DL框架KSAI-Lite

對於眾多使用者來說,如今的 WPS 已不再僅僅是一個檔案編輯工具。「WPS 是一個成熟的辦公軟體,應該學會自己做 PPT 了,」金山辦公副總裁、AI 中臺負責人姚冬說道。

用最新版本的 WPS 編輯簡報,你只需要用文字列出一個思維導圖,或者在每一頁空白的 PPT 上打上文字,甚至只需要開啟一個 Word 文件,AI 就可以幫助你實現智慧配圖、表格美化、多圖拼圖、多圖輪播、圖片介紹等多種效果,幾秒鐘生成一份可用的 PPT。

AI加持的WPS來了:金山開源全球首個辦公DL框架KSAI-Lite

如上圖所示,「智慧美化」功能可以自動為純文字內容推薦出幾十種 PPT 樣式,加入背景、調好字號和格式,它們都是使用 AI 演算法基於文字內容的語義產生的。如果你已有素材圖片,只需要把它們堆放在幻燈片上就可以一鍵美化圖片,自動整理好排版或加入動畫特效。

這種自動生成 PPT 的功能既可以進行單頁面美化,也可以實現全域性換膚、對齊排版、配色、字型統一等問題。在使用時,你只需關注要介紹的內容,無須在選模版、調格式等操作上花費時間,大幅提升了效率,也解決了不常做 PPT 的人「一時找不到如何下手」的重要問題。

值得注意的是,在 AI 推薦的模板中,也有相當一部分是由演算法自動生成的,這些都是金山辦公後臺幾十臺伺服器 AI 模型訓練獲得的成果。

除了自動生成 PPT 之外,WPS 強大的 OCR「光學文字識別」技術也被人們經常使用。這個工具可以將書籍和檔案的圖片轉成文字,並保留原排版,讓原照片上的表格、分欄和圖片都轉至新文件中,併成為可編輯狀態。對於 AI 來說,即使是照歪一點也不是問題。

金山辦公還介紹了 WPS 中的「輔助寫作」功能:如果你對寫文章一時沒有思路,只要寫一個大概的提綱,AI 就可以自動生成一些段落。沒開始寫的情況下文章就已經有上千字了,其中都是語料演算法生成的段落。

自動生成的文字內容合理嗎?金山辦公表示,用於模型訓練的語料庫是與人民網等機構合作完成的,其中包括媒體歷年釋出的文章,此外還包含大量官方出版物。

輕鬆辦公是金山對 AI 時代辦公軟體確立的目標。「在效率上,WPS 的智慧美化、智慧表格等功能可以將使用者的很多操作由分鐘級提升至秒級;在使用者體驗方面,我們自研的全文翻譯引擎可以解決不同類別文件識別翻譯難、排版還原難等問題,快速輸出高質量的譯文,」姚冬表示。

AI加持的WPS來了:金山開源全球首個辦公DL框架KSAI-Lite

金山辦公副總裁、AI 中臺負責人姚冬在活動中。

在開放日上,金山辦公還發布了一款人工智慧深度學習推理框架 KSAI-lite,這是一款免費、開源、跨多個終端的全新工具,適配國內外主流軟硬體平臺,在 OCR、機器翻譯、智慧校對等落地場景上為開發者們帶來了新選擇。

KSAI-lite 面向通用性、高效能、輕量和專業性四個目標構建。在技術實踐中,金山的開發團隊在多框架支援、軟硬體適配、效能、功耗、記憶體等方面都進行了最佳化。

在 KSAI-lite 中首個開源的是 OCR 模型,其支援移動端裝置的離線識別,模型和庫檔案共計不到 9MB。該模型在文字檢測、文字分類和文字識別上都表現出了業內第一梯隊的效能。

據介紹,KSAI-lite 框架底層基於 TensorFlow,目前已經在 GitHub 上開源:https://github。com/kingsoft-wps/KSAI-Toolkits

AI加持的WPS來了:金山開源全球首個辦公DL框架KSAI-Lite

金山辦公表示,未來 KSAI-lite 還會在更豐富的平臺適配能力、更個性的開發方式、更穩定的業務支援能力上持續發力,為金山辦公產品線和整個業界提供更多 AI 能力的支援。

金山辦公轉型 AI 的時間其實已經不短:其自 2017 年成立的 AI 中臺如今已擁有超過 100 人的規模。幾年內這一團隊完成了 OCR、文件翻譯、圖文識別檢測等多領域應用的落地,一些研究也已被 AI 頂會收錄。

迄今為止,金山辦公 AI 中臺圍繞辦公領域的計算機視覺、自然語言處理相關演算法研究已開發了近 100 項 AI 能力,WPS 的智慧校對功能月校對字數超過 70 億,智慧生成的內容佔據雲端整體內容資源的 33。6%,智慧美化功能月度活躍使用者數量也已超過百萬。

在公司內部,AI 中臺還打造了基於分散式訓練的 AI 訓練平臺,包含了訓練資料處理、訓練排程、服務監控告警、鏈路追蹤等一站式平臺。

WPS 在辦公軟體領域已擁有 30 餘年的技術積累,由於支援從 Windows 到 Linux 的絕大多數作業系統和硬體,它受到了人們的持續歡迎。隨著 AI 等技術的應用,未來我們還能期待 WPS 為我們帶來更多、更方便的功能。

「WPS 為文字處理而生,而文字是辦公活動的核心。我們在未來會繼續以文字處理為核心研發新技術,滿足企業數字化轉型的巨大需求,」姚冬表示。