開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

「來源: |InfoQ ID:infoqchina」

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

從 2006 到 2021 ,整個中國對“雲計算”的認知,發生了巨大的轉變。

就在 2014 年,雲計算問世 8 年後,知乎上關於雲計算的提問還是“如何簡單通俗地解釋‘什麼是雲計算’”、“什麼是雲計算”;但到了 2019 年,類似提問已經和“中小企業”、“賦能”等關鍵詞緊密相連。

這樣的提問,最直觀地體現了雲計算在中國的特殊發展路徑:它發展曲線陡峭,又能快速逼近技術本質。從業者幾乎沒用幾年,就從單純的極客思維過渡到了業務思維,將雲計算和產業網際網路、數字化轉型緊密結合在了一起。

而在這樣一場“從雲端到地面”的加速落地中,華為雲尤為特殊 —— 相比於許多雲計算企業,華為雲在技術層面太低調了。無論是在華為自有的峰會上,還是在對外的開放活動裡,華為雲的主題詞幾乎離不開“聯創”、“共創”、“產業”、“服務”,其技術專家也很少出現在大型技術會議的講臺上。單純從技術角度,開發者對華為雲的感知並不算強。

因此也很少有人知道,在一項發起於 2018 年的全球雲計算專利數量統計裡,華為是唯一排進前十的中國企業,位列第八;其開源專案 Volcano、ServiceComb 在雲原生領域都有著非常廣泛的應用。

而華為 2020 年度報告也顯示,2020 年華為雲增速達 168 %,市場份額增速全球第一,在全球 IaaS 市場中,華為雲位列中國第二,全球前五。

這就有點奇怪了,是什麼樣的技術戰略,讓華為雲“悄咪咪”的就成了“全球五朵雲”之一呢?是什麼構築了華為雲如此硬核的技術底氣?

1 賦能千行百業的關鍵要素:速度與形態

我們首先來看一張圖。這張圖由典型領域與客戶、業務價值與特性、場景化解決方案、開天 aPaaS 平臺、雲原生技術賦能、華為雲技術能力基座等幾個關鍵部分組成,形象地表現了華為雲的發展戰略和技術支撐形態。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

而從這張圖中,我們也能發現,華為雲之所以如此有底氣,是因其始終以解決方案為核心導向,目標是“賦能千行百業”。客戶及行業生態,在華為雲的發展戰略中處於非常重要的位置。

就在今年 7 月 22 日,2021 中國國際數字和軟體服務交易會上,華為 ICT 產品組合管理與解決方案副總裁何霽就發表了“AI 賦能千行百業,助力數字經濟創新發展”的主題演講。而 AI 使能正是華為雲一直以來核心的三大使能之一,另外兩項分別是“資料使能”、“應用使能”。

如果時間軸繼續向前滾動,在今年 3 月 17 日,InfoQ 發表了一篇有關華為雲的報道,描述了華為雲是如何與武漢希望組(一家生物科技公司)合作完成對肺魚的基因測序的。肺魚是活化石,擁有迄今為止報道的最大的動物基因組(約 40Gb),相關研究成果直接助推了一篇《Nature》論文、兩篇《Cell》論文的發表。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

如果你以調查者的身份自居,一絲不苟的翻閱相關資料,將會發現類似發言、案例的出現頻率之高,簡直令人咋舌,遠超業內任何一家雲計算公司。華為公司高階副總裁、中國區總裁魯勇的一句話,可以很好地概括華為雲發展的整體戰略:

“千行百業的數字化大戰場,才是雲服務決戰的主戰場。”

這種戰略直接導致華為雲尤其注重“速度”和“產品形態”兩大關鍵要素,前者決定雲企業能否適應產業需求,後者決定了雲技術能否切實幫助產業進化。

速度自不必說,華為雲 2017 年才正式對外開放服務,到今天線上服務已經超過 220 個,解決方案超過 210 個,僅在今年的開發者大會上,就一口氣釋出了六類重型產品和服務:CCE Turbo 雲容器叢集、CloudIDE 智慧程式設計助手、GaussDB(for openGauss) 資料庫、可信智慧計算服務 TICS、華為雲盤古系列大模型 (包含全球最大規模的中文 NLP 大模型及 CV 大模型等)、多樣性計算基礎軟體。

而在 9 月 23 日的 HC 全聯接大會上,華為雲又釋出了新的成果,在“全球一張網”概念下,資料中心全球可用區增加了 16 個;SparkRTC 釋出,可靠性是業內標準的“四個 9 ”——99。99%;FunctionGraph 升級,支援 Serverless 有狀態函式;華為雲 Stack 8。1 版本釋出;AI 領域更新了盤古藥物分子大模型和天籌 AI 求解器;此外,GaussDB、區塊鏈服務都迎來了升級……

這樣的產品迭代速度不可謂不驚人。

而“產品形態”也是一樣,華為雲的 IaaS、PaaS、SaaS 層服務 2020 年就已經接近完備,在今年的 HC 大會上,又公佈了開天 aPaaS 服務,主要開放支付、搜尋、瀏覽、地圖、廣告五類數字業務根引擎。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

aPaaS(application Platform as a Service),意思是應用程式平臺即服務,Gartner 對其所下的定義是:“這是基於 PaaS(平臺即服務)的一種解決方案,支援應用程式在雲端的開發、部署和執行,提供軟體開發中的基礎工具給使用者,包括資料物件、許可權管理、使用者介面等。”

aPaaS 是 PaaS 的一種形式,和近兩年大火的低程式碼有著強關聯,又是雲計算深入千行百業的必經之路。

數字化轉型進入一定階段,PaaS 層面的服務開始變得越來越重要,但即便是在 IaaS 層高度隔離,平臺工具極大完備的今天,傳統的 PaaS 層服務還是不能完全適應企業的 IT 需求。

如果一個企業要求一名銷售總監,在 3 小時內開發一套定製化的 CRM 系統,在以往是完全不可能實現的,而在 aPaaS 平臺上只是基本操作。如果某個行業沒有專有特徵,也不需要專門的程式碼審計,aPaaS 完全可以適應需求。

而且,並不是只有小企業才需要 aPaaS,大企業也沒有必要為各個部門的各個系統都配備研發團隊和運維人員,把開發工作交給 aPaaS,維護工作交給雲,是比較理想的經營模式。幾年間,關於低程式碼的爭論頗多,也頗為激烈,都基本離不開技術價值、技術架構、技術人才梯隊等幾個關鍵詞。

但實際上,無論你贊同與否,相關應用都在以驚人的速度下沉到一線市場。所以,aPaaS 幾乎象徵著雲計算廠商,開始真正開始脫離“唯技術論”思維,在產品開發層面,形成了真正的業務思維。

華為雲這次釋出的 aPaaS 平臺覆蓋領域包括網際網路、政府、政務、金融、製造等,共計 50 個場景,幾乎全部是 aPaaS 的強應用場景,API 20,000 個,數量相當可觀。我們可以從華為雲後續放出的對外資料,來進一步觀察它在企業服務層面的佈局和思路。

2 核心驅動力:雲原生 2。0 與三大使能

無論是速度還是形態,這種產品層面的策略,反映的是一家雲計算公司對雲原生的理解。而對於華為雲來說,這種理解可以簡單概括為“雲原生 2。0”,由華為雲在 2020 年末提出。

雲原生 2。0 是相對於“雲原生 1。0” 而言的,我們耳熟能詳的 CNCF 雲原生體系,在這個語境裡,基本都屬於雲原生 1。0,它的代表技術包括容器、服務網格、微服務、不可變基礎設施和宣告式 API。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

CNCF 雲原生技術圖譜

但從本質上來談,雲原生 1。0 仍然是以資源為核心的,它存在三個斷層:

多雲之間的斷層:當下的容器編排對多雲多叢集的支援並不友好,管理員需要對不同叢集進行繁瑣的配置;

軟硬體間的斷層:容器服務的部署多基於虛擬機器,有較大的效能損耗和功能冗餘;

資源和場景間的斷層:雲原生面向資源和雲服務本身,不面向場景,對於在個別場景有需求的企業而言,上雲的效果差強人意。

一旦明確了問題所在,那麼雲原生 2。0 的特點也就呼之欲出了:

它要能解除廠商鎖定,跨雲實現容災和彈性伸縮,跨雲實現多個 Kubernetes 叢集間的自由遷移;它還要向下支援異構硬體,向上遮蔽硬體差異,用裸金屬伺服器承載容器服務,提升效能和資源利用效率。

這是最基本的,也最容易理解的兩個特性。硬體層面,華為雲裸金屬伺服器的推出非常之早,2018 年以前就有一定的市場應用。軟體層面,華為雲在今年 4 月宣佈多雲多 Kubernetes 叢集應用編排專案 Karmada 開源,實現了關於雲原生 2。0 的構想,實現了跨雲的容器服務編排排程。

Karmada 相容 Kubernetes 原生 API,能以模組化的方式提供應用多叢集部署、高可用排程、故障遷移、多叢集服務發現和流量治理、多雲叢集生命週期管理等能力集,面向多種典型的使用者場景預置策略集,並不是只做多叢集應用分發。

此前,業界對這類服務持普遍的悲觀態度:一個雲廠商,要釋出一個解除廠商繫結的產品,敢信麼?

Karmada 的開源在很大程度上打消了這種疑慮,華為雲 CTO 張宇昕還表示,Karmada 未來會考慮捐贈給 CNCF,而且 Karmada 本來也是以 CNCF 的開放治理理念為目標來開發的。那還疑慮什麼呢?先用起來再說吧。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

Karmada 架構設計

你可能會想,不對啊,前面只說了兩點,資源和場景之間的斷層怎麼解決呢?

資源和場景間的斷層問題比較複雜,可以說,PaaS 層以上的大部分服務都在嘗試解決場景問題,包括前文提到的華為雲 aPaaS 平臺。而要把資源和場景更好地連線起來,對於華為雲而言,主要依賴“三個使能”:AI 使能、資料使能、應用使能。

AI 使能

AI 使能的重要程度,從本次 HC 大會的產品釋出來看,就可見一斑 —— 其一是盤古藥物分子大模型,其二是天籌 AI 求解器。

盤古藥物分子大模型是盤古大模型的一個組成部分,其他大模型還有華為雲盤古 NLP 中文大模型;華為雲盤古計算視覺大模型;華為雲盤古藥物分子大模型;華為雲盤古科學計算大模型;遙感專用框架 LuojiaNet;鵬城盤古 NLP 中文大模型;鵬城生物製藥大模型等。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

在很長一段時間裡,AI 的模型訓練都是依賴於小場景下的資料集,很難大規模複製,也無法實現較為通用的模型訓練。盤古大模型是把眾多小模型做泛化複製,形成一個大型的預訓練模型,可以把訓練效率提升 10 - 100 倍,從根本上解決 AI 的產業化問題。

AI 求解器則是將運籌學和 AI 相結合的商用求解器,啥意思呢?當我們利用 AI 解決智慧城市場景下的交通規劃問題、電商場景下的物流運輸問題,遇到的阻礙可能並非來自程式碼,而是來自數學,企業要將萬級到千萬級的約束條件和變數,轉換成為對萬級到千萬級變數方程組的求解。如果要利用 AI 真正實現數字化轉型,數學規劃求解將是一個主要障礙。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

天籌 AI 求解器就是在這一領域取得了突破性的進展,速度最高可提升 100 倍。美國亞利桑那州立大學有一位 Hans Mittelmann 教授,長年在其個人網站上做數學規劃求解器的評測榜單,因為評測到位,被求解器業界奉為其軟體效能排名的事實標準。天籌 AI 求解器目前是 Hans Mittelmann 單純形求解器榜單的第一名。

資料使能

資料使能最容易理解,市面上有太多的雲端儲存、資料庫、資料湖等服務,核心聚焦點仍然是效能,產品表現和企業的研發能力密切相關,我們這裡也不再過多贅述。

在 HC 大會上,GaussDB 公佈的升級分為三個方面:

複雜查詢場景最佳化,90% 的邏輯計算在分散式儲存層完成,TPC-H 測試效能最高可達行業同類產品的 34 倍;

秒級伸縮,應用 0 感知;

雲原生多主架構,升級到 16 個主節點的寫入。

三個指標在業內都是較為引人矚目的。

應用使能

令人困惑的反倒是應用使能。應用使能最常出現的場景是物聯網,用於描述如何快速上線一個物聯網應用的使能問題,比較抽象。而在華為雲,有一套專門的解決方案對應著“應用使能”,叫做 ROMA。

拋開比較冗長的產品介紹不談,ROMA 的功能可以概括為:數字化資產管理,提供應用的開發、運維、託管和整合服務。ROMA 主要分為三個模組,分別是:

1。ROMA Factory:應用工廠,提供 DevOps 服務;2。ROMA Connect:應用與資料連線,實現跨雲、跨地域、跨業務、跨裝置整合;3。ROMA Exchange:應用資產中心,實現資產的盤點、管控,共享、變現。

根據這些特點,我們很容易推測出,ROMA 最適合解決政府及公共事務場景下的技術問題,比如新老應用並存、資料孤島、應用開發成本過高等。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

ROMA 解決方案架構圖

像 ROMA 這樣的服務,在華為雲內部其實比比皆是,它們紛紛歸類到應用使能、AI 使能、資料使能三個範疇中,向上對齊的是具體的需求場景,向下依託的是具體的雲原生服務,比如雲容器引擎、應用編排服務、雲端儲存、雲資料庫、應用中介軟體、AI 基礎平臺……

這些都是對資源和場景間的斷層問題的解答,也是雲原生 2。0 理念的體現。當然,雲原生 2。0 涉及的問題還有很多,比如應用敏捷、業務智慧、安全可信,但萬變不離其宗,如何更好地面向場景,以應用為中心最大化輸出雲資源,才是箇中關鍵。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

3 全棧底層技術能力基座

無論 SaaS、PaaS 層如何深入使用者場景,公有云的技術底氣還是來自於基礎層。對於華為雲而言,就是擎天架構和資料中心、加速網路。

為了做好擎天架構,華為雲用了八年。擎天架構共分為兩大模組:

軟硬協同系統:連線資料中心、硬體和上層軟體,從極簡資料中心、多樣性算力、擎天系列卡、極速引擎、極簡虛擬化五個維度進行軟硬協同創新;

智慧雲腦:面向雲、AI、5G 時代打造的分散式雲作業系統,依託全域排程能力實現雲邊端的協同與治理。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

華為雲 Stack、包含 x86、鯤鵬、昇騰 AI 在內的多樣性算力選擇、裸金屬容器、邊雲協同能力,都是基於擎天架構構建的,命名為“擎天”可以說是毫不誇張。

比擎天更底層的就是資料中心和雲網絡了,它直接決定一個公有云跨地域的、物理層面的服務邊界在哪裡。

華為雲的理念是“全球一張網”,意思是透過一個賬號、一個入口、一份賬單,一點接入,通達全球。向上用統一架構整合夥伴雲、公有云、混合雲、邊緣雲,向下在中國、拉美、南非、歐洲、俄羅斯、亞太、中東加強資料中心和網路建設。

乍一聽好像沒什麼,但我們可以透過一個具體的案例,來感知一下這種雲服務能力。華為雲在烏蘭察布 Region 構建了一個“全球最大渲染基地”,可以用數量高達 30 萬核的雲渲染能力,加速一部 90 分鐘 3D 電影的渲染工作 —— 原來可能需要六個月,現在只需要兩週。

沒有什麼技術服務能比這更實際了,實現最大程度的降本提效,永遠是數字化轉型的核心底層需求之一。

4 結語

在剛剛結束的 2021 華為全聯接大會上,華為高階副總裁、華為雲 CEO、消費者雲服務總裁張平安發表了“深耕數字化,一切皆服務”的主題演講 。“基礎設施即服務,讓業務全球可達,技術即服務,讓創新觸手可及,經驗即服務,讓優秀得以複製。“在筆者看來,這段總結非常到位,既是體現了華為雲的實力,也飽含著對未來服務千行百業智慧化的願景。

開天、盤古、全球一張網,探秘華為雲的技術底氣|Q推薦

這與華為雲所有的技術、產品進化方向都是一脈相承的。或許,以此為基礎的科技向善,才是讓一家企業能長期保持高速發展的真正原因吧。