華為十大待突破數學問題之七:反問題求解

反問題(inverse problem), 顧名思義,是一類需要逆著思考來尋找答案的問題。你可能會很難相信,相當多的數學實際應用,都屬於對這一類反問題的求解。

福爾摩斯探案如神,屢破奇案,歸結起來其實是因為:卷福的最大優勢是逆向機率思考。罪犯總是盡力隱藏自己的作案痕跡,阻止任何人推測出其行案過程。這是一個正向發生的過程。而卷福透過細緻勘察現場,利用常識推理,不斷生成和推翻各種可能性假設,最後得出最有可能的作案方法。這是逆向尋找答案的過程。可以說,卷福是一個解決反問題的高手。

還有一個可以更直接感受反問題魅力的方法,如果你玩過數獨或者填詞遊戲,你曾絞盡腦汁去破解那個文字謎題的過程,就是在求解一個反問題。那麼此時“正問題”是什麼呢?即是那組經過精心編排後被摳掉字母的謎底詞語了。

華為十大待突破數學問題之七:反問題求解

填詞遊戲

為何華為公司會把對反問題的求解列為通訊產業十大待突破數學問題之一?理解了以下這些產業應用你便會明白。

1。 影象訊號分析

影象分析是一種從影象訊號中提取資訊的數學應用技術。影象分析最早與通訊密不可分。二戰時,美軍研發的雷達探測系統,能在廣闊而瀰漫的空間電磁波場中,定位出敵機入侵的訊號;能利用海底聲吶返回的震盪波,推斷出敵機的具體位置。到了現代,醫學影像中的造影成像問題,比如CT、B超、彩超等分析儀器,工業領域裡的石油勘探,空間遙感領域裡的空間導航定位系統, 移動手機裡的攝影影象最佳化等等,皆是影象分析的具體應用。

華為十大待突破數學問題之七:反問題求解

CT腦成像

2。 通訊編碼與密碼

並不是每一類反問題都有正解,對於一些反問題,如果你不是擁有“滅霸”般操縱全宇宙算力的能力,近乎不可解。有科學家畢其一生致力於設計可有效求解的反問題,也有科學家費盡心機設計絕難破解的反問題。最妙的是,二者皆有實際應用,而且都運用在安全通訊領域。 通訊理論的鼻主夏農(Claude Shannon)在資訊理論開山論文中即證明了資訊編碼理論的邊界所在,即有噪音干擾的通道中傳遞訊號,編碼長度和編碼糾錯能力有一個本質的制約力,這個制約取決於噪音的水平高低。 邊界內,你總可以設計出一種編碼方法,使接收方有方法高效地解出反問題,得到原始傳送的資訊;邊界外,沒有一種編碼方法能保障通訊的完整度。

在當前的5G時代,LDPC資訊通訊編碼技術已相當成熟,其工作原理可簡述如下:在傳送訊號的源頭手機上,傳送者的手機利用LDPC編碼機將一個“拼字遊戲”(原始資訊)裝進如下的編碼圖結構(對應一個稀疏的矩陣);在訊號接收者那裡,接收者的手機也利用LDPC技術,反向地解密經“拼字遊戲”編碼過的隱含詞語(原始資訊)。幾乎所有現代通訊工作都依賴以上的編碼原理,也幾乎所有通訊工程師都在可有效解碼的反問題上工作。

華為十大待突破數學問題之七:反問題求解

LDPC編碼與解碼

那麼為什麼要設計那些不可能被破解的編碼方法呢?答案是資訊保密,無論是出於軍事保密目的(如軍隊作戰計劃資訊),還是商業保密目的(如郵件資訊)。二戰催生了通訊技術的發展,也促進了密碼技術的進步。從前打仗,飛鴿傳書,頂多是把信中的文字進行轉譯,或者對照著一本工具書進行編碼。二戰中,德軍使用的ENIGMA編碼機是當時最複雜最先進的密碼技術,但由於其從數學本質上是可解的,最終被圖靈領導的一個英國秘密團隊給系統化地破解了。除了順帶發明了計算機,我們也需要注意到,圖靈招募團隊成員時專門挑選那些特別擅長做“填詞遊戲”的候選人,考慮到團隊正在解決的是一種巨難無比的反問題,這確實是尋找解碼好手的有效 方法了。

華為十大待突破數學問題之七:反問題求解

二戰德國ENIGMA密碼機

3。 網頁搜尋排序, 網路交社群發現

如何從全世界數以千億計的網頁中找到與你感興趣的話題最重要的那些網站,如何有效地幫你篩查掉那些為了賣廣告,拼命用關鍵字刷榜的垃圾網站?這是一個好用的搜尋引擎必須解決好的問題。對你最重要的網站就躺在那裡,但由於網際網路天然的分散式和匿名性,沒有人能告訴你到底是那一個,谷歌搜尋引擎只得透過資料觀察來幫你反向推斷出來。 谷歌最早的演算法源於拉里。佩奇及同僚們的一個發現,即網頁間的超連結結構隱藏著網頁質量的重要資訊,利用這些超連結網路結構可以反向推斷出這些隱藏的資訊,後者最終可以轉化為針對逐個網頁的重要性打分,也就是PageRank演算法。

華為十大待突破數學問題之七:反問題求解

網路中的隱藏社群發現

同樣地,Facebook也在利用社交網路解密你的興趣社群或者你潛在感興趣的話題;觀察大腦神經元細胞的連線網路也在幫助腦科學家們解密人類語言或者數學推理活動主要是如何透過低功耗的大腦進行的,也試圖探究阿茲海默疾病的起源。

4。 高維統計訊號處理

現代統計學繞不開兩個主題: 高維與計算。甚至可以說,進入21世紀,已經很難區分出統計學與反問題求解的根本區別了。無論是貝葉斯派,還是頻率派統計學,都在致力於解決大規模高維度訊號的探測和估計問題。同時,現代統計學越來越依靠大型計算機求解複雜的建模問題。統計學的本質是對不可直接觀測的引數,利用能觀測到的資料,進行最優的推測。所以,其本質也是一類反問題求解。

現代生物學十分依賴統計學對高維資料的分析和處理能力。以“下一代基因測序技術”為例,高通量測序已開始廣泛應用於尋找引起癌症疾病的候選基因上。透過對多個病人的細胞基因進行快速全位掃描,我們可以合成一個維度超高的複製活動水平度矩陣。利用病人是否患有某類疾病的標籤,高維統計學可以反向解密出,到底是哪些基因變異造成了該疾病的發生。一旦定位出那一組致病基因(通常是多個基因共同作用),便可利用一些靶向藥物,甚至是基因編輯技術來精準治療疾病。

華為十大待突破數學問題之七:反問題求解

高通量基因測序法

前面我們介紹了反問題的幾個重大應用場景,可以說,華為公司選擇懸賞全球數學家來一起突破這個難題實在是很內行。事實上, 反問題的解決涉及到多個基礎數學領域分支的多個未解決難題,下文簡要列舉幾項。筆者若有空會逐個進行解讀,說不定讀者群體中臥虎藏龍,在數年內能解決一兩個方向,那麼實在是造福社會大矣。

1。 貝葉斯統計學及其計算方法,如MCMC演算法;

2。 資訊理論及其數學基礎, 如近幾年有重大突破的高維球堆疊問題;

3。 稀疏與訊號表徵,傅立葉與小波等運算元理論;

4。 高維幾何與統計, 如深刻瑰麗的高維空間測度聚集現象;

5。 統計物理中的相變與隨機矩陣理論 ;

6。 隨機圖理論。