Science:常見合成反應的自動化

本文來自微信公眾號:X-MOLNews

現代有機化學中的大多數實驗都需要使用文獻中的方法預先製備反應物,如果能將其中最常見的合成工作自動化,無疑可以為化學家節省大量時間和精力。目前,已經有基於不同策略的化學合成自動化平臺已建立起來,如UIUC的Martin Burke課題組基於迭代偶聯的合成機器(

Science

2015

347

, 1221,點選閱讀詳細)、Pfizer的基於流動化學的自動化系統(

Science

2018

359

, 429,點選閱讀詳細)以及

英國格拉斯哥大學Leroy Cronin

課題組的基於傳統化學實驗流程的Chemputer合成機器(

Science

2019

363

, eaav2211)。

近日,

Leroy Cronin

課題組進一步完善他們發展的自動化合成機器,並在

Science

上發表了他們的研究新進展。此項工作中,他們構建了

包含103個分子的可自動化執行化學反應資料庫,並使用自動合成平臺Chemputer對其中53個分子進行了實驗驗證,所達到的產率和純度與專業化學家相當

。該資料庫涉及當代有機合成中多種常用反應,包括過渡金屬催化的偶聯反應、雜環形成、官能團相互轉化和多組分反應,具體的反應合成操作步驟透過化學反應程式碼(chemical reaction codes)的形式儲存在資料庫中。此外,他們還使用能與平臺無縫銜接的色譜模組(使用相同語言程式設計)自動純化了一系列化合物。

Science:常見合成反應的自動化

Chemputer自動進行合成反應

此前,Chemputer已證明一系列不同的分子可以在相同的硬體上自動合成。然而,整合現有的不同自動化策略仍是領域內的重大挑戰。作者認為,需要一種允許系統可程式設計和模組化的通用方法將各種合成步驟統一起來,從而能夠自動合成絕大多數可人工合成的分子。此外,為了充分利用自動化合成機器以及保證合成步驟的可重複性,需要滿足兩方面要求:一是擁有能完成所有合成所需單元操作的通用型自動合成平臺;二是需要有標準化的“語法”(程式設計程式碼)來準確描述合成操作。而且這種程式碼必須與硬體無關,使其可以成為統一描述程式碼。

本工作中,作者構建了從文獻中提取合成操作步驟並轉化為化學描述語言(Chemical Description Language, χDL)的工作流程,將χDL傳到ChemPU(Chemical Processing Unit,類似普通計算機的CPU)則可以自動按照定製的操作流程合成分子。他們用χDL編碼了從文獻中收集而來的103個應用廣泛的化學反應,並對其中的53個反應進行了自動化合成驗證,得到與文獻報道一致的產率和純度。而此前版本的ChemPU並不能與χDL相容。此外,根據具體的反應例項,χDL可以調整如溫度和反應時間等關鍵引數,且透過與色譜模組的結合可以達到真正意義上的自動合成並分離產物。

Science:常見合成反應的自動化

圖1。 χDL協議最佳化示意圖。圖片來源:

Science

如圖1所示,作者展示了將文獻中的反應步驟轉為χDL資料庫的工作流程。與此前的策略相比,χDL並不單純機械地記錄某個反應具體的操作過程,而是將其轉化為定製的單元操作,從而在不同的反應例項中提高效率。化學反應會被χDL記錄為具體的物理過程如加料、溶解、蒸發等。目前χDL記錄了44個單元操作,如“在真空中反應”、“液液分離”等,每個單元操作有詳細的定製引數。作者還使用了ChemIDE(類似普通計算機常用的IDE)輔助從文字產生χDL的過程。χDL的優勢是使用者使用相同的χDL程式碼會得到同樣的結果。當χDL程式碼能達到滿意的結果時,該程式碼會收集到資料庫中供公開下載使用。χDL資料庫會儲存操作步驟、實驗結果和相關的分析。ChemIDE同時會展示每個實驗的特徵引數,如產量、產率、狀態(未驗證/成功/失敗)和反應時間等。使用者可以上傳、搜尋、下載和復現可靠的合成結果。資料庫中除了提供最後成功的版本,還會包括此前失敗的開發版本。透過對比成功和失敗的版本可以揭開合成步驟的關鍵要點。本文報道的χDL程式碼都是經過ChemPU驗證過的,但資料庫中含有未驗證的合成步驟。透過模擬人工合成的工作流程,ChemPU已經證明其可以作為通用的、可程式設計的自動合成硬體平臺。

Science:常見合成反應的自動化

圖2。 ChemPU的組成。圖片來源:

Science

自動合成的第一步是分析反應所需的基本單元操作。一旦確定了這些單元操作,透過軟體介面,就可以將每個單元操作連線到相應的硬體模組。ChemPU模擬手動批處理化學工作流程並使用許多典型的實驗室硬體。常用的實驗室硬體包括液體處理系統(由一系列泵和閥門組成,在不同單元之間傳輸試劑、溶劑和中間體溶液)、圓底燒瓶(用作反應器)、電導感測器(檢測相界)和旋轉蒸發儀(濃縮餾分)等。

Science:常見合成反應的自動化

圖3。 ChemPU的物理佈局和可用硬體庫的圖形示意。圖片來源:

Science

為了檢驗χDL語言和ChemPU平臺的實用性,作者從文獻中選擇常用的有機化學反應,包括在藥物化學和天然產物全合成中常用到的反應,例如過渡金屬催化的碳碳鍵形成反應(包括Suzuki、Heck和Sonogashira等人名反應)、非金屬催化的碳碳鍵形成反應(包括Wittig反應、傅-克烷基化等)、氧化還原反應(Jones氧化等)、官能團轉換(Mitsunobu反應)、保護/去保護反應和多組分反應(Ugi反應和串聯反應)等。圖4A展示了每個反應類的示例數。一旦文獻的操作步驟被“翻譯”為χDL程式,會被標記為“已翻譯”。當χDL程式在ChemPU上成功執行時,也就是在實驗室中自動化合成驗證之後,它被移動到χDL指令碼的“已驗證”類。“已驗證”的χDL程式還可以用來構建化合物庫,作者以α-醯基氨基醯胺為例,只需對程式進行簡單的引數修改即可合成四個同類分子。ChemPU得到的反應產率與文獻報道的相當,部分反應的具體引數和產率如圖5所示。為了進一步檢驗平臺的多功能性,作者用阿托品(一種抗膽鹼能藥物)作為測試,該分子可在ChemPU平臺上以四步合成。

Science:常見合成反應的自動化

圖4。 將常用反應轉換為χDL並在ChemPU上進行驗證。圖片來源:

Science

Science:常見合成反應的自動化

圖5。 在ChemPU上驗證的χDL程式的代表性示例。圖片來源:

Science

色譜分離(俗稱“過柱子”)是中小規模反應產物純化的首選方法。然而,“過柱子”需要大量的手工操作。為了將色譜系統整合到ChemPU,作者建立了兩個輔助硬體單元:一是允許在ChemPU中預安裝不同色譜柱的轉盤和接餾分的托盤;二是允許ChemPU回收產物餾分。通常,化學家需要在色譜分離後透過TLC、質譜或NMR分析單個餾分,但這些常規手段很難自動化。作者認為在反應產率較高的情況下,透過紫外/可見響應和彈性光散射檢測器的訊號,選擇AUC曲線下面積最大的峰,一般可以正確識別產物峰。這種方法的好處是靈活方便,不需要預先知道產物的保留時間,也不需要依賴質譜或NMR。如圖6所示,色譜純化的具體流程為:1)最佳化商業色譜單元的執行引數(ChemPU預定義);2)執行準備(梯度的基線校正和柱平衡);3)進樣;4)收集產物。在梯度執行期間,色譜儀將檢測器訊號實時傳送到ChemPU控制器,控制器執行峰值檢測並觸發色譜機的餾分收集機制。當分離執行完成時,產物峰被識別並轉移到下一個模組(通常是旋轉蒸發儀)。值得注意的是,色譜柱分離的引數也是由χDL程式定義好的,因此可以很方便復現。

Science:常見合成反應的自動化

圖6。 色譜分離模組。圖片來源:

Science

小結

本文展示瞭如何將化學合成文獻輕鬆轉換為通用化學程式碼,該程式碼可以在任何能夠進行化學計算的自動合成平臺上執行,只要該平臺包含反應器、分離器、蒸發器和純化系統。這意味著不同的合成機器人能夠使用相同的χDL程式來產生相同的結果。χDL程式資料庫的使用不僅有助於複製已釋出的程式,而且還為化學家們提供了豐富的、“已驗證”的資料來源,這些資料適合於機器學習,可用於反應最佳化、路線規劃、提高合成的安全性和減少對環境的影響,同時能大大減少實驗化學家的重複勞動。

簡評

相比於之前的自動合成機器的工作,筆者認為本文最大的亮點是進一步建立了標準化的化學合成程式碼(χDL)開源社群,有望解決合成實驗的可重複性問題。該團隊一直致力於從硬體和軟體兩個方面來標準化化學合成,硬體包括ChemPU及其配套的液體處理系統和色譜純化系統,軟體則是以χDL程式和ChemIDE為代表。從目前文章展示的結果來看,似乎大部分常規的化學合成都可以透過該團隊的硬體+軟體平臺來標準化。筆者認為,該團隊未來可能會朝兩方面發力:一是擴充套件反應模組庫,如支援低溫(−78 °C)、光化學和電化學的模組;二是擴大平臺的影響力,讓更多化學實驗室開始嘗試接受。根據該團隊此前的估計,ChemPU的單價在2萬英鎊左右,應該不算特別貴,但推廣ChemPU自動合成的應用範圍應該是該課題組未來工作的重點方向之一。

Digitization and validation of a chemical synthesis literature database in the ChemPU

Simon Rohrbach, Mindaugas Šiaučiulis, Greig Chisholm, Petrisor-Alin Pirvan, Michael Saleeb, S。 Hessam M。 Mehr, Ekaterina Trushina, Artem I。 Leonov, Graham Keenan, Aamir Khan, Alexander Hammer, Leroy Cronin

Science

2022

377

, 172–180, DOI: 10。1126/science。abo0058

(本文由

Alchemy

供稿)