在畫師圈,已得藝術大獎的AI將扮演什麼角色?

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

十多年前,AI畫的貓臉還是一個滿是噪點、模糊不清的剪影,但如今,從2021年DALL·E畫出的那把牛油果椅子,到今年DALL·E 2勾勒出的宇航員在太空中騎馬的形象,這些出自AI之“手”的作品已經變得相當栩栩如生了。

DALL·E是OpenAi旗下的人工智慧線上繪圖應用,其第二代產品DALL·E 2在今年7月公測。相較於上一代,DALL·E 2能夠以4倍的解析度,根據自然語言字幕生成更逼真、準確的影象,同時還可以根據原影象二次創作——或混合兩張圖片形成新圖片,或建立基於原圖的系列變體。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

DALL·E牛油果椅子,圖源:公開資料

DALL·E 2讓即時設計聯合創始人周凝看到AI作畫在未來廣泛應用的可能,他將DALL·E到DALL·E 2的技術迭代比喻為“從呱呱墜地的嬰兒一晃就變成了一個職業的畫家”。

如果說在256x256解析度之下,牛油果椅子還是一種基於現實的創作,那麼由璀璨星空與騎在馬上的宇航員構成的圖景,以及可以媲美攝影作品的質感,則釋放了一個訊號:得益於豐富的知識圖譜、自生成以及將多個元素組合在一起後形成新畫風的特徵,AIGC(AI-generated content),即AI生產內容的能力已經越來越強大了。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

DALL·E 2宇航員騎馬,圖源:公開資料

不過,隨著AI作圖軟體及作品越來越多地出現在大眾視野中,它也迎來諸多質疑——比如人類該如何使用這些作品?AI繪畫公司能賺多少錢?使用者使用AI作畫並商用算不算抄襲?以及,對於畫師來說,它會構成威脅嗎?

大規模商用的限制因素不僅是版權,更是技術本身

今年8月,一家創立於2020年的人工智慧公司Stability AI宣佈將文字至影象的AI模型Stable Diffusion開源,以期圍繞該模型和其他模型搭建一個開放的生態系統。

根據文字提示,Stable Diffusion能夠生成逼真的影象以描述提示中的場景,畫素為512x512,能在消費者級別的GPU(圖形處理器)上執行。開源的訊息驚動各國極客圈,以Stable Diffusion開源模型為基礎的應用程式此後也層出不窮。

目前主流的AI繪畫工具,如Stable Diffusion、Disco Diffusion、DALL·E 2、Midjourney,都是在諸如Stable Diffusion這樣的開源模型的基礎上生成的。而國內的Tiamat、6pen、文心一格等則更多是重新修改開原始碼而成。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

AI模型訓練成本高與演算法升級難是如今AI繪畫大規模推廣的主要阻礙。Stability AI的創始人Emad Mostaque在Twitter上回應稱,Stable Diffusion模型使用了256個A100顯示卡,共計15萬小時,按照市場價格計算,訓練模型所需的成本是60萬美元。

To C的一部分AIGC公司,透過收取使用者訂閱費來回收成本,比如Midjourney,按賬戶數和時長收費;還有一部分公司,按照圖片生成的大小和張數以及精細度收費,這種方式本質上就是在賣“算力”。

對於ToB公司而言,則更直接,要麼大規模地提供“結果”,即生成的優質圖片給客戶,要麼直接以提供API介面的方式來提供算力服務,甚至是直接按時長和配置提供GPU伺服器來賣“算力”。

在Midjourney的使用手冊上,有“免費試用”、“基礎版”、“標準版”、“公司版”四個等級,其中每位新使用者擁有25次免費生成圖片的機會,“試用”完畢後,基礎版10美元一個月,每個月可以生成200張圖片;標準版30美元一個月,每個月可以生成不限量圖片,且可以無限呼叫空餘GPU執行時長。此外,購買基礎版或標準版的使用者如果想確保生成的圖片僅個人瀏覽,則需要在原來的購買版本基礎上再加20美元。如果購買公司版,價格則為每年600美元,僅限所在公司年收入大於100萬美元的員工。

自7月份開始公測以來,Midjourney已經積累了近270萬用戶。雖然Midjourney沒有公佈訓練模型花費的價格與付費使用者構成,如果只有1%的使用者按照基礎版付費,那麼三個月來,Midjourney可以獲得81萬美元的營收。如果付費使用者將所得圖片商用且收益超過每月2萬美元,則需要支付Midjourney 20%的分成,特殊情況可以與官方簽訂協議,商討其他分成比例。

不過並非所有的公司都收費,比如Disco Diffusion、Imagen、Dream by WOMBO在現階段都可以免費使用。並且絕大多數公司都放棄了AI生成圖片的版權。

今年11月3日,紐西蘭、印度和英國制定了賦予AI藝術生成器開發人員版權的法律。其中,英國的版權法規定,生成文學作品、舞蹈、音樂或視覺藝術的AI程式開發人員是合法創作者和版權所有者。

不過由於AIGC仍然是一個新生事物,針對這一部分的立法仍普遍滯後,並且現有的相關版權法律也存在模糊、不可適用的空間。比如依照中國《著作權法》的相關解釋,一個作品的作者要麼屬於自然人,要麼屬於法人或非法人組織,但AI本身均不屬於這幾類。根據現行法律解釋,使用AI創作作品的人、AI程式的開發人員、人員所在的公司或組織,能否被認為是作者,有較大爭議。

因此,做設計的周凝認為,即使一些平臺主張版權歸自己所有,這種宣稱也未必合法。但同樣,如果AI生成的圖片與某些人類作品極為相似,那麼拿此類圖片售賣和使用不一定沒有侵權風險。

“這是一個有爭議的地帶,各方起訴都有勝訴機率,只能期待未來出現誰起訴誰、援引什麼法案、如何判決的司法案例,並以此推動法案的修正。”周凝對《第一財經》YiMagazine說。

不過,即使現在火速立法,也不代表AI繪畫就可以大規模商用。技術不夠成熟,是最主要的制約因素。

比如雖然Midjourney已經可以繪製惟妙惟肖的人物肖像,以及極具質感的風景大作,但這些場景通常是單物體、單物件,或者是宏大圖景,並且很多是靜態的畫像。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

Midjourney繪製的人物肖像畫(左)與風景圖(右),圖源:Midjourney社群

此前,一些使用者發現,號稱“能畫盡天下事”的AI繪畫在實際繪畫過程中其實總會出現偏差。比如輸入“三文魚逆流而上”,出現的圖片是三文魚片在水裡游泳,輸入“熊吃三文魚”,AI則沒有識別出“吃”這個動作。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

“三文魚逆流而上”(左)與“熊吃三文魚”(右),圖源:公開資料整理

為了測試AI作圖工具還能畫出多離奇的圖畫,有使用者輸入“少女拿筷子吃麵”,出現的圖片是少女一隻手把面塞到嘴裡,一隻手拿著筷子;當輸入“少女睡在地板上”出現的畫面則更加奇怪。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

“少女拿筷子吃麵”(左)與“少女睡在地板上”(右),圖源:公開資料整理

周凝對此解釋稱,當輸入兩個以上的角色介紹時,擴散模型可能會混淆屬性,並且AI通常很難理解“動作”描述。比如輸入“少女拿筷子吃麵”這句描述,AI對於“拿”和“吃”這兩個動詞通常是無法精準理解並繪製的;諸如輸入“宇航員在太空拽住了一匹馬的尾巴”這種相對更復雜的表述,AI更是沒有辦法理解。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

DALL· E 2 繪製的“宇航員在太空拽住了一匹馬的尾巴”

此外,基於英文為主的模型訓練出的國內AI作圖工具,往往也很難識別具有當地文化特徵的詞語,比如在國產AI作圖軟體Tiamat中輸入“龍在天上飛”,默認出現的是西方意象中以蜥蜴、鱷魚為原型,大型有翼、鱗片堅硬、四肢粗壯的惡龍,而非中國以蛇為原型,大型無翼且懸浮、兩個杈角、長鬚蛇身四足的龍。如果想要畫出中國龍,則需要加一些限定詞。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

“龍在天上飛”(左)與“沒有翅膀的中國龍”(右),圖源:Tiamat繪製

當然,無論如何,技術突破帶來的新鮮感總能吸引一眾“嚐鮮者”,廣告與文娛成為AI作圖軟體最具商業化落地可能的行業,在遊戲、電影場景繪製、繪本、插畫概念圖選擇等具有高成本和低效能特徵的場景中,AI也能以參與者的身份成為產業鏈中的一員。

可以輔助作畫,但不會讓人人都成為畫家

劉琳是一家文創公司的創始人。一次,劉琳的團隊想畫一個類似宮崎駿風格的繪本,在圈內朋友的推薦下,她嘗試了Midjourney。這是一款在今年下半年名聲大噪的AI作圖工具。今年8月在美國科羅拉多州舉辦的藝術博覽會中,39歲的遊戲設計師Allen就是用Midjourney生成了一幅圖片,在經過Photoshop加工之後,這幅名為《太空歌劇院》的作品戰勝人類畫手摘得數字藝術類別的桂冠。此舉引發藝術界與技術界諸多爭議。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

《太空歌劇院》,圖源:公開資料

使用後,劉琳發現,Midjourney畫出的作品的確非常逼真,並且,作品完成度已經可以達到她所預期的70%,構圖、色彩不必挑剔,只需要讓修圖師修一修,很多圖都可以成為概念圖。劉琳隨後便買了Midjourney的會員。

在劉琳所在的插畫行業,“概念圖”是一個非常重要的概念,它是文字內容創作的基礎。而在概念圖的工業化批次生產中,人類的創造力已經無法趕上AI了。

面試插畫師時,劉琳發現,能“超越”AI作圖軟體想象力的插畫師寥寥無幾,“我接觸到很多插畫師,遇到不感興趣的題材就卡殼了,不知道怎麼畫,但AI的想象力沒有邊界,即使畫的不好,它也能畫出來,無論是組合、色彩還是構圖都很棒,雖然技術細節有一些問題,但也能提供思路,節省成本。”

以劉琳所使用的Midjourney為例,今年7月12日,Midjourney面向公眾開放了測試版本,任何人都可以呼叫它的AI機器人程式,輸入自己的關鍵詞(prompt)繪製圖片。使用Midjourney,使用者可以在1分鐘內收到4張圖片,且可以回覆除錯詞語予以修改。

不過,劉琳團隊在製作繪本時,仍延續著傳統的人工繪製方式,Midjourney的作用更多是在創作初期尋找“人設”上。比如在以北京兔爺兒為原型的繪本製作過程中,插畫師就是透過一些與兔子相關的詞彙,使用Midjourney生成上百張兔子圖片,再在其中選擇原型,並加以修改、調整。

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

Midjourney生成的兔子(左)與團隊最終的兔子概念圖(右),圖源:劉琳提供

為什麼直接用AI作圖工具生成繪本不大可能?劉琳向《第一財經》YiMagazine解釋道:“雖然AI可以‘引經據典’,從數十億張圖片中學習繪畫風格、技巧,但它本身不具備用嚴謹的邏輯講故事的能力。”而對於繪本來說,文字能力與繪畫能力同樣重要。

商業需要邏輯,繪畫也需要邏輯。如果對這些AI生成的圖片稍作細緻分析便會發現,AI所繪帶有故事性的畫面往往有較大瑕疵,

比如房子和房子會重疊出現,上下篇章的繪畫風格也因AI生成圖片的隨機性而無法統一。

在周凝看來,“圖片轉文字”依然是一件擁有一定門檻的事。如果要讓AI畫出稱心如意的作品,使用者需要熟練掌握“關鍵詞”。而Midjourney以及國內各類AI作圖軟體也各自都有相應的社群分享關鍵詞。對於絕大部分的使用者而言,輸入適合的“關鍵詞”仍然是非常複雜的技能——不是人人都能掌握,更不是掌握了就一定能夠穩定產出的。

因此,雖然從大V、博主、UP主到新媒體小編,再到所有需要海報、包裝設計、產品展示的從業者,他們都可以藉助AI獲得“繪畫自由”,但如果想要一下變成“畫家”,會用AI作圖工具還遠遠不夠。其一定的“門檻”,也讓AI作畫/修圖隨即成為了一項新職業。

不過在周凝看來,雖然確實有一批人率先掌握AI作圖的能力,並以此“日賺千元”,但是這只是新技術出現早期的資訊差所帶來的認知紅利。“‘日賺千元’是不可持續的。AI的發展速度很快,或許半年後,AI作畫就會變得非常普及。而且目前AI生成的圖片,其版權處於混沌狀態,這樣做會有潛在的侵權風險。”

在畫師圈,已得藝術大獎的AI將扮演什麼角色?

部分插畫師需要具備AI修圖能力,圖源:Boss直聘小程式

劉琳則認為,AI繪畫的確可以取代一些基礎的、繁瑣的、執行層面的作畫過程,這要求畫師只能透過不斷尋找更新銳的創意、更自我的風格來脫穎而出,在一定程度上提高了畫師就業的難度,但據她預估,在未來5到10年內,最好的畫師不會被取代。

“AI可以不斷訓練、提升繪畫技能,但畫師創作過程中湧現的想法是很難被取代的,而這些創意想法、創造能力、對人類社會邏輯關係的把握,才是頂尖畫師之所以成為高手的重要原因。”

想象力不等於自我意識

伴隨AI技術的進步,“AI是不是要超過人類”似乎總能成為每一次新技術推廣時人們談論的熱門話題。

如今,AI是否具備自主意識,仍然是一個無法被證實也無法被證偽的概念。今年6月,Google人工智慧開發團隊的軟體工程師Blake Lemoine因與第三方分享專案機密資訊而被停職後公開聲稱,在公司伺服器上遇到了“有感知能力”的AI,儘管這一判斷並非以科學家的立場提出。Lemoine認為,Google應用語言模型LaMDA已經具有自我意識,其表現類似七八歲小孩,他試圖用實驗來證明這一點,但當他在公司內部提出這個問題時,被公司高階管理人員拒絕。Google發言人迴應稱,對話模型沒有感知能力,證據不支援工程師的說法。

周凝表示,追溯AI繪畫的全流程,前期AI作圖軟體的模型需要大量的人類作品的“餵養”,AI生成的圖片是否被接受,對其審美、質量的評價體系也建立在人類審美認知的基礎上。AI繪製的內容,其誕生更多是基於人類授予的命題與構想,AI本身並不具備自主的生產意識,因此,目前在AIGC這件事情上,它只能作為一個輔助人類創作的工具而存在。

“AI作圖軟體是一個很好用的工具,對我們來說,其最大的價值就是作概念圖,AI的‘想象力’是無邊界的,可以讓人類低成本試錯。但AI並不能將學習到的技法變成靈感、創意的來源。每個AI在自己所在的環節做能做的事情就夠了。”劉琳說道。

時下,除了火爆的AI作圖軟體,反AI資料庫,以及illuminarty(

https://www。illuminarty。ai

)等識別AI作畫的軟體也相應而生。今年10月,插畫網站Pixiv釋出公告,今後將為AI生成的作品打上單獨的“AI生成作品“標籤,以便和人類畫手的作品完全區分開,使用者可以單獨搜尋AI作品,AI作品也會有專門的排行榜。

Pixiv認為,正如迄今為止誕生的素材、影象製作軟體等,AI技術今後也有可能成為創作者們的得力助手。

不過在劉琳看來,在商業世界,區分人類創作者與AI創作者其實缺乏意義,當她來判斷概念圖可否採用時,更多是看作品是否達到產業的標準。

周凝則將這些由AI繪畫引起的連鎖反應統稱為“副產物”,“這只是階段性的現象,新的技術出現,往往會重塑一個行業,或給一個已有產業鏈帶來全新的形式補充。”