
本文經(jīng)授權(quán)轉(zhuǎn)載自白鯨出海
作者:趙思堯
2022 年年末,OpenAI 推出 ChatGPT,人們對于 AI 的認知受到巨大沖擊,從此大量資源和資金涌入這個行業(yè)。想起前兩個月和做 AI 識別的創(chuàng)業(yè)者聊天,他說“AIGC 這一波熱潮,除了激發(fā)新一波的創(chuàng)業(yè),更調(diào)動起了甲方老板們的積極性,好像自己不擁抱 AIGC,就要下牌桌了一般”。
舉一個比較典型的例子,前段時間,某全球知名化妝品集團“全網(wǎng)”尋找一家體量不大的公司,問到了我們這里來,而打聽一圈下來我們發(fā)現(xiàn),這家服務(wù)商好像忙到?jīng)]時間回消息。
被“追逐”的主角是 zmo.ai,2020 年成立。成立時間雖短,卻已經(jīng)獲得不少優(yōu)質(zhì)投資機構(gòu)背書。CrunchBase 顯示,zmo.ai 最近一次融資在 2022 年 5 月,獲得高瓴創(chuàng)投領(lǐng)投的 800 萬美元,紀源資本和金沙江創(chuàng)投也有參與。
而 zmo.ai 被打聽最多的服務(wù)就是利用 AI 幫助時尚品牌生成高質(zhì)量產(chǎn)品圖片。之所以有這么多品牌想積極嘗試 AI 成圖,與商拍成本不低且流程繁瑣直接相關(guān)。
一個品牌如果要制作效果不錯且有模特出鏡的產(chǎn)品圖,需要根據(jù)風(fēng)格和主題提前招募挑選模特、預(yù)約拍攝地點和設(shè)備,拍攝后需要后期處理、挑選、審核圖片,流程上需要幾天到幾周不等。一年中這樣的拍攝可能得有好幾次。
而根據(jù)品牌對成片的要求,費用波動也很大。一家提供 AI 商拍工具的企業(yè) weshop.ai 業(yè)務(wù)負責(zé)人吳海波告訴筆者,行業(yè)內(nèi)部有這樣一個大概認知,一個品牌每年在素材準備中的花費大約會在年 GMV 的 2%-5%。如果按照這個區(qū)間,一個電商賣家一年的 GMV 如果是 200 萬美元,那么每年在素材上的花費大約會是 4-10 萬美元,也就是 30-70 萬人民幣,其實也是一筆不小的支出。
按道理,一個 AI 生圖的服務(wù),如果成片能夠同等代替原來素材,且訂閱費用低于原來的素材拍攝花費,應(yīng)該是能在市場上跑通的。事實又是怎樣的呢?zmo.ai 被品牌追捧,是個例還是普遍現(xiàn)象?
于是我們打算從 AI 商拍產(chǎn)品切入,以窺行業(yè)一角。
靜態(tài)產(chǎn)品圖生成功能已經(jīng)開卷
筆者測試了 6 款提供 AI 商拍工具的產(chǎn)品,其中 2 款效果不佳,這里不多著筆墨。
多數(shù)產(chǎn)品會提供 3 類功能,靜態(tài)產(chǎn)品圖生成、真人模特換臉、基于產(chǎn)品/假模生成模特圖。其中靜態(tài)產(chǎn)品圖生成功能難度最低,每一款產(chǎn)品在細分功能上都已經(jīng)做得比較成熟。而假模生成模特圖功能有的暫未開放,有的需要直接聯(lián)系銷售或加入候補名單。
生成靜態(tài)產(chǎn)品圖功能的使用路徑基本相同,“上傳圖片——摳產(chǎn)品——選擇背景參考模板生成新背景/輸入 prompt 生成新背景”。
筆者在 4 款產(chǎn)品中上傳了相同的“手托酒瓶”圖片。
zmo.ai:
zmo.ai 只支持自動摳圖(自動識別產(chǎn)品邊框后摳圖),因此筆者被迫保留了手的部分,但對于電商賣家來說,這是個挺大的 bug。在生成新背景環(huán)節(jié),zmo.ai 提供了 3 個功能,選擇背景模板、輸入 prompt 生成背景、上傳參考背景圖后 zmo.ai 根據(jù)參考圖生成類似背景。對比下來,zmo.ai 的可選模板不算多,但根據(jù)參考圖變形的功能十分好用。
(prompt 大意:身著比基尼的女生躺在沙灘上,身旁的桌上放著產(chǎn)品。//可以看到背后的比基尼女生已經(jīng)變成了畢加索風(fēng)格)
上傳參考背景圖生成的產(chǎn)品圖(右)
在生成圖片后,zmo.ai 支持用戶調(diào)節(jié)圖片參數(shù),使成圖效果更自然和有質(zhì)感。
WeShop:
WeShop 會將用戶上傳的原圖分為多個色塊,用戶可以勾選想要保留的區(qū)域,或者上傳一張蒙版圖。雖然色塊被切割得很細,但筆者在只勾選酒瓶部分后,生成的圖片里還是會看到原圖手部的影子。了解后得知,是 WeShop 為了讓生成圖中商品與背景融合得更好,在 AI 生成時會以原背景作為生成基礎(chǔ),在筆者測試 WeShop 的真人圖和人臺圖時也會發(fā)現(xiàn)相同的情況,這里建議 WeShop 上線一個摳圖后清除背景的功能,更加方便用戶使用~
在生成新背景步驟,WeShop 也提供 3 個功能,背景模板、輸入 prompt 生成背景、高級自定義。前 2 個功能與 zmo.ai 類似。高級自定義功能則是讓用戶輸入正反向咒語,也就是背景圖中希望出現(xiàn)的元素和不希望出現(xiàn)的元素,通過正反向咒語讓 WeShop 更快生成符合用戶期待的圖片。
prompt:sea,希望成圖中有沙灘但沒有海)
xiangji.ai:
在筆者看來,摳圖這一步做得最好的是 xiangji.ai,因為 xiangji.ai 在智能摳圖外支持精細摳圖,通過原圖上描點的方式選定保留或去除的部分,在 4 個工具的試用過程中,只有用 xiangji.ai 生成的圖片完全看不到原圖手部的影子。
這里有兩個點值得說一下,首先對于商用來說,賣家在拍產(chǎn)品圖的時候,大概會降低“手”這類影響元素,所以是否能手動摳圖可能并不是特別一個嚴重的問題。
另外,其實很多修圖 App 的摳圖功能,已經(jīng)能做到和 xiangji.ai 同等水平、甚至更好。
在背景生成環(huán)節(jié),用戶可以通過選擇模板并添加線稿圖(即選擇添加希望出現(xiàn)的元素)來控制背景生成,此外也可以調(diào)節(jié)圖片參數(shù),讓成圖效果更好。
每選擇一個模板或線稿圖元素(類似于一朵花),prompt 輸入框中就會自動加入標(biāo)簽。筆者雖然可以強硬修改標(biāo)簽內(nèi)容,例如我將“優(yōu)雅餐具在側(cè)”改寫成“爆米花在側(cè)”,但系統(tǒng)似乎并不會執(zhí)行改變后的指令,所以 xiangji.ai 的場景融繪框大概率只起到展示用戶選擇的內(nèi)容的作用,并不支持輸入 prompt 生成背景。
nolibox.com:
nolibox.com 的靜態(tài)產(chǎn)品圖生成功能基本融合了上述 3 款產(chǎn)品的功能,支持選擇背景模板、輸入 prompt 生成背景,可以像 zmo.ai 一樣 2 張圖變形后合成新圖、調(diào)整圖片參數(shù),也可以像 xiangji.ai 一樣添加線稿元素。
和選擇背景模板并添加線稿后成圖(右)
不難看出,在靜態(tài)產(chǎn)品圖生成這一功能上,由于操作步驟大差不差,服務(wù)商們已經(jīng)開始在細節(jié)上做文章,這就要看誰更能洞察到電商從業(yè)者們的細節(jié)需求了。
而事實上,廠商要做出生成靜態(tài)產(chǎn)品圖這樣的功能,門檻似乎也不在技術(shù)層面。
從產(chǎn)生 idea到第一版產(chǎn)品落地只需 1 個月
為了弄清 AI To 電商的應(yīng)用現(xiàn)狀,我們聯(lián)系到了 WeShop 的負責(zé)人吳海波,吳海波告訴筆者,“要推出底層模型需要足夠的人力和資金,所以你看到這些廠商會是 OpenAI、Midjourney。而多數(shù)廠商并沒有能力搭建模型,包括我們。WeShop 的團隊不到 20 人,所以我們采用了擁抱開源的方式”。
WeShop 現(xiàn)階段采用了開源的 Stable Diffusion(以下簡稱 SD)作為底層模型。從底層模型到 WeShop 1.0 版本只需要兩步走。
吳海波介紹,“2022 年 10 月的時候 Stability AI 推出了 SD 1.5 版本,之后其實也陸續(xù)推出了幾個新的版本,但大家都認為不及 1.5 版本好用。是因為 GitHub 社區(qū)中有大量的人才已經(jīng)基于 SD 1.5、針對不同場景優(yōu)化出了更好用的模型。SD 1.5 的生態(tài)是非常豐富的,你基本可以在社區(qū)上找到任何能想到的針對某一特定功能優(yōu)化過的新模型,比如優(yōu)化人像、比如提升動漫效果”。
WeShop 團隊已經(jīng)明確了要做 AI 商拍圖的目標(biāo),因此可以很輕易地確定需要優(yōu)化的功能,并在社區(qū)中找到在這一分支上優(yōu)于 SD 1.5 的最好的模型(check point)?!岸灰腔?SD 1.5 的模型,經(jīng)過測試和調(diào)參,就可以很好地 mix。這是我們的第一步,產(chǎn)品類似于一個縫合怪,但耗時非常短”。
而即便是站在人才們的肩膀上做縫合,也還只是一個普適的產(chǎn)品,無法完全滿足電商需求。例如,利用 AI 生成圖片過程中,成圖和原圖如果出現(xiàn)服裝紋理、材質(zhì)的變化,在學(xué)術(shù)上是被允許的,但在電商領(lǐng)域,就變成了貨不對版的嚴重錯誤。要讓產(chǎn)品符合電商從業(yè)者的需求,還需要做進一步優(yōu)化。
吳海波介紹,“SD 1.5 的底層模型是基于 20 億圖片訓(xùn)練出來的,我們在第二階段則是用了 20 億的百分之幾的數(shù)據(jù)量級去對模型做了微調(diào)”。
筆者對技術(shù)一竅不通,聽到幾十倍的數(shù)據(jù)投喂量級差距,首先會覺得太少了。對此吳海波解釋,“投喂的數(shù)據(jù)自然是越多越好,但挑選數(shù)據(jù)、打標(biāo)和審核需要很長時間,要先保證數(shù)據(jù)質(zhì)量”。
WeShop 被投喂的數(shù)據(jù)基本來自蘑菇街近年在電商領(lǐng)域積累到的圖片,例如運營社區(qū)時從賣家處獲得的圖片、從簽約的 KOL 處獲得的圖片、在國內(nèi)外收集到的全品類產(chǎn)品圖等等。這些前期準備也使 WeShop 的落地時間控制在了 1 個多月,大概比真正從 0-1 的廠商用時會短一些。
不過再怎么看,這項生意的技術(shù)壁壘都不算高。更早起步,通過不斷投喂優(yōu)質(zhì)數(shù)據(jù)、以及用戶交互之后帶來的技術(shù)迭代和功能優(yōu)化,可能是這場競賽中比較重要的一環(huán)。
吳海波從做產(chǎn)品的角度,則認為“在 AIGC 應(yīng)用層面的創(chuàng)業(yè),技術(shù)甚至不是最重要的,最重要的是對產(chǎn)業(yè)需求的理解?;ヂ?lián)網(wǎng)行業(yè)就有非常多的例子,比如說算法推薦不是字節(jié)發(fā)明的,但是字節(jié)系的產(chǎn)品把這項技術(shù)與內(nèi)容產(chǎn)業(yè)結(jié)合到了極致。WeShop 是切商拍場景的工具,對這個需求的洞察源于過去 12 年蘑菇街在電商領(lǐng)域的積累。我們了解商家需要什么樣的商拍圖、甚至我們可以教那些中小商家怎么用 WeShop 把商品圖做得比原來更好,這些對產(chǎn)業(yè)的理解倒推我們在非常多的細節(jié)上去滿足客戶的需求。所以這波 AI 創(chuàng)業(yè),真正的競爭壁壘在于去滿足用戶甚至自己都沒意識到的需求,把每一個細節(jié)做到極致”。
不論是從上面的初步測試結(jié)果、還是產(chǎn)品的研發(fā)周期,都會發(fā)現(xiàn),大家的確是都在跑步入場,平臺功能現(xiàn)階段可能并不完善,市面上的同類產(chǎn)品也是如此。在模特換臉圖和假模生圖功能上,這種功能不成熟更加明顯。
模特圖生成功能:缺乏絕對強者
由于 xiangji.ai 和 nolibox.com 的模特換臉功能無法體驗,筆者只測試了 zmo.ai 和 WeShop。
筆者上傳了冷臉女孩展示黑色 T-恤的圖片。
在選定變化區(qū)域后,zmo.ai 直接讓用戶通過輸入 prompt 自由發(fā)揮,但出圖效果很不錯。
WeShop 則進一步降低了用戶的使用門檻,用戶可以從模板中選擇人種和場景快速成圖。
而對從業(yè)者最友好的則是筆者測試期間 WeShop 新推出的“復(fù)刻任務(wù)”功能,用戶可以直接將已經(jīng)完成的任務(wù)用在新任務(wù)上。有了這個功能,商家可以制作同個模特不同姿勢角度的組圖。不過吳海波告訴筆者,盡管這一直是賣家們呼聲很高的功能,但因為人臉固定存在隱私及版權(quán)風(fēng)險,因此直到現(xiàn)在才推出?!拔覀儓F隊近期剛剛通過技術(shù)方案解決這個問題,即限制用戶只能使用 WeShop 生成的人臉固定模特面容,無法使用外部肖像。這樣能規(guī)避肖像隱私問題和肖像版權(quán)問題?!?/span>
復(fù)制任務(wù)操作界面
復(fù)制任務(wù)生成的圖片
從靜態(tài)產(chǎn)品圖到模特換臉再到基于產(chǎn)品生成模特圖,難度逐層加高。目前 zmo.ai 和 nolibox.com 的 AI 時尚模特功能無法直接體驗,因此筆者只測試了 WeShop。
準確地來說,WeShop 需要用戶上傳產(chǎn)品的人臺圖(真人比例的假人模特穿上產(chǎn)品的圖片)。筆者嘗試上傳了一套女裝和一套男裝的人臺圖,生成的圖片效果不太穩(wěn)定,有時會出現(xiàn)服裝與產(chǎn)品不符(男裝)或 AI 模特的身體部位不真實的情況,需要多試幾次,才會有效果不錯的成圖出現(xiàn)。
WeShop 生成的效果不好
(肩帶變形)(上)與效果好(下)
由于沒有更多測試對象,因此在模特圖生成功能對比上可能存在偏頗,但僅從現(xiàn)有的產(chǎn)品出圖效果可以看出,這一功能還有很多地方亟待加強。不過,即便是當(dāng)前不夠成熟的產(chǎn)品,也已經(jīng)有用戶能夠有效用起來了。
AI 商拍圖工具涌現(xiàn),首先最大化利用的是中小出海賣家
“現(xiàn)在市場利好的一面是,所有人都對 AI 充滿熱情,所以樂于嘗試的從業(yè)者不少,包括一些體量很大的國內(nèi)和出海品牌都會來咨詢”,吳海波透露。
一位了解不少服裝出海品牌的從業(yè)者 Bruce 也說,“一些企業(yè)其實缺少一個既懂業(yè)務(wù)、又了解 AI 的高管,這導(dǎo)致它們雖然急著結(jié)合 AI,但不知道具體怎么做,所以市面上出現(xiàn)一個什么產(chǎn)品就會去先了解一下,獲得一些思路”。
而大企業(yè)要真正融合 AI 產(chǎn)品并不是容易的事,已經(jīng)將市面上這些 AI 商拍圖產(chǎn)品用于業(yè)務(wù)中的主要用戶其實并非大廠。
吳海波告訴筆者,“結(jié)合 WeShop 現(xiàn)在的產(chǎn)品力,我們發(fā)現(xiàn),將 WeShop 利用得最好的人群有 2 類,一類是做跨境的中小賣家,另一類是國內(nèi)位于經(jīng)銷鏈路起點的檔口賣家,后者所占的比例最近明顯上升”。
進一步具象這些人群時,吳海波解釋道“體量小的跨境賣家,機動性反而高。且對于年 GMV 幾百萬元的賣家,他的 SKU 不會很多,每個月花費 298 元購買基礎(chǔ)套餐就足夠了,并不需要付出很大的成本。
國內(nèi)市場的電商鏈路更成熟,相關(guān)服務(wù)成本更低,所以目標(biāo)市場在國內(nèi)的這部分賣家他們在選購 AI 商拍圖產(chǎn)品時其實更看重生圖效果,價格反而不是首要考慮因素了。為了滿足用戶需求,我們常常得一天迭代好幾個新版本”。
這里附上各產(chǎn)品的會員價格(從上至下:zmo.ai、weshop.ai 海外、weshop.com 國內(nèi)、xiangji.ai)(WeShop 國內(nèi)及海外版本收費不同)
大量的同類產(chǎn)品一起競爭,雖然在功能有些許細微差異下,但疊加并不高的服務(wù)價格和當(dāng)下中國的 SaaS 環(huán)境,廠商們依然需要繼續(xù)往前探索。而放大視角去看,我們發(fā)現(xiàn)上述產(chǎn)品背后的廠商在做的事情并不完全相同。
根據(jù)官網(wǎng)介紹,zmo.ai 希望利用 AI 改變內(nèi)容創(chuàng)作的方式,未來大概率也不會只聚焦于電商。xiangji.ai 本身有象寄翻譯、AI 文案撰寫等矩陣產(chǎn)品,似乎是打算基于 AI 為電商從業(yè)者提供更多類型的工具。nolibox.com 目前已經(jīng)推出了AI 繪畫、AI 商品圖以及智能設(shè)計產(chǎn)品,目標(biāo)用戶看上去和 zmo.ai 交集更大。
關(guān)于 WeShop,吳海波則告訴筆者,“AI 不斷進步,我認為未來會有很多公司將 AI 視為自己的員工,發(fā)展出新的工作模式。那個時候 AI 和人類員工各自的業(yè)務(wù)流如何構(gòu)建和協(xié)同就會變成一個亟待解決的問題。WeShop 是我們探索新型工作流的起點”。
在筆者成稿期間,又陸續(xù)發(fā)現(xiàn)了不少提供類似功能的產(chǎn)品,但距離這一細分領(lǐng)域出現(xiàn)寡頭恐怕還要很久很久。更優(yōu)的底層模型出現(xiàn)、產(chǎn)品功能和定價模式優(yōu)化以及企業(yè)本身指定的發(fā)展方向都可能改變競爭格局,入局者可以做的還有很多。
封面圖源 | 圖蟲創(chuàng)意
(來源:雨果網(wǎng)的朋友們)
以上內(nèi)容僅代表作者本人觀點,不代表雨果跨境立場!如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與雨果跨境取得聯(lián)系。