今天小編分享的科技經驗:從短劇、音頻到二次元社區,大模型創業者如何用AI重塑内容形式及生產模式?,歡迎閲讀。
AI 時代,在大模型能力還在進化、還在苦苦尋找 PMF 之前,創業者之間的交流和共識似乎變得更為重要。
一次成功的嘗試,或者是失敗的反思;
或者是最近的創業新方向和新收獲;
或者是對于某個垂直領網域的新觀察。
……
3 月 23-24 日,由上海市人工智能行業協會(SAIA)主辦的 2024 全球開發者先鋒大會(2024 GDC)在上海成功舉辦。同期,3 月 22 日,Founder Park 也邀請了四位創業者,在大會周邊進行了一場閉門交流分享,暢談他們在過去一年内 AI 創業的得與失,進行了一場大模型創業的認知碰撞與對齊。
我們節選了嘉賓分享中,對于 AI 如何影響内容創作者、如何改造不同内容的生產流程,甚至如何滿足小眾人群的内容閉環的一些精彩讨論。
交流嘉賓介紹:
朱江井英科技創始人 & CEO
胡修涵:捏 Ta 創始人
呂睿韬(秀才):喜馬拉雅珠峰 AI 產品研發總監
尹伯昊:猴子無限創始人 & CEO
再次,特别感謝上海市人工智能行業協會、出門問問、上海西岸集團對本次活動的支持。
01 AI 短劇≠ AI+ 短劇,而是全新的内容生态
分享嘉賓:井英科技創始人 & CEO 朱江
在這部分,他分享了目前對于 AI 短劇行業的觀察和心得。
今天的短劇和免費小説有非常大的關系。最早拍短劇的人,就是免費小説的廣告演員,還有那些給免費小説投廣告的廣告代理公司。大家發現,這種短劇其實本身就挺好看的,不一定非要去看小説了。2021 年開始就有一批先行者,到 2022 年發生了一個關鍵的點,就是抖音和微信小程式之間打通了。這導致大量的公司可以通過抖音買量,然後跳轉到微信小程式裏。原來那些做免費小説、新媒體的人通過短劇的方式,把 ROI 跑起來了。短劇的前身其實就來自于免費小説。今天短劇的興起可以講就是免費小説的一個更新版,是視頻化的小説。
為什麼是小説,因為一次性看不完,需要反復看,和抖音短視頻的邏輯是不一樣的,這是一個很好分發的點。
從體驗上來看的話,在 AI 上面還要往前走,互動上也會有新的變化,你要想它其實不是個劇了,能看、能互動,這是一種新的内容,只是現在看起來是視頻化的,
換句話説,如果今天用 AI 去做 Vision Pro 的空間視頻,可能就會變成另外一種媒介。但可能還是需要一個過程。
這次創業,我們用 AI 來生成視頻内容,也是做短視頻的,從廣告到短劇全都覆蓋。但是我有個非常大的體會,就是一定要做優質内容的創作。優質的内容創作在市場上是有價值的。但凡一個娛樂型的、充分競争型的内容市場,優質是一個入門的門票。沒有優質内容,最終遲早要被淘汰。
我們會覺得豎屏短劇不是短視頻,是個新東西。其實是個長視頻,只是切短了之後變成了一集一集的連續爽點,很密集的呈現方式。長視頻在于追,短視頻在于刷,體驗是不一樣。
豎屏短劇這種形态是個新的分發渠道的機會,就是國内、海外用户刷豎屏短劇在哪刷?沒有一個人有這個心智,國内海外的用户都沒有一個固定渠道。
第二個問題其實更關鍵,内容供給。
我們設想,如果要 1000 萬 DAU 的話,大概需要 1000 部好劇,按照現在的爆款率,需要 1 萬部劇打底。現在中國的整個的供給量是多少呢?一年 3000 到 5000 部劇。
現在内容的消耗量根本撐不住這麼大的 DAU。所以我的判斷是短劇的需求端被驗證了,但是問題在供給側。如果不用 AI 生成方式的話,不可能成為一個平台,這是我的判斷。
現在的月活的短劇用户量已經是 1.2 億,這些内容刷完了就走了,留存不下來。當你真的要聚成一個内容平台的量級,是不可能用現在的工作室方式去拍的。
這個跟以前的網文小説不一樣,作家寫作,只有時間成本。但是你説一堆人湊在一起,演員、服裝、道具、攝像,他不可能為了興趣去拍短劇,團隊成員都要吃飯的。所以制作方一定要付錢,成本是一方面,制作内容的效率也很低。AI 的好處是在于,它并不是提高内容上限,但是 AI 可以把團隊的事情變成一個人就可以做。如果你能夠達到優質的基線,讓這些有能力的創作者一個人就能創作的時候,這個内容供給才能夠打開。只有用 AI 降本增效到這個程度,平台才能夠出現。
我覺得今天短劇的賽道,也還只是下半場的開場。
中國市場真人拍攝的短劇,年產量才 3000 到 5000 部。我去年和客户、投資人都在講,今後用户一定分不出來 AI 和真人拍攝的區别,未來就是 AI 内容的時代。
從現在的角度來説,至少站在海外平台的視角來看,競争還沒有絕對的勝負的方式,現階段存在一個階段性的機會,因為 Netflix、Disney 以及其他的視頻平台現在對于豎屏短視頻的認知還沒到這個點。國内的話,大平台可以一次性把内容團隊都收了,就沒什麼機會了。
提問:AI 在多長時間之内有機會成為視頻的創作者?
這個是很好的問題,我們覺得短劇還是一個 PGC,但 AI 有點區别。
我覺得 AI 時代不太一樣,不是 PUGC, PUGC 是專業的人去創作,而 AI 是讓一部分本來不專業的人,因為 AI 解決了下限的問題,用户用 AI 工具成為了可以生產内容的專業人士。
我們會覺得其實真正最終能代替抖音的未來平台,現在的 AI 體驗還要往前走,只有 AI 短劇是不夠的。
短劇可以是 AI 時代的内涵段子,但不是真正的今日頭條或者抖音,但是它是在那條路上,是其中很重要的一塊。而其他内容體驗的提升有賴于其他 AI 能力的補充。
提問:AI時代的個人創作者會呈現非常強的頭部效應嗎?
坦白來講我們内部也有分歧。一種觀點是認為超級個體會崛起,厲害的人會變得更強,因為效率提升了。還有一種觀點就是,能人的數量也變多了,不會變成像 Netflix 或者愛奇藝的上遊一樣被少數的内容制作方所控制的局面。
所以我感覺,一開始超級的内容創作者會崛起,但是慢慢會有更多的人進來。頂部可能是個百萬量級的存在,然後腰部也會有更多創作者數量的提升。
02 AI 讓小眾群體的内容閉環不再是問題
分享嘉賓:捏 Ta 創始人 胡修涵
在這部分,他分享了捏 Ta 切入二次元内容社區的觀察和判斷。
我第一次理解數據驅動不能解決很多東西,包括不少内容的問題,是在聯合利華工作的時候。
聯合利華當時會給廚師做分享菜譜的社群工具,用來作為提升調味料銷量的一種方式。為什麼是建社群?其實明明有不少不那麼曲線救國的方式:直接發優惠券、線下超市鋪貨等,為什麼要社群,其實是他們在整合零散渠道的優質内容,進行社會化創新。
如果把菜譜當成内容,廚師就是創新菜的驅動力,在食材之外,調味料也是菜譜的關鍵要素。但這個部分,制作調味料的廠商其實很難理解怎麼做創新,因為沒有那麼多的數據反饋和數據驅動,只有銷量數據,而銷售數據其實滞後于民眾的口味變化。
那什麼反饋是最快的?
如果一個廚師在一道川菜裏放了甜口的調味料并且大受好評,周圍的廚師就會很樂意分享這個食譜,如果能第一時間獲取到這個菜譜,就可以進行調味料的創新。某種程度上來説,這是廚師的 Github。
而為什麼一直沒有内容的 Github 呢?
因為内容的 Github 很難做,大家要凝聚共識,要互相讨論,但内容又是個很主觀的事情,所以編輯部需要有主編拍板,因為要有核心創作的最後決策。
但是這件事對于更高效的 AI 時代的内容創新,已經不是最高效方案了。比如説小眾愛好的内容創作,一直有内容創新的瓶頸,因為它的供給和消費的循環沒法建立起來,人數太少了,沒有足夠的創作者去創造内容,就會導致消費也循環不起來,然後社群就會消亡。
但是這件事情本身的價值其實很大,小眾人群的内容可以構成共識,而共識會形成很大的價值。
那麼,今天的 AI 就可以改變這種現狀。
AI 改變了内容創作的協作流程,但不是像 Reddit 那樣進行像素級别的協作,那只有行為藝術價值,但結果沒價值。
但如果在角色上,或者基于某些特定的概念,如果我們有共同的創作目的,我相信在 AI 的幫助下,是可以自下而上產生好内容的。我們花了一年時間,至少做了 30 多個新媒體賬号,在小紅書和視頻号上跑出來成功的案例,而且這個是跟非 AI 内容一起競争取得的結果,我們覺得這算是找到了 Content Market Fit 了。
這其中最重要的一點就是 AI as Composer,not Creator。
最終的内容還是由專業的人來供給,大家一起參與把一個角色玩起來變成一段劇情,這段劇情可能是 PGC 創作或者其他的用户來供給,我們可以把角色世界觀、場景以及發生的劇情重新拆出來,一點點控制變量,讓 AI 去補到足夠好,最後的結果還是有人願意看的,有足夠消費屬性的。這樣最終通往一個真正的 AI-native 内容形态。
比如説這張圖,其實就是用户提議做 CP 圖,柯南和灰原哀,然後 AI 生成了這樣的圖,這張圖在 B 站獲得了兩百多的點贊。東西是人想的,但是 AI 很容易把這個想法還原出來,甚至還能帶點意外驚喜。
基于這樣的形式和内容要求,我們在初期其實也是切入到幻想和二次元類别。因為這些類别上有成熟的創作模式,比如 Lofter 上的同人内容。
在此基礎上,會發現這個模式其實不支持長叙述,只能支持一定程度的短叙事。同樣是互動叙事,橙光模式就不适合,因為橙光的遊戲是追求長叙事,講究前期的引導和後期的解密,是常見的草蛇灰線的模式。什麼樣的内容适合做呢?像《名偵探柯南》《哆啦 A 夢》這樣長線由劇場版推動、短線由單元劇推動,然後基于角色 base、事件 base 來展開的内容内核就很好。
用户會因為角色或者事件參與進來,還有就是用户對于角色的故事線(角色驅動)是有預期的,比如成長環境、家族關系、社交等,都是可列舉和填充的,但如果是故事支線驅動(情節驅動)的,這個分支就沒法枚舉,無法預料。
這些内容的創作者,也不是目前已知的優質創作者,因為他們(現有優質創作者)都被他現在能做好的内容形式綁定了,只能去一個 Ta 不被看成是優質創作者的地方淘金,然後通過各種創作活動或者比賽,挖掘出其中的好苗子,而不是一開始就征集到好的創作者。
而最終,每個人都能參與創作,也能享受看故事的樂趣,看自己的故事的樂趣。
03 大模型的核心是降低用户創造内容的成本
分享嘉賓:喜馬拉雅珠峰 AI 產品研發總監 呂睿韬(秀才)
珠峰 AI 将在今年推出他們的語音大模型,在語音生成上能力更強。秀才則從語音生成的角度分享了他對于大模型如何改造内容生產的理解。
從定義來説,什麼是大模型?我們覺得人就是一個大模型。人從小到大、從無到有,進行了不同角色的轉化,不同能力象限的提升。把人拆解的話,我們認為人是由三部分組成的,分别是形 + 語 + 意。
形是是指人的外設,包括形象、動作、神态表情等。
語就是語音互動,從寶寶出生到成長,一直是語音互動的,語音信息裏 40% 是文本, 60% 是富語言信息(情感情緒、韻律、口吻等)。文本本身是一個概念抽象的内容,但是語音的富語言信息是有情感的、有特性的,語音更有温度、更多樣性,所以語音也是人 " 成長 " 過程中很核心的一環。
意就是思想智慧,構建這部分的就是大語言模型。
所以我們的訴求就是打造一個具有角色人物視覺外設,有情感、有垂直任務能力的大模型。一定是垂直任務能力,只有在一個垂直任務能力上做好,單點擊穿才是有壁壘的,什麼都做 60 分不如做一個 90 分,選擇的核心邏輯是聚焦。
我們對整個模型的思考,核心應該是讓用户充分把 AI 用起來。這一代的大模型核心是把創造的邊際成本降低,讓用户充分參與進來。大模型就是超越用户現有的能力,對用户做增益。那我們覺得語音這條線的增益就是讓用户可以具備超越自身限制的語音語言能力。
我們構建的第三代語音大模型,相比行業内第二代模型,不僅僅對音色的還原度極大提高外,還完美還原韻律腔調和口吻,同時支持音頻 prompt 和文本 prompt 兩種方式提示方式調整音頻創作效果。
用户使用 15 秒的聲音作為音頻 prompt 喂給大模型,可以迅速得到完美復刻,而且是原有韻律和腔調的,然後用文字 prompt 來調節輸入音頻文本的音色,或者音頻中要包含的各種情感,都可以直接調整。這就是一個創造力再造的過程,把創造的能力不斷放大。
大家一定要重視數據工程產品的建設。相較于文本标注來説,視頻标注和語音标注非常難,我們現在會先用模型自動化标注提供算料處理效率和質量,另外我們甚至還有 100 多個 " 音視頻導演 " 來做數據處理管線的設計,只有用專業的人才能做出高質量的數據。強大的數據工程產品是構建富有產品競争力多模态大模型的基石。
AI讓所有人都可以成為創造者
現在很多家都在做數字人,我們在這方面的思考是,我們認為未來的這種互動形式,或者説内容形式,一定是 AI 生成的。我覺得未來只有AIGC, PGC 和 UGC 只是 AIGC 的過程,它們給 AIGC 提供養料,未來都會被 AIGC 替代掉。
數字人這個事情,GPT 讓我們擁有更多的文本能力上限,把我們的能力邊際打開。我覺得 2024 年一定是超級個體元年,用上 AI 之後,人人都是創造者,而且是快速的創造。
提問:什麼叫好的數字人互動?我們本身也是做數字人的,現在的互動就是把文本、語音、表情、動作四個單獨的模态疊加在一塊,但效果很普通。很多用户反而會喜歡迪士尼動畫裏的那種效果。
合成數據,動漫、遊戲的數據都往裏面放,而不是單純真人。數字人不是一味追求真實性,而是追求演繹效果。一味地還原不是用户最終想要的,用户想要的是表達和演繹的增益,包括形象增益、知識增益還是表達增益。" 理解 " 用户、" 成為 " 用户、" 超越 " 用户。