今天小編分享的科學經驗:清華系“倉颉”來了!大模型造字7天交付超40套,客戶成本大降80%,歡迎閱讀。
大模型如何落地?怎麼落地?成為今年科技領網域的頭号主題。
在一個不為大多數人所知道的造字賽道中,這家清華創業公司——「圖形起源」悄然實現商業變現:
幫助字體公司降低 80% 成本,提速 10 倍以上。Canva 可畫上最受歡迎的前 100 套中文字體,大部分都是用他們的算法生成的。
這個賽道足夠小也确實剛需,設計公司、字體公司苦版權費用久矣。
而他們憑借原本積累的圖形學與 AI 的技術優勢,實現了人工所不能及的效率和精度。
來看看他們是如何發現以及靠 AI 造字來賺錢的。
靠 AI 造字賺錢,提速 10 倍以上
首先來了解一下什麼是字體生產?
傳統的字體生產流程,往往需要設計師用手寫的方式來完成整套字體的制作,(一套字體最多近 3 萬字)并且在初稿完成後,還需要人工團隊進行逐字校對。
因為純人工操作,這樣一套流程下來不僅周期長,往往需要一個季度。對于字體公司來說,這是一筆不小的成本支出。
與此同時,也正因為人工,單個字體字形質量風格等細節上不好把控。
對于設計公司來說,制作過程中的高成本,也導致了商用版權字體采買費用的高昂。
正是在同客戶交流時,圖形起源團隊發現了這一行業痛點,耗時數月打造了一套字體生產線。
這不是簡單應用一個大模型就能直接生成的。字體設計最大的區别在于它是矢量圖,可以無限放大而不失真。而目前 AI 生成的圖通常是位圖,有像素限制。
如何讓 AI 生成矢量圖,理解字體的錨點和矢量曲線的含義,成為核心的技術難點。
創始人史海天分享了他們的解決思路,整個流程分為四個階段:
首先,用一個傳統的Diffusion 模型會生成位圖;
其次,用第二個超分辨率模型,把字體位圖的分辨率提到最高;
然後,用一種獨特的算法,讓 AI 能夠理解什麼是 " 好的矢量設計 ",設計第三個模型,以這種 " 好 " 的審美作為優化目标,用訓練後的模型把位圖轉化成矢量圖;
最後,訓練一個專門檢查錯别字和字形結構的模型。
除此之外,他們還計劃開發筆畫拆分模型。
基于這樣的模型,他們能實現人類所不能達到高效和高質量。
比如基于 AI 超分技術和 AI 矢量化,像各種筆畫、偏旁部首的邊緣細節處理,能禁得起任意放大維度,設計師能在海報等場景中使用。
客戶只需要完成前 199 個字的操作,AI 就能在兩天内訓練并生成數萬字。并且也不限于簡體,像繁體字、生僻字,日文韓文拉丁這樣的多語種也 OK。
在準确率上,簡單字形(筆畫 <15)單次生成的平均生成錯字率小于 1%,復雜字形(筆畫≥ 15)單次生成的平均生成錯字率小于 5%,已經遠高于人工審校的準确度。
現在他們還打造了一個 SaaS 平台,整個交付過程都可以在線上進行。客戶能随時查看進度,或自己完成全部生產過程,不用圖形起源的人工幹預。
據透露,目前他們已經生成了346 套字體,累計 4680244 個字。
來自圖形起源
圖形起源成立于 2020 年底,是由當時清華大學車輛學院畢業生史海天,讀碩士休學時候創辦。
在此之前,他們主要做 3D 創作引擎,并完成了三輪融資,受到像五源資本、真格基金等機構的青睐。當時他們的願景是,希望在未來建立一個大眾化的 3D 内容創作工具,以及一個普通人願意在其中生活的社交世界。
不過現在史海天回憶當時沒有找到很好的變現場景,如今大模型的到來,帶給他們全新的機遇。
當時他們花了很長時間和資金來驗證這件事情。史海天透露,他們當時訓了兩個大模型,一個用來識别,一個用來生成,訓練目标是 AI 生成的字體讓 AI 分辨不出。
不過這個行業的優點在于,字體數據是比較全的,比如一套字能喂給 AI 一半字,讓 AI 可以生成剩下一半字。
最後他們也實現了交付級别的生成效果,目前一周能完成超過 40 套字體的交付,相當于效率提升了幾百倍。
目前公司主要有兩個主營業務。
中文字庫擴寫,也就是客戶給參考字體檔案,圖形起源 AI 先進行一波學習,然後生成風格統一的字形。
整個流程都是在 SaaS 平台上進行,平台上支持人工校對、二次學習、批量生成、人工二次篩選等工作,以進一步降低生成字體的錯字率。
跨語種風格遷移。顧名思義,就是根據任意語種任意字體,來生成同種風格的任意語種任意字形。
目前他們能夠穩定生成中日韓拉丁字母、希臘字母、西裡爾字母,常見符号數字等,并且已經在小米應用商店有售賣。
而像藏文、阿拉伯文等小語種文字還在内測階段。
最後想說,雖然現在看各個大廠都在卷生產力場景,市場很卷。但是具體到各個細分場景下,大企業也許就沒有那麼多的資金精力去投入。
那些場景看上去需求有限,但确實同樣也是強剛需,也能實現商業變現。比如字體,比如排版。
對于創業公司來說,就是個不錯的切入點。圖形起源就是一個。
如今大模型應用如火如荼,到底還是看能不能解決實際問題。這條真理已經是再明确不過了。