今天小編分享的教育經驗:果麥文化:AI編校可替代有标準化答案的工作,預計兩年内做到錯誤率十萬分之一,歡迎閲讀。
多知網 6 月 1 日消息,最近果麥文化進行了投資者活動,提到編校是行業痛點,而 AI 編校能夠提高效率、擴大產能,目前已經做出了 AI 編校 Demo。
果麥文化提到,出版行業成本由高至低分别為紙張和印刷、作者版税、編校。編校是出版行業第三大成本來源,公司每年耗費千萬元用于編校,依舊無法解決編校難的問題。AI 編校能夠提高效率、擴大產能。
果麥文化有自己的研發部門,過去基于規則做編校相關的產品,但效果不理想。2022 年,公司利用神經網絡學習和通用大模型進行嘗試之後,發現其能夠解決過去基于規則不能解決的問題。去年做的小 demo 效果比較好,有信心基于通用大模型 / 自然語言處理去解決行業痛點。
果麥文化進一步表示,目前國家标準是錯誤率萬分之一,AI 編校達到千分之一就可以達成一個普通人的編校工作,預計在未來兩年可以做到十萬分之一,能 100% 解決問題。
在果麥文化看來,ChatGPT4 立足于海量數據的基礎上,對于原始已存在的錯誤,可能無法正确識别。而 AI 編校不會被超大模型覆蓋掉,出版行業不是夕陽產業,2024 年至 2030 年,預測會呈現穩步增長趨勢。AI 編校能夠提高效率,擴大產能,以往大部分編輯都在做編校工作,而不是創造性的工作。
果麥文化還透露,已經積累了 7900 萬左右的互聯網用户,2020 年下半年開始進行直播帶貨賣書,抖音十大讀書賬号果麥占據半壁江山 ( 易中天、戴建業、小嘉啊、好書博物館等 ) 。
2019-2022 年果麥 To C 收入占總收入比重分别約 2%、10%、14% 和 18%,2023 年 Q1 達到了 24%。To C 可以直接跟用户做交易,沒有應收賬款,顯著提升的 To C 收入占比改變了果麥的銷售模式,毛利率從 2020 年 46% 逐年上升,2023 年 Q1 毛利率超過 50%。從 2014 年到 2019 年,毛利率穩步上升,已經初步完成互聯網改造。
關于 AI 編校的問答:
Q1:在校對錯誤中,AI 編校能解決好哪些類型 ? 哪些類型解決不夠好以及怎麼提升 ?
1 ) 校對錯誤一般四種:錯别字,語義錯誤,事實性錯誤,敏感詞錯誤。
2 ) 對于事實性錯誤和敏感詞錯誤,AI 大模型做得比較好。
3 ) 語義錯誤:大模型基于全網去抓中文語料,往往被普通人的語言水平所影響,這個是未來重點要攻克的方向。
4 ) 未來 AI 編校主要集中在語義錯誤上,在這類錯誤識别上去提高精度。
Q2:校對事實類錯誤和錯别字會同步進行嗎 ?
中文具有模糊性的特征,有些錯别字需要結合具體語境去判斷。結合全文理解文字、識别錯别字、校對事實錯誤這三件事在難度上一致,而目前基于規則的模型都做不到,因此需要大模型或神經網絡進行學習。
Q3:為什麼會投資 AI 編校 ?
1 ) 編校是行業痛點,公司為此付出了很多人力成本。
2 ) 公司前期嘗試過 AI 編校,并且果麥也有自己的研發部門,過去基于規則做了編校相關的產品,但效果不理想 ;2022 年,利用通用大模型進行初次嘗試後,有所突破,所以決定投資這個賽道。
Q4:AI 編校能做哪些相關工作 ?
公司内部主要是使用 " 十維數據分析系統 " 在輔助工作,目前 AI 編校做的主要工作是:替代有标準化答案的工作,譬如,在編輯日常工作過裏的文字标點符号錯誤、事實錯誤等,都可以通過 AI 編校模型去替代。