今天小編分享的财經經驗:把算法關進籠子,歡迎閲讀。
經濟觀察報 記者 任曉寧 這是一場預料中的交鋒。有人認為,算法是大數據時代的事情,AI 時代不需要監管算法;有人認為,算法需要一直被監管,因為它是數字時代的機器之心。
11 月 23 日,北京大學中關新園科學報告廳内。一場算法治理的主題論壇正在舉行。與會者包括政府官員,騰訊、美團等公司的代表,以及國内多家知名高校研究算法的專家。
這些觀點的激烈碰撞,很容易讓人們想起三天前的一次 " 炮轟 "。11 月 20 日,農夫山泉董事長鍾睒睒公開指責平台在算法流量管理方面的不作為,導致了他本人和他的企業受到了無端攻擊。
或許只是一個巧合。11 月 24 日,一場針對網絡平台算法典型問題的治理行動拉開了序幕,矛頭直指同質化推送營造 " 信息繭房 "、大數據 " 殺熟 "、侵害新就業形态勞動者利益等現實問題。
這是清朗行動的一部分。此次整治可以説是自 2021 年 9 月《關于加強互聯網信息服務算法綜合治理的指導意見》(下稱《指導意見》)發布之後,有關部門對平台算法的第一次全方位綜合治理行動。
經濟觀察報記者就治理行動涉及的企業自查自糾安排詢問抖音、快手、騰訊、京東、百度、阿裏巴巴、拼多多、美團、攜程、滴滴、小紅書等互聯網企業,截至發稿上述公司均未給予回應。
不過根據行動安排,有關部門将在明年 1 月檢驗企業自查情況,明年 2 月 14 日前完成專項行動實施成效總結," 全面評估《指導意見》印發以來的算法治理舉措及取得的積極成效,深入分析難點問題,制定今後一段時期的務實舉措 "。
上述《指導意見》明确提出,利用三年左右時間,逐步建立治理機制健全、監管體系完善、算法生态規範的算法安全綜合治理格局。
" 清朗行動 " 這次不一樣
這并非清朗行動第一次指向平台算法。
2021 年,清朗行動提出了 " 算法濫用治理 ",指導互聯網平台優化信息過濾、排名、推薦機制,要求開展算法安全技術檢查和技術評估。2022 年的清朗行動,聚焦于督促重點互聯網企業平台整改算法不合理應用帶來的 " 信息繭房 "" 算法歧視 " 等問題。
2023 年 12 月,清朗行動将重點放在了 " 整治短視頻信息内容導向不良問題 ",要求集中整治短視頻中的擺拍、技術生成等虛假信息,以及色情、低俗等博流量,煽動粉絲情緒,誤導消費者等問題。
多位接受經濟觀察報采訪的專家表示," 算法亂象 " 嚴重影響了用户體驗和社會信任,現在已經到了社會需要反思算法危害的時刻。
這一次,《關于開展 " 清朗 · 網絡平台算法典型問題治理 " 專項行動的通知》,由中央網絡安全和信息化委員會辦公室秘書局、工業和信息化部辦公廳、公安部辦公廳、國家市場監督管理總局辦公廳聯合發布。《通知》明确,此次專項行動重點整治同質化推送營造 " 信息繭房 "、違規操縱幹預榜單炒作熱點、盲目追求利益侵害新就業形态勞動者權益、利用算法實施大數據 " 殺熟 "、算法向上向善服務缺失侵害用户合法權益等重點問題。
清華大學人工智能國際治理研究院戰略與宏觀研究項目主任劉典認為,相較于過去的措施,這次的清朗行動治理目标更加明确、更多部門參與、治理手段更多樣,這些變化表明,政府正在嘗試構建一套更加系統、全面的算法治理體系,而非依賴于單一的短期行動。
普通中國人對算法的認識是一個逐步深化的過程。2018 年," 大數據殺熟 " 評為 2018 年度社會生活類十大流行語之一。2020 年,一篇《外賣騎手,困在系統裏》幾乎讓算法成為千夫所指,在這個過程中,對算法的治理也一步步納入監管視線。
2021 年 9 月,國家互聯網信息辦公室等 9 部門印發《關于加強互聯網信息服務算法綜合治理的指導意見》,提出 " 利用三年左右時間,逐步建立治理機制健全、監管體系完善、算法生态規範的算法安全綜合治理格局 "。2022 年 3 月,《互聯網信息服務算法推薦管理規定》正式實施。《規定》明确,應用算法推薦技術,是指利用生成合成類、個性化推送類、排序精選類、檢索過濾類、調度決策類等算法技術向用户提供信息,并明确了算法推薦服務向上向善的原則。
這與相關法律一起構成了算法治理的頂層設計。回到現實,和三年前相比,算法已經深度嵌入了社會生活的方方面面。
北京大學數字治理研究中心主任邱澤奇,自 2000 年起關注算法治理,他告訴經濟觀察報,公眾如今對各類算法應用都有了自己的體驗,已經深刻意識到信息繭房、算法偏見、算法歧視等問題,對算法的認知水平有了整體性提高。
談及此次專項行動,邱澤奇説:" 這次列出的治理要點更清晰了,他們把哪一些算法會導致什麼後果都點出來了 "。
神秘的算法
算法只是一系列解決問題的計算方式,背後反映的是平台目标。算法工程師按照平台的指令,敲下一行行代碼,組成了看不見、摸不着,卻又影響每個人的算法。
算法工程師隸屬的算法部門,往往是互聯網公司的核心技術部門。" 少而精 " 是這個部門最大的特點,一個算法團隊的标配是算法大牛——畢業于國内外頂級名校、手握多篇頂會論文、在業界與學界聲望顯著,帶領幾個同樣履歷耀眼的新人。
他們往往拿着全公司最高的收入,應屆生起薪總包在 40 萬— 50 萬元,甚至更高,資深算法工程師年薪在數百萬元。算法工程師在大廠更容易出成績,因為嚴重依賴數據和算力資源。
李璋就是一線大廠的一位算法工程師。他表示,算法并不像外界理解的那樣是徹底的 " 黑箱 ",一般都會發表論文公開原理。
在多位算法工程師看來,真正的黑箱不在算法原理之中,而在數據與平台機制設定之中。用户量越大、數據越多、平台機制向利益傾斜,便帶來了 " 算法亂象 "。
李璋舉例," 信息繭房 "" 誘導沉迷 "" 操縱榜單 " 都與推薦算法關聯,最終能被看到的内容或商品,都是由算法精心計算過的,最根本的是要讀懂用户的心。"
" 讀心 " 需要對用户海量的個人數據、行為數據等進行篩選,這些散落在網絡世界不同角落的痕迹,被收集到各個數據庫中,成為算法的最底層訓練支撐。
比如将網購記錄、浏覽記錄、在線下門店裏的消費記錄等個人數據,或者點贊、劃走等行為數據投喂給算法,就能得到 " 量身定制 " 的推薦内容。
李璋這樣的算法工程師,最重要的工作是 " 調參 ",每天面對成千上萬的參數,需要寫代碼讓算法自動去測試哪些更能激發用户的點贊、轉發、完播等反饋。
從李璋接受的指令來看,算法最終指向提高用户參與度,這是平台賺錢的基礎,他的任務是驅使算法找到更能調動用户活躍、維持平台留存的方案。
視頻數據分析平台百準創始人潘越飛分享了一個案例。
10 年前,他帶領算法團隊做過一個類似今日頭條的内容推薦平台,花了 3 年時間,把用户量從 0 做到了千萬級。當時,他們的算法将用户日均使用時長做到 32 分鍾,一度只比今日頭條差 3 分鍾,這個項目最終被字節跳動收購。
他説:" 算法的效率讓人驚喜,一個算法工程師能做到幾百個編輯完成不了的工作。" 在一次 AB 測試裏,他把頂級編輯選擇的内容與算法推薦的内容同時推送給用户進行對比,結果算法推薦的内容在點擊率、活躍時長和停留時長上均超人工推薦 3 倍。
潘越飛為算法設定了點贊率、互動率、停留率、分享率等指标要求,這與互聯網上大多 APP 的根本目的相似,都是為了讓更多人互動,增加消耗時間,帶來更多廣告位與商業價值。
潘越飛和工程師研發了上百個不同導向、不同訓練目标、不同幹預規則的算法模型,最後被大規模使用、被字節跳動購買的是那個符合平台商業價值效率的模型。該模型的用户活躍度最高,廣告流量價值更大。
失控時刻
算法由工程師創造,但算法也會失控。
幾年前,潘越飛已經隐隐感覺到 " 自己控制不住算法了 "。他説,算法推薦的内容質量并不令他滿意,尤其是一個合作夥伴當着他的面打開平台,體育欄目推薦的頭條是某個足球明星女友的裸露寫真,這讓他覺得很丢臉。
潘越飛曾為一條 " 蟒蛇吞噬了房子 " 的假新聞頭疼了十幾天。那是一張合成照片,打開正文就知道是假新聞,這條在他看來 " 無聊 " 的内容一下衝到平台熱搜榜第一名。他換了各種維度調試算法,但這張圖片永遠是第一名。最終沒有辦法,他只能手動删掉了圖片。
他解釋,用户沒見過蟒蛇吞噬房子的事件,所以打開率很高。圖片内容很短,所以完讀率很高。用户看完後覺得被騙了,于是在評論區開罵,帶來高互動率。互動完用户覺得這個平台太垃圾了,向身邊朋友吐槽,于是這條新聞分享率也很高。
打開率、完讀率、互動率、分享率都是算法評價内容是否值得推薦的權重,重重加持下,這條假新聞被推薦的次數越來越多。" 算法有數學邏輯,但它沒有心,沒有人類的共識,沒有情緒和價值觀。" 潘越飛説,算法只是兢兢業業地完成它的工作,它的量化指标只有數據。
他曾耗費極大精力和算法對抗,試圖讓算法減少推薦類似内容,但結論是,做不到。他并不想刻意調動用户的憤怒情緒,甚至無法準确得知哪批内容會被推送給哪群人,但算法就是會自然而然朝着那個他不希望的方向去走。
他試過精選内容,或增加權威媒體内容的權重,以保證平台内容質量的提升。但結果是,整個平台的用户時長大幅度下降了。這就違背了公司運營商業平台的初衷,于是只好再往回調,減少與算法的對抗。
算法工程師的背面則是依賴平台賺錢、生存的人。
馮彬是一個影視博主,全網粉絲超過 100 萬,他經歷過算法帶來的 " 爆火時刻 ",他發布的作品在 1 小時内衝上抖音、百度、B 站熱榜。在流量的爆發時刻,馮彬的後台消息全是 999+,視頻被彈幕刷屏,各種電話在幾周内密集湧來。
但馮彬依舊不敢説自己摸到了流量的門道。對他來説,平台就像有一只看不見的大手,掌握着生殺大權。
唯一一條實踐的經驗是,他在短視頻平台測試出,獵奇類的片子容易漲流量,比如志怪傳説、神鬼内容,有時候打上一個聊齋的标籤,即便内容和聊齋一點關系都沒有,也可能會火。盡管很多同行這麼做博取流量,馮彬并不認同這種行為。
多位算法工程師表示,在公司内部,算法并不是沒有價值觀,也有一些原則,比如説違法亂紀的内容肯定不能推薦,用户問如何去殺人,如何做炸彈等話題,必然不會得到答案,這由合規、安全和算法團隊配合進行處理。
但在一些灰色地帶,比如説獵奇的電影、恐怖電影,像電鋸驚魂,對一部分用户也有價值,一些平台認為不應該幹涉太多。" 像這類灰色地帶的事情,人類都無法做出評判的事情,那算法就更不可能做到。" 一位算法工程師表示。
在邱澤奇看來,算法自己不會作惡,問題出在數據和算法之間的匹配性上。他解釋,算法使用的數據始終是有偏的。當算法應用數據時,便會復刻現實社會的結構,甚至放大現實社會的問題。
善惡一念
邱澤奇曾與微信創始人張小龍長談,提及微信的廣告植入克制一事,加深了他對算法帶來社會後果機制的認識。
同一時間,邱澤奇也與網約車平台有接觸。當時正好遇到網約車乘客死亡事件,他提了一個建議,設定一鍵報警系統。後來他發現,網約車平台的改進比他想象的好很多了,增加了如錄音、一鍵報警、緊急聯系人等功能,做得越來越完善。
這讓邱澤奇感覺到,如果掌握技術的人能夠把社會的良心和社會共識的訴求植入到產品中,便是數字技術的向善,也是算法為人。至少,他可以做得相對克制一點,讓大家感受更好一點。
他強調:" 一家得到社會廣泛認可的技術公司,通常會選擇在讓大多數人獲益的同時,從大多數人那裏獲益,而不是簡單地竭澤而漁。"
西南大學國家治理學院講師畢文芬曾在重慶、貴州、雲南地區調研從事電商直播的農村婦女。她告訴經濟觀察報,許多人都提到 " 電商直播難做了 "。
在 2020 年左右,一些文化水平較低的農村婦女,在直播電商平台帶貨還能賺到錢,當時經過一些基礎的培訓,學會挂小黃車、上鏈接等,就能在直播上吸引到賣家。
有人靠着帶貨在縣城買了 170 平方米的大平層,有人把蘭花、銀飾等當地特色產品銷往全國,也有人會從中獲得一些打賞,改善生活,從田間走到直播間。
但是這兩年來,平台越來越向粉絲量大、懂得投流、會運營的人傾斜。直播間裏要有 " 氣氛擔當 " 宣傳造勢、要有話術刺激觀看者下單、要表演才藝、要建立矩陣賬号吸引流量……
這些沒有團隊支持的農村婦女沒有錢投流,也不懂運營,只會講解產品,有時連被平台罰款、封号都不知道,也沒有渠道申訴,要回賬号。
畢文芬觀察到,限流和罰款給這些農村婦女主播帶來了經濟和心理的衝擊,很多人會覺得是自己播的時間不夠長、不夠努力,而不會認識到平台規則變了,要麼延長直播時間,要麼回到務農工作裏。
畢文芬認為,平台前期也曾為當地女性提供了新的發展機遇,但當平台的導向改變,驅使算法盲目追求利益,實際也侵害這些弱勢群體的勞動者權益。
如何建立長效機制
根據上述《通知》,此次專項綜合治理分為三個階段,即企業自查自糾、屬地核驗企業自查情況以及治理成效評估總結。有關部門将在明年 1 月檢驗企業自查情況,明年 2 月 14 日前完成專項行動實施成效總結," 全面評估《指導意見》印發以來的算法治理舉措及取得的積極成效,深入分析難點問題,制定今後一段時期的務實舉措 "。
經濟觀察報記者就《通知》中提及的企業自查自糾安排詢問抖音、快手、騰訊、京東、百度、阿裏巴巴、拼多多、美團、攜程、滴滴、小紅書等互聯網企業,截至發稿日上述公司均未給予回應。
此次清朗行動涉及算法問題較多是内容平台,邱澤奇認為這與平台的成熟度有關,百度、阿裏巴巴、騰訊、滴滴、美團都曾經歷過輿論的風暴口,内容平台還沒有經歷過輿論的風暴口,這次是這類平台歷史上的第一次。
他表示,比如關于虛假信息的問題,以鍾睒睒事件為例,内容平台是可以有作為空間的,比如對事實類内容,如果未經核實,可以讓算法在内容裏打上平台提示,如:此内容未經核實,請注意辨别。對于未經核實的事實類内容,平台有提示的責任和義務。
工信部信息通信經濟專家委員會委員劉興亮熟悉多個互聯網大公司。他認為,對監管部門的要求,大公司并不會反對,他們也意識到這是個問題,應該得到治理。否則,如果讓算法長久跑偏,最後受害的是整個行業。
劉興亮認為,算法問題依舊在互聯網平台泛濫,其根本原因在于,算法具有很強的隐蔽性,很難界定某些後果是由算法直接導致的,它不像其他色情或暴力等問題,有明确先例可循。對這次監管部門的治理,他抱着樂觀期待的态度,但同時認為,一次治理并不能真正解決問題,他相信還會有下一次、下下次專項治理的清朗行動。
事實上,本次清朗行動,也特别提到對算法治理 " 建立長效機制 ",要求常态化開展算法服務安全風險監測防範工作,及時發現網站平台違規問題線索,并綜合運用督促整改、現場檢查、處置處罰等措施,提升算法常态化治理水平。
監管要求與平台需求天生會有矛盾。有專家将其形容為 " 瓷器屋裏捉老鼠 ",無論監管部門或是平台自身,都會有投鼠忌器的顧慮。消除算法偏見與平台商業利益之間也存在天然的矛盾。
劉典認為,算法治理是個慢慢來的過程,需要一步步完善。對算法進行監管确實會給平台帶來一些成本,比如技術更新和合規成本。但從長遠來看,這有利于營造健康的網絡環境,促進平台的可持續發展。具體來説,應要求平台加強内容審核,确保算法推薦的健康性和多樣性;公開算法的基本原理和主要運行機制,提高透明度;建立用户反饋機制,及時調整優化算法;避免過度采集個人數據,保護用户隐私。" 治理是有代價的,代價也會由關聯平台來承擔。" 邱澤奇説,平台治理已經到了治理質量再上台階的階段。如果平台能主動看到問題并解決問題,平台的發展也會再上台階。
(應受訪者要求,李璋為化名)