今天小編分享的科技經驗:年輕人反向馴化算法可能是徒勞,歡迎閱讀。
經濟觀察網 周悅 / 文 近日,一種另類的 " 留言帖 " 走紅社交媒體,上萬條評論整齊劃一 " 喊話 " 大數據。
最常見的三種留言格式分别是 " 某某太貴了,買不起 "" 告訴大數據,我愛看某内容 " 以及 " 某軟體,不發紅包我要解除安裝你 "。
許多年輕人試圖用這種做法反向馴化算法,減少 " 大數據殺熟 "" 信息繭房 " 的問題。
12 月 13 日,有媒體報道,一位網友反復留言 " 機票太貴了,買不起,不去了 " 後,同一個班機的機票價格直線下降近 3000 元。
12 月 18 日,多位大廠的算法工程師和產品經理告訴經濟觀察網," 留言喊話 " 很難直接影響算法推薦。
原因是,平台訓練算法通常更依賴用戶的行為數據,比如 " 轉、贊、評 "" 購買 " 和 " 點擊 " 等。将評論區文本納入算法訓練的成本高,并且效果難以評估。此外,這些文本屬于涉及用戶隐私信息的高度敏感數據,難以确定平台是否會納入算法訓練中。
" 留言喊話 " 是社交媒體上點贊量較高的 " 反向馴化算法 " 攻略之一。其他常見的方式還有修改個人信息為統一的昵稱 momo 和粉色恐龍頭像,以及頻繁解除安裝、重裝 App 等。
經濟觀察網向多位算法工程師求證以上方式是否有效,得到的答案是,絕大部分方式很難有直接效果。用戶只要使用 App 就會為算法持續提供基礎的數據,能夠有效影響算法的方式有兩種:要麼遵循平台的機制給予反饋,要麼限制 App 從手機獲取數據的權限。
平台、手機系統設定的機制最關鍵
多個内容平台都出現了 "momo 大軍 ",用戶集體改為相同的昵稱 momo 與粉色恐龍頭像,這種做法的确會逃過真實用戶的眼睛,卻很難模糊 momo 們的身份标籤,平台算法仍會精準識别他們的底層标籤。
某電商平台的算法工程師陳明告訴經濟觀察網,他已經是比較了解算法的人,但也只能按照平台機制調整 App 上推薦的内容,沒有辦法通過寫代碼等技術方式幹涉算法。比如,想讓系統推薦更便宜的機票,會在搜索框輸入文字或者多點擊 " 打折機票 "" 便宜機票 " 相關内容。
曾在手機廠商與内容平台都擔任算法工程師的劉飛告訴經濟觀察網,對 " 信息繭房 " 問題,最有效果的反饋機制是平台設定的 " 不喜歡 "" 不感興趣 "" 減少推薦 " 等按鈕,這些反饋能夠很快讓算法停止推薦無關内容。
劉飛表示,這些負樣本的價值很高,能訓練算法理解一類群體不喜歡的内容,互聯網公司一般都會有專門的團隊負責處理這些用戶反饋案例。
劉飛介紹,應對 " 信息繭房 " 與 " 大數據殺熟 " 問題,一個共通的辦法是直接關閉 " 個性化推薦 "。關閉這一功能一定程度上會減少 " 越刷越重復 "" 越刷越貴 " 的情況。不過,很多平台會将這一功能藏得很深,一般要翻找 3 — 4 個菜單頁面才能找到。因為開啟 " 個性化推薦 " 更容易猜中用戶喜歡的東西,會帶來廣告轉化,這是平台收入的重要來源。
他進一步解釋原理," 個性化推薦 " 基于用戶的歷史行為、興趣和需求等數據構建用戶畫像,以便更精準地推薦商品或服務。" 大數據殺熟 "" 信息繭房 " 同樣依賴用戶畫像,但目的分别是識别不同用戶群體的價格敏感度以及信息偏好。
關閉 " 個性化推薦 " 這一選項,可以追溯到 2022 年《互聯網信息服務算法推薦管理規定》出台,檔案明确了算法推薦服務提供者應當以顯著方式告知用戶其提供算法推薦服務的情況;向用戶提供不針對其個人特征的選項,或者向用戶提供便捷的關閉算法推薦服務的選項。
當年 "3 · 15" 前後,微博、微信、淘寶、哔哩哔哩、抖音、百度、大眾點評、小紅書等 App 陸續上線 " 個性化推薦 " 開關。
用戶使用 App 時,產生的數據會被算法捕捉。同樣,使用手機時,手機裡的相關設定也會影響算法,最典型的有三種情況:
一是像 " 大數據殺熟 " 這類涉及價格的情況,手機型号是影響較大的因素。劉飛表示,有些平台會在算法訓練中學習不同型号手機用戶的接受價格。用價格更便宜的手機搜索、下單,看到的產品價格可能會比較低,
二是開啟 " 數據共享 " 權限的影響。一位手機廠商的算法工程師向經濟觀察網表示 , 在内容平台上多次點擊 " 打折機票 " 的推薦,然後在訂票平台發現了低價商品,有可能是開啟了 App" 跟蹤你的使用情況 " 功能。用戶選擇同意後,能夠通過設備 ID 共享數據,具體的使用方式也受到不同系統隐私政策的限制。
此外,還有一種更加隐蔽的情況。許多用戶認為手機在 " 監聽 " 他們的談話——白天提到某個商品,晚上就收到推送。上述手機廠商的算法工程師稱," 手機監聽 " 可能是一個誤區,更可能的原因是開放了手機應用權限中的 " 訪問剪切板 " 或 " 使用剪切板 ",讓算法獲取了剪切板復制的内容,從而影響了算法推薦。不過目前主流作業系統已經對剪切板訪問進行了嚴格限制,以保護用戶隐私。
算法亂象還需治本
潘大星是一個資深的社交媒體用戶,她向經濟觀察網分享了多篇 " 反向馴化算法 " 攻略,是眾多 " 苦算法亂象久矣 " 的人之一。她曾因使用萬元的手機預訂酒店價格更高而多花了不少錢,也因為社交媒體總推薦相似内容,讓她誤以為某些觀點是主流共識。
今年,為了改善體驗,潘大星關閉了多個平台的 " 個性化推薦 " 功能。她發現,關閉 " 個性化推薦 " 對微博等平台的日常體驗影響不大;但短視頻平台推薦的内容質量會大幅下降,要麼大量推薦點贊超過千萬的視頻,要麼推薦點贊數為 10 — 100 不等的内容,兩極化明顯。她玩短視頻 5 年多了,5 年裡刷到 300 萬點贊以上的視頻不超過 10 次,兩極化的推薦方式更像面對一個新号的策略,試探用戶更喜歡哪些類别的内容,這種推薦方式很難讓一個老用戶滿意,她不得不再次打開 " 個性化推薦 "。
像潘大星這樣無法離開短視頻 " 個性化推薦 " 的用戶不在少數。2023 年 1 月,清華大學社會科學學院積極心理學研究中心發布的《用戶使用、算法推薦與信息繭房研究報告》顯示,超過 90% 的短視頻用戶選擇開啟個性化推薦算法,并且使用年限越長的用戶開啟算法推薦的比例更高。
清華大學人工智能國際治理研究院戰略與宏觀研究項目主任劉典告訴經濟觀察網,公眾對算法的認知在深化、數字素養在提高,這是識别算法亂象與防範算法濫用的重要一步。然而,僅靠個人行為很難撼動算法的根基,要解決 " 算法亂象 ",最重要的是建立一個多方參與、共同治理的生态,政府與平台應共同努力,構建公平透明的算法治理體系。
今年 11 月 24 日,中央網信辦等四部門就算法問題發布清朗行動,矛頭直指同質化推送營造 " 信息繭房 "、大數據 " 殺熟 "、侵害新就業形态勞動者利益等現實問題,要求平台企業自即日起至 2025 年 2 月 14 日,給出自查整改方案。
劉典認為,算法亂象其實已經存在一段時間了,但最近幾年随着社交媒體和電商平台的快速發展,算法濫用的情況越來越嚴重,帶來的侵犯隐私、誤導輿論等問題,已經嚴重影響了用戶體驗和社會信任。
他表示,一方面,需要完善法律法規,明确算法使用的邊界和底線,确保算法設計和應用的公平性、透明性和安全性;另一方面,要加強行業自律,鼓勵企業主動承擔社會責任,建立健全内部審查機制,确保算法應用符合倫理道德标準。算法監管确實會給平台帶來一些成本,比如技術更新和合規成本,但長遠來看,這有利于營造健康的網絡環境,促進平台的可持續發展。具體來說,可以通過引入多樣化的數據源、采用公平性評估指标、建立透明度報告等方式,提升算法的公平性和透明度。
(應受訪者要求,陳明、劉飛、潘大星為化名)