今天小編分享的教育經驗:未來,你會被淘汰麼?,歡迎閱讀。
《更新書堂》· 第 378 篇
内容來源 | 本文摘自中國人民大學出版社書籍
《ChatGPT:讀懂 AI 爆發背後的技術和產業邏輯》
項立剛 劉欣 項天舒 著
責編 | 初心
第 7633 篇深度好文:5324 字 | 14 分鍾閱讀
2023 年 3 月堪稱人類科技史的重要裡程碑,以 ChatGPT 及 GPT-4 為代表的諸多人工智能產品的發布震驚了全世界,世人驚嘆于人工智能時代正在加速到來,或興奮或恐懼的情緒也随之在全球蔓延。
輿論場中各種各樣的聲音不斷刺激着人們敏感的神經:興奮者說 ChatGPT 的橫空出世拉開了第四次工業革命的序幕,人類将由碳基生命進化為矽基生命,借力 AI 将誕生無數 " 超級個體 + 一個人的商業帝國 ",如幾年前的 " 互聯網 +" 一樣,社會将步入由 "AI+" 引領的深度數字時代;
恐懼者說全球範圍内的失業狂潮将不可避免,智能機器人勢必在不遠的将來取代人類統治地球,在強大的 AI 面前人類不堪一擊,并且還借用《黑客帝國》《終結者》《機械公敵》《流浪地球》等著名科幻影片的經典橋段來表達對 AI 發展的恐懼和擔憂,仿佛世界末日近在眼前!
不同的情緒也引發了人們的種種困惑:ChatGPT 的出現到底意味着什麼?ChatGPT 将給我們的工作和生活帶來哪些衝擊?
人類會被機器取代嗎?社會會被 ChatGPT 重塑嗎?機器人會不會自我進化?AI 會不會發展出自己的人格?如何看待 AI 技術的發展?……
對于新生事物,過度吹捧和質疑都是不科學的。
《ChatGPT:讀懂 AI 爆發背後的技術和產業邏輯》一書就很好地解答了上述諸多困惑。
這是一本兼具專業水準和深刻洞見的誠意之作,作者是中國通信業著名觀察家項立剛領銜團隊,三位作者不僅理性審視了 ChatGPT 的前世、今生和未來,更以冷靜的筆觸和通俗的表達,為讀者厘清專業基本概念,層層揭開 ChatGPT 的神秘面紗。
一、為什麼火出圈的人工智能產品是聊天機器人
過去,我們記憶中的聊天機器人都是點狀思維的,你問什麼,它就回答什麼,經常前言不搭後語。而 ChatGPT 結合上下文的連續對話功能,讓我們體驗到了和真人互動的流暢性。
ChatGPT 以輕松有趣的 AI 聊天形态出現,最大限度地降低了使用門檻,能夠在最短時間内獲得海量用戶。同時,ChatGPT 擁有良好的多語言能力,得以在全球範圍内快速推廣。
一切都來得太快了,仿佛一夜之間,我們就進入了一個新的人工智能時代,所以人們驚呼:" 我們即将因 AI 而失業,人類即将被 AI 颠覆。" 特别是在 ChatGPT 被頻繁應用的領網域——程式員、媒體人、文案和翻譯們陷入焦慮,這種焦慮正在更大範圍裡蔓延。
ChatGPT 這樣的聊天機器人,讓用戶最直接地感受具備大模型處理能力的人工智能可能的表現,這種衝擊的意義是深遠的,顯然在人工智能的發展歷程中,它已經邁上了一個新的台階,這的确是人工智能服務人類的歷程中跨出的一大步。
僅憑 ChatGPT 這一款應用很難改變世界,但是人工智能技術一定會改變世界,ChatGPT 讓我們看到了人工智能蘊藏着巨大的發展潛力。
二、發展 ChatGPT 無法回避的四個難題
1. 通用引擎的局限
在專門的引擎中,系統是封閉的,相關信息是隔絕的,不會形成信息之間的衝突;而在通用的引擎中,衝突的信息共存在一個系統中,而又很難做到對用戶有所判斷。
在這種情況下,要做到生成的内容基本準确就是一個無法回避的巨大且極有難度的問題。而且,在通用引擎不斷學習的過程中,并沒有一個信息庫作為準确的藍本,不斷被輸入的語料,讓學習不斷發生,系統不斷被訓練,大量錯誤的信息又将成為語料的組成部分。
在這種情況下,諸多幹擾信息的存在就影響了信息的完整性和準确性。
用一個通用方案來解決所有問題,這看起來很美好,但是要把問題解決到符合商用标準,達到在某一領網域非常精準的水平,以我們今天的硬體支持和算力支撐條件來看,還有一定的差距。
到目前為止,ChatGPT 還很難變成真正意義上的商用產品,大家在驚嘆于它寫的一些似是而非的内容已經很有 " 人 " 味兒的同時,也會發現實際上它真正能應用于自己的工作和生活中的場景并不多,而且它對于中文的支持遠不如英文。
2. 标注的困窘
事實上,ChatGPT 的内容生成質量不僅需要技術人員去建立模型、優化算法、構建智能訓練的系統,同時它還需要大量的外包人員去手動完成數據标注。
長期來看,ChatGPT 能否把質量做到足以解決大部分問題,讓社會大眾普遍接受,在普遍意義上真正幫助用戶解決問題,标注的質量可以說是最大的掣肘,因為這不僅是一個技術問題,更是一個精細化運營的過程。
面對五花八門的敏感信息所采用的标準将決定 ChatGPT 的态度,它生成的内容将會影響很多用戶的判斷和理解。
這一标準的制定,标注人員的選擇,标注質量的檢查,檢查标準的制定等,這些都是復雜的系統性工作,而這些工作在很大程度上決定了 ChatGPT 的内容生成質量。
信息标注是一項極其重要的工作,依靠雇用貧窮國家的那些拿着超低工資的社會底層人員來完成,而這些标注者有着極大的文化差異和語言水平差異。
對于中文語境,更是存在數據殘缺和可供參與訓練的内容不足的弊端,如此境況下所做的标注和評分都不夠準确,這些問題也是 ChatGPT 想要做好中文内容存在極高難度的原因之一。
3. 無解的安全問題
ChatGPT 要做到理解更加全面,它不可能就相同的問題為所有的用戶提供一個共同的答案,而是應該根據用戶的提問,對用戶進行長期跟蹤,并對用戶的立場、态度、世界觀、年齡、性别、職業、學歷等做出判斷,然後根據這些要素生成符合用戶特點的信息。
然而,這就需要收集更多的用戶數據,再結合用戶的使用習慣和偏好,增進對用戶的了解。
事實證明,以上提到的這些數據确實可以幫助 ChatGPT 更深入地理解用戶,生成更高質量的内容。
但是,收集用戶數據,尤其是用戶的使用習慣,不可避免地會收集用戶的個人信息、興趣愛好、價值取向,乃至個人隐私等方面的一手信息。
這些信息是對一個人增進了解的重要工具,也是窺探用戶信息和用戶隐私的重要工具,對這些數據的收集行為不可能繞開監管部門的強力審查。
而且,在 ChatGPT 的系統中,用戶進行提問,ChatGPT 予以回答,但答案是唯一的,這就意味着用戶完全喪失了主導權,ChatGPT 給出的内容是什麼用戶只能被動地接受,用戶完全失去了選擇或判斷的可能性。
安全層面還有一個很大的問題,那就是版權,尤其是進一步發展,對于圖片内容進行處理,被人工智能處理之後的原圖版權,某些人物肖像被人工智能處理後生成新的影像,很可能產生肖像權糾紛。
大規模普及甚至濫用 ChatGPT 一定會導致信任危機。
對每個主權國家的政府而言,當 ChatGPT 大量生成内容信息輸出的時候,存在一個重要問題——這些内容很多涉及歷史、文化、道德、思想,涉及一個社會的基本價值觀,如果大量青少年使用,勢必會影響下一代的教育和價值判斷。而且它提供給用戶的信息是唯一的,沒有參照,無法選擇,存在一定程度上的灌輸意義。
這相當于将社會道德、思想、價值判斷的定義權交給了一家商業公司, 而這家公司是由工程師寫出規範,由國外低收入群體進行标注,這對于任何一個國家而言,都是不能容忍,也是不可能等閒視之的。
2023 年 5 月,紐約一名執業 30 年的律師為了幫代理人打赢一場過了訴訟時效的官司,用 ChatGPT 搜集對自己有利的判例并向法庭提交了相關文書,結果其中的 6 個案例的判決結果、引語等都是假的。
涉事律師稱,他詢問過 ChatGPT 案例的真實性,ChatGPT 再三确定這些案例是真實的,且在 " 可信的法律數據庫 " 中可以查找到。輕信 ChatGPT" 一本正經的胡說八道 " 讓他感到非常後悔,涉事律師和其所在律所也因此被處以 5000 美元的罰款。
這起事件不僅僅對法律界有着重要的警示作用,也應該引起各行各業的重視。始終保持對人工智能的審慎态度,将其作為輔助工具而不是絕對的決策依據,才能避免因依賴人工智能而導致的風險和問題,能夠明智地為社會和業務帶來長期的益處。
4. 如何參與社會實踐
今天我們看到的人工智能所有能力的形成,無外乎一種模式:建立模型,通過大量信息進行标注,一次次排序、打分,生成内容,對内容進行分析、打分,再進行訓練,最後漸漸讓内容達到比較符合人類思維的水平。
人工智能目前還是在人類的輔助下,通過算法、模型、人工标注來提升能力,由于人工智能面對的是大量的、不斷更新的知識,如果要形成自我學習的能力,就需要其親自參與社會實踐,在社會實踐中去理解邏輯,形成思維能力,對社會實踐的過程進行歸納、總結、演繹、推理,從而形成真正的智力。
目前來看,談人工智能達到這一步還為時過早,對 ChatGPT 這樣一個聊天機器人而言,它的功能還是較為單一的,還是要依賴人類的算法、模型和标注,我們現在沒有必要為人工智能的自我學習能力、自我意識而焦慮。
人工智能包含算法、數據、算力三大核心要素,面對信息時代近乎無限的内容,如何收集和篩選數據是人工智能要邁過的第一道坎,也是人工智能想要融入社會實踐必須解決的難題。
互聯網上有太多低質量甚至無效的有害信息,如果一直把這些垃圾當成養料投喂給大模型,其生成的内容質量必然大打折扣。
在社會實踐方面,華為盤古大模型就為大模型如何改造社會生產力提供了一個很好的觀察樣本。2023 年 7 月 18 日,山東能源集團、華為、雲鼎科技在濟南聯手發布全球首個商用于能源行業的 AI 大模型——盤古礦山大模型。
作為 AI 大模型在能源領網域的全球首次商用,山東能源、雲鼎科技、華為在前期試點驗證 AI 大模型賦能工業生產領網域的基礎上,正在開發和實施首批場景應用,涵蓋采煤、掘進、主運、輔運、提升、安監、防衝、洗選、焦化 9 個專業 21 個場景應用,切實做到了降本增效,并且還在持續地加以改進和探索。
相比之下,把大模型的能力應用于聊天機器人,被各路網友以各種奇葩問答 " 調戲 ",ChatGPT 更像是一個新奇的玩具而非改造生產力的工具了。
三、用系統思維看待人工智能的產業應用前景
人工智能由信息采集、信息存儲、信息傳輸、算法、大模型、信息加工等諸多環節組成,并在此基礎上形成決策機制,所有環節都不能脫離大系統而獨立發展,更不可能因為某個環節發展得好就超越了大系統,它只能是大系統的一部分,帶動整個大系統的發展。
不要簡單地把人工智能僅僅視為一項研究、一套算法或一個模型,它必然是一個龐大系統,要用系統的眼光去看待人工智能的發展和應用。
看一個國家的人工智能發展水平如何,只能看這個大系統的整體發展情況,因為人工智能最終是要為社會服務的,人工智能需要在每一個環節都形成匹配,設想利用單點突破而一舉攻克整個系統的難點,顯然是不切實際的。
人工智能要成為一種有價值的能力,就不可能單獨存在,需要和眾多的傳統能力結合起來提高效率。
人工智能一定要介入社會生活的諸多領網域,對社會管理、社會運營、生活服務、交通運輸、生產制造產生革命性影響,讓這些領網域的效率更高、能力更強、成本更低,讓很多以往不可能實現的能力因為人工智能的助力而得以實現。
人工智能要成為一個良好的服務系統,必須走軟硬體一體化的道路,需要軟硬體同步發展,除了傳統的電腦和智能手機,未來人工智能一定會用在智能汽車、無人船、無人機、智能電網、智慧工廠、智慧醫療等眾多的領網域,很多傳統行業面臨着自身的改造,需要主動适應人工智能的要求,成為智能體系的一部分。
而這些領網域要完成改造,需要一個漫長的接受過程,需要時間,也需要探索。今天全球的人工智能發展還剛剛開始,還遠遠沒完善到可以影響人類生存的程度。
對于人工智能的發展,人類大可不必如此焦慮。今天,對于從基礎建設做起,提升算力,加大存儲中心的建設,加強智算能力, 建立更多把人工智能和傳統領網域結合起來的接口,智能互聯網還有一段漫長的道路。
從基礎設施到算力、數據,再到應用能力,遠遠沒有強大到需要焦慮的程度。人類不需要抵制人工智能,而應該擁抱人工智能,抓住人工智能發展的機會,讓人類文明達到新的高度。
除了以上核心觀點外,本書還立足于互聯網發展階段和信息傳播演化的歷史經緯,着眼于中美兩大科技強國的人工智能和通信產業的發展縱橫,用極富創新性的觀察視角大膽暢想并系統性地闡述了 AI 的產業應用前景、前沿趨勢與挑戰。
擁抱、跟蹤一切技術突破,不斷完善自己的能力,這才是技術發展的開放心态。
這本書既不側重于技術講解,也不構成投資建議,更多的是幫助讀者了解技術創新給社會帶來的衝擊變化和潛在機遇,讓人們面對新生事物不再霧裡看花、人雲亦雲。
四、結語
看多了科幻大片,我們總會把 " 改變世界 " 想象成一個突如其來的偉大創舉,但事實上,人類世界正以肉眼可見的速度實現着數據化,恰恰是成千上萬人聚合後的數據張力,讓人工智能有可能站上最關鍵的位置,成為聯結虛拟與現實的核心入口。
在理解自然和社會的基礎上,構建技術應用場景,推動產業進步的人類實踐,最終推動着文明的進程。作為技術革命的人工智能,也不會是瞬間綻放在夜空的絢爛煙火,而是一次次腳踏實地、攀向高峰的前進步伐。
AI 爆發已經引發了劍指下一代互聯網主導權的 " 軍備競賽 ",事态的走向和變化都有待我們持續地關注和觀察,也希望能和各界的讀者朋友們一起見證歷史和人類文明的未來!
* 文章為作者獨立觀點,不代表筆記俠立場。
9 月 16 日,筆記俠 "AI 新視野,增長新勢能 " 第二屆新商業智能大會,将在杭州寶盛水博園大酒店舉辦。
眾多行業大咖、一線企業、初創公司在這裡聚集,分享彼此對 AI 的認知和經驗,幫你發現 AI 帶來的增長勢能,看到未來,融入未來,成為未來!
餘票不多,先到先得。
分享、點贊、在看,3 連