今天小編分享的科技經驗:剛剛,中國AI大模型「監管辦法」來了,歡迎閱讀。
7 月 13 日,網信中國官微消息稱,國家網信辦聯合國家發展改革委、教育部、科技部、工業和信息化部、公安部、廣電總局公布了《生成式人工智能服務管理暫行辦法》(以下簡稱「辦法」)。
其中,《辦法》明确生成式人工智能服務提供者應當依法開展預訓練、優化訓練等訓練數據處理活動,使用具有合法來源的數據和基礎模型;涉及知識產權的,不得侵害他人依法享有的知識產權;涉及個人信息的,應當取得個人同意或者符合法律、行政法規規定的其他情形;采取有效措施提高訓練數據質量,增強訓練數據的真實性、準确性、客觀性、多樣性。此外,明确了數據标注的相關要求。
同時,《辦法》中所稱生成式人工智能服務提供者,是指利用生成式人工智能技術提供生成式人工智能服務(包括通過提供可編程接口等方式提供生成式人工智能服務)的組織、個人。
此前的 4 月 11 日,國家互聯網信息辦公室發布了關于《生成式人工智能服務管理辦法(征求意見稿)》,目的是為促進生成式人工智能健康發展和規範應用,其中第七條涉及到生成式人工智能服務提供者數據來源的合法性問題引起國内業界和學界的關注。
據中國科學技術信息研究所所長趙志耘此前發布的《中國人工智能大模型地圖研究報告》(以下簡稱「報告」),中國大模型的各種技術路線都在并行突破,特别是在自然語言理解、機器視覺、多模态等方面,出現了多個在行業有影響力的大模型。據不完全統計,到目前為止,中國 10 億級參數規模以上大模型已發布了 79 個。
在剛剛結束的世界人工智能 WAIC 大會上,有 30 餘個大模型對外亮相。其中,阿裡雲、商湯、騰訊、京東等企業均借助此次 WAIC 的平台,對外發布了各自大模型的進展。
除此之外,第四範式、雲知聲等 AI 創業企業也競相對外展示了在大模型方面取得的最新成果。同時,清華大學計算機系知識工程實驗室的千億參數中英文對話模型 ChatGLM-130B、復旦大學自然語言處理實驗室的 MOSS 都吸引了參會者的目光。
據報告指出,中國大模型地網域和領網域分布相對集中。
從地網域分布看,有 14 省份均在開展大模型研發,主要集中在北京、廣東兩地,其中北京有 38 個大模型,廣東有 20 個大模型。從領網域分布看,自然語言處理仍是目前大模型研發最為活躍的重點領網域,其次是多模态領網域,在計算機視覺和智能語音等領網域的大模型還較少。從研發主體分布看,大學、科研機構、企業等不同創新主體都在積極參與大模型研發,但學術界與產業界之間的聯合研發仍不足。
報告顯示,北京、廣東、浙江、上海等地的大模型數量最多;同時這 4 個地方也是近三年人工智能伺服器采購數量最高的地區。
值得注意的是,北京、江蘇、廣東、上海等是大模型人才相對較多的地區,為大模型研發提供了關鍵的智力要素支撐。但另一方面,大模型具有較高門檻,需要高素質 AI 人才,目前各地大模型人才數量均不充足。
此外,從學術影響力看,北京、廣東、上海三地,不論是論文發表量還是引用量,都居國内最高。報告指出,中國大模型研發團隊積極推進大模型開源發展,目前已經有超過半數大模型實現開源。北京、廣東、上海三地開源數量和開源影響力均居國内前三。其中,高校及科研機構是開源的主力。
以下為《生成式人工智能服務管理暫行辦法》全文:
生成式人工智能服務管理暫行辦法
第一章 總則
第一條 為了促進生成式人工智能健康發展和規範應用,維護國家安全和社會公共利益,保護公民、法人和其他組織的合法權益,根據《中華人民共和國網絡安全法》、《中華人民共和國數據安全法》、《中華人民共和國個人信息保護法》、《中華人民共和國科學技術進步法》等法律、行政法規,制定本辦法。
第二條 利用生成式人工智能技術向中華人民共和國境内公眾提供生成文本、圖片、音頻、視頻等内容的服務(以下稱生成式人工智能服務),适用本辦法。
國家對利用生成式人工智能服務從事新聞出版、影視制作、文藝創作等活動另有規定的,從其規定。
行業組織、企業、教育和科研機構、公共文化機構、有關專業機構等研發、應用生成式人工智能技術,未向境内公眾提供生成式人工智能服務的,不适用本辦法的規定。
第三條 國家堅持發展和安全并重、促進創新和依法治理相結合的原則,采取有效措施鼓勵生成式人工智能創新發展,對生成式人工智能服務實行包容審慎和分類分級監管。
第四條 提供和使用生成式人工智能服務,應當遵守法律、行政法規,尊重社會公德和倫理道德,遵守以下規定:
(一)堅持社會主義核心價值觀,不得生成煽動颠覆國家政權、推翻社會主義制度,危害國家安全和利益、損害國家形象,煽動分裂國家、破壞國家統一和社會穩定,宣揚恐怖主義、極端主義,宣揚民族仇恨、民族歧視,暴力、淫穢色情,以及虛假有害信息等法律、行政法規禁止的内容;
(二)在算法設計、訓練數據選擇、模型生成和優化、提供服務等過程中,采取有效措施防止產生民族、信仰、國别、地網域、性别、年齡、職業、健康等歧視;
(三)尊重知識產權、商業道德,保守商業秘密,不得利用算法、數據、平台等優勢,實施壟斷和不正當競争行為;
(四)尊重他人合法權益,不得危害他人身心健康,不得侵害他人肖像權、名譽權、榮譽權、隐私權和個人信息權益;
(五)基于服務類型特點,采取有效措施,提升生成式人工智能服務的透明度,提高生成内容的準确性和可靠性。
第二章 技術發展與治理
第五條 鼓勵生成式人工智能技術在各行業、各領網域的創新應用,生成積極健康、向上向善的優質内容,探索優化應用場景,構建應用生态體系。
支持行業組織、企業、教育和科研機構、公共文化機構、有關專業機構等在生成式人工智能技術創新、數據資源建設、轉化應用、風險防範等方面開展協作。
第六條 鼓勵生成式人工智能算法、框架、芯片及配套軟體平台等基礎技術的自主創新,平等互利開展國際交流與合作,參與生成式人工智能相關國際規則制定。
推動生成式人工智能基礎設施和公共訓練數據資源平台建設。促進算力資源協同共享,提升算力資源利用效能。推動公共數據分類分級有序開放,擴展高質量的公共訓練數據資源。鼓勵采用安全可信的芯片、軟體、工具、算力和數據資源。
第七條 生成式人工智能服務提供者(以下稱提供者)應當依法開展預訓練、優化訓練等訓練數據處理活動,遵守以下規定:
(一)使用具有合法來源的數據和基礎模型;
(二)涉及知識產權的,不得侵害他人依法享有的知識產權;
(三)涉及個人信息的,應當取得個人同意或者符合法律、行政法規規定的其他情形;
(四)采取有效措施提高訓練數據質量,增強訓練數據的真實性、準确性、客觀性、多樣性;
(五)《中華人民共和國網絡安全法》、《中華人民共和國數據安全法》、《中華人民共和國個人信息保護法》等法律、行政法規的其他有關規定和有關主管部門的相關監管要求。
第八條 在生成式人工智能技術研發過程中進行數據标注的,提供者應當制定符合本辦法要求的清晰、具體、可操作的标注規則;開展數據标注質量評估,抽樣核驗标注内容的準确性;對标注人員進行必要培訓,提升尊法守法意識,監督指導标注人員規範開展标注工作。
第三章 服務規範
第九條 提供者應當依法承擔網絡信息内容生產者責任,履行網絡信息安全義務。涉及個人信息的,依法承擔個人信息處理者責任,履行個人信息保護義務。
提供者應當與注冊其服務的生成式人工智能服務使用者(以下稱使用者)籤訂服務協定,明确雙方權利義務。
第十條 提供者應當明确并公開其服務的适用人群、場合、用途,指導使用者科學理性認識和依法使用生成式人工智能技術,采取有效措施防範未成年人用戶過度依賴或者沉迷生成式人工智能服務。
第十一條 提供者對使用者的輸入信息和使用記錄應當依法履行保護義務,不得收集非必要個人信息,不得非法留存能夠識别使用者身份的輸入信息和使用記錄,不得非法向他人提供使用者的輸入信息和使用記錄。
提供者應當依法及時受理和處理個人關于查閱、復制、更正、補充、删除其個人信息等的請求。
第十二條 提供者應當按照《互聯網信息服務深度合成管理規定》對圖片、視頻等生成内容進行标識。
第十三條 提供者應當在其服務過程中,提供安全、穩定、持續的服務,保障用戶正常使用。
第十四條 提供者發現違法内容的,應當及時采取停止生成、停止傳輸、消除等處置措施,采取模型優化訓練等措施進行整改,并向有關主管部門報告。
提供者發現使用者利用生成式人工智能服務從事違法活動的,應當依法依約采取警示、限制功能、暫停或者終止向其提供服務等處置措施,保存有關記錄,并向有關主管部門報告。
第十五條 提供者應當建立健全投訴、舉報機制,設定便捷的投訴、舉報入口,公布處理流程和反饋時限,及時受理、處理公眾投訴舉報并反饋處理結果。
第四章 監督檢查和法律責任
第十六條 網信、發展改革、教育、科技、工業和信息化、公安、廣播電視、新聞出版等部門,依據各自職責依法加強對生成式人工智能服務的管理。
國家有關主管部門針對生成式人工智能技術特點及其在有關行業和領網域的服務應用,完善與創新發展相适應的科學監管方式,制定相應的分類分級監管規則或者指引。
第十七條 提供具有輿論屬性或者社會動員能力的生成式人工智能服務的,應當按照國家有關規定開展安全評估,并按照《互聯網信息服務算法推薦管理規定》履行算法備案和變更、注銷備案手續。
第十八條 使用者發現生成式人工智能服務不符合法律、行政法規和本辦法規定的,有權向有關主管部門投訴、舉報。
第十九條 有關主管部門依據職責對生成式人工智能服務開展監督檢查,提供者應當依法予以配合,按要求對訓練數據來源、規模、類型、标注規則、算法機制機理等予以說明,并提供必要的技術、數據等支持和協助。
參與生成式人工智能服務安全評估和監督檢查的相關機構和人員對在履行職責中知悉的國家秘密、商業秘密、個人隐私和個人信息應當依法予以保密,不得洩露或者非法向他人提供。
第二十條 對來源于中華人民共和國境外向境内提供生成式人工智能服務不符合法律、行政法規和本辦法規定的,國家網信部門應當通知有關機構采取技術措施和其他必要措施予以處置。
第二十一條 提供者違反本辦法規定的,由有關主管部門依照《中華人民共和國網絡安全法》、《中華人民共和國數據安全法》、《中華人民共和國個人信息保護法》、《中華人民共和國科學技術進步法》等法律、行政法規的規定予以處罰;法律、行政法規沒有規定的,由有關主管部門依據職責予以警告、通報批評,責令限期改正;拒不改正或者情節嚴重的,責令暫停提供相關服務。
構成違反治安管理行為的,依法給予治安管理處罰;構成犯罪的,依法追究刑事責任。
第五章 附則
第二十二條 本辦法下列用語的含義是:
(一)生成式人工智能技術,是指具有文本、圖片、音頻、視頻等内容生成能力的模型及相關技術。
(二)生成式人工智能服務提供者,是指利用生成式人工智能技術提供生成式人工智能服務(包括通過提供可編程接口等方式提供生成式人工智能服務)的組織、個人。
(三)生成式人工智能服務使用者,是指使用生成式人工智能服務生成内容的組織、個人。
第二十三條 法律、行政法規規定提供生成式人工智能服務應當取得相關行政許可的,提供者應當依法取得許可。
外商投資生成式人工智能服務,應當符合外商投資相關法律、行政法規的規定。
第二十四條 本辦法自 2023 年 8 月 15 日起施行。