樹大招風的ChatGPT又遭起訴用以訓練的數據究竟值多少錢？

今天小編分享的科技經驗：樹大招風的ChatGPT又遭起訴用以訓練的數據究竟值多少錢？，歡迎閱讀。

财聯社 6 月 29 日訊（編輯馬蘭）人工智能雖然是今年最大的趨勢之一，但事實上業内外對這一技術現在都有些摸着石頭過河的感覺，無論是監管還是行業内部都不知道如何規範其發展。

而 ChatGPT 作為掀起人工智能熱潮的產品，更是處于風口浪尖。周三，美國一家律師事務所向加州北區聯邦法院提起集體訴訟，指控 OpenAI 和微軟使用互聯網抓取的信息來訓練 ChatGPT 時，嚴重侵犯了無數人的版權和隐私，要求公司賠償 30 億美元。

Clarkson 律師事務所的執行合夥人 Ryan Clarkson 表示，希望代表信息被竊取并被商業應用的人采取法律行動。

其在訴狀中指出，盡管制定了購買和使用個人信息的協定，但被告采取了不同的方式：盜竊。OpenAI 和微軟系統性地從互聯網中竊取了 3000 億個單詞，包括未經同意獲取的個人信息。

訴狀稱，OpenAI 秘密進行了數據的竊取，而沒有按照适用法律的要求，注冊為數據經紀人。數百萬人的個人信息，包括賬戶信息、姓名、聯系方式、支付信息、聊天記錄等隐私數據都在未經許可的情況下，被 OpenAI 和微軟收集、存儲、共享和披露。

課本費

這一訴訟無疑觸到了生成式人工智能的一個重大問題，即訓練人工智能用到的大量 " 課本 "，需不需要相關公司來買單。

Clarkson 認為，寫下數十億字的人們從未同意讓 OpenAI 這樣的公司用來訓練模型并謀取私利，他希望法院能夠就人工智能算法的訓練方式，以及人們數據被使用時如何獲得補償制定一系列監管措施。

Clarkson 律所還稱，之所以起訴 OpenAI 和微軟，也是槍打出頭鳥。因為 ChatGPT 的推出引發了人工智能軍備競賽，刺激了大量對手推出 AI 模型，因此，OpenAI 和微軟當然是第一目标。

目前已有 16 名人士列席原告，Clarkson 律師事務所還在尋找更多的原告。

雖然 OpenAI 并沒有透露其最新模型 GPT-4 使用了那些數據，但此前的 GPT 版本已被證實使用了維基百科、各大新聞和社交媒體評論中的數據。谷歌和其他公司的聊天機器人也采用了類似的數據集。

Gunderson Dettmer 事務所的知識產權律師 Katherine Gardner 分析，藝術家和其它創意專業人士若證明他們受版權保護的作品被用來訓練人工智能模型，或許可以對人工智能公司提起異議，但僅僅在網站上發帖或評論的人，不太可能用版權保護來獲得賠償。

截至目前，OpenAI 和微軟尚未對此事發表評論。

樹大招風的ChatGPT又遭起訴 用以訓練的數據究竟值多少錢？