今天小編分享的互聯網經驗: 清理用于 AI 訓練的影像數據集,「Visual Layer」完成700萬美元種子輪融資,歡迎閲讀。
文 | Ricky 編輯 | 王與桐
5 月 16 日,總部位于美國的視覺數據管理平台 Visual Layer 宣布完成 700 萬美元種子輪融資,本輪融資由 Madrona 和 Insight Partners 領投。據悉,新資金将用于管理訓練、測試、微調由人工智能模型生成的大量視覺數據集。
實證表明,人工智能模型的質量直接取決于其所接受的數據質量。目前,有高達 30% 的海量影像和視頻集合被錯誤标記、損壞、丢失,阻礙了企業用于產品和服務的人工智能模型發揮原有作用,進一步造成下遊問題,導致企業浪費了寶貴的工程周期。
公司聯合創始人 Danny Bickson 表示:" 全球各地的公司和組織都在經歷數據的爆炸式增長,而可視化數據是最復雜、最具挑戰性的數據類型之一。管理這些内容對于各行各業的客户至關重要。" 随着這些混亂的數據集越來越難以處理,提高數據質量比依賴髒數據的情況下優化算法更有益。Visual Layer 成立于 2022 年 10 月,該公司提出獨特的 " 管理 "" 清理 " 數據的解決方案,該托管服務致力于幫助科學家和機器學習從業者生成更高質量的模型,加快更可靠的生成模型推向市場。
Visual Layer 建立在開源軟體包 Fastdup 之上,幫助數據科學家在模型訓練之前清理數據集。它應用質量自動化來糾正影像标籤、删除重復項、識别異常影像。每當它發現錯誤或混淆的影像标籤時,平台會自動更正或删除該影像。目前,Fastdup 的早期用户達到 20 萬,其中包括印度社交商務平台 Meesho。據 Meesho 方表示,Fastdup 自動檢測、修復數據的功能,已經提高該公司近 2 億產品圖庫的質量。
随着生成式人工智能模型越來越流行,供以訓練的可靠視覺數據集需求水漲船高。 在 AI 構建者要求更高質量數據的趨勢下,Visual Layer 這類公司的出現是不可避免的。