今天小编分享的互联网经验: 清理用于 AI 训练的影像数据集,「Visual Layer」完成700万美元种子轮融资,欢迎阅读。
文 | Ricky 编辑 | 王与桐
5 月 16 日,总部位于美国的视觉数据管理平台 Visual Layer 宣布完成 700 万美元种子轮融资,本轮融资由 Madrona 和 Insight Partners 领投。据悉,新资金将用于管理训练、测试、微调由人工智能模型生成的大量视觉数据集。
实证表明,人工智能模型的质量直接取决于其所接受的数据质量。目前,有高达 30% 的海量影像和视频集合被错误标记、损坏、丢失,阻碍了企业用于产品和服务的人工智能模型发挥原有作用,进一步造成下游问题,导致企业浪费了宝贵的工程周期。
公司联合创始人 Danny Bickson 表示:" 全球各地的公司和组织都在经历数据的爆炸式增长,而可视化数据是最复杂、最具挑战性的数据类型之一。管理这些内容对于各行各业的客户至关重要。" 随着这些混乱的数据集越来越难以处理,提高数据质量比依赖脏数据的情况下优化算法更有益。Visual Layer 成立于 2022 年 10 月,该公司提出独特的 " 管理 "" 清理 " 数据的解决方案,该托管服务致力于帮助科学家和机器学习从业者生成更高质量的模型,加快更可靠的生成模型推向市场。
Visual Layer 建立在开源軟體包 Fastdup 之上,帮助数据科学家在模型训练之前清理数据集。它应用质量自动化来纠正影像标签、删除重复项、识别异常影像。每当它发现错误或混淆的影像标签时,平台会自动更正或删除该影像。目前,Fastdup 的早期用户达到 20 万,其中包括印度社交商务平台 Meesho。据 Meesho 方表示,Fastdup 自动检测、修复数据的功能,已经提高该公司近 2 亿产品图库的质量。
随着生成式人工智能模型越来越流行,供以训练的可靠视觉数据集需求水涨船高。 在 AI 构建者要求更高质量数据的趋势下,Visual Layer 这类公司的出现是不可避免的。