共计 1552 个字符,预计需要花费 4 分钟才能阅读完成。
在旧金山的 Showplace 广场,一栋曾经属于 Airbnb 的办公楼近期迎来了新租户——Scale AI。这家由 95 后华人创立的人工智能数据标注公司,以 18 万平方英尺的办公空间展示了其快速扩张的雄心。
就在不久之前,Scale AI 宣布完成了一轮 10 亿美元的融资,估值攀升至 138 亿美元。此轮融资由硅谷顶级投资机构 Accel 领投,同时吸引了亚马逊、Meta、英伟达等众多科技巨头的加入。这些投资者不仅是资本方,更是 Scale AI 的深度用户。
数据标注的黄金时代
提到 AI 产业链中的关键角色,英伟达常常被视为“卖铲人”,而 Scale AI 则扮演了类似的桥梁角色。算力、算法和数据构成了 AI 的核心三要素,其中英伟达主导了算力市场,而 Scale AI 则聚焦于为 AI 提供高质量的数据支持。
成立于 2016 年的 Scale AI,其创始人 Alexandr Wang 出生于 1997 年,年仅 19 岁时便从麻省理工学院退学创业。该公司最初专注于人工智能数据标注,通过帮助企业收集、整理和标注大规模高质量数据,优化机器学习模型。
尽管数据标注听起来简单,但它是 AI 发展中不可或缺的一环。无论是图像、文本还是语音数据,都需要被赋予结构化信息,以便机器学习模型能够理解并学习。然而,高质量标注需要耗费大量时间和精力,尤其是在医学影像、自动驾驶等高精度领域,错误标注可能导致严重后果。
Scale AI 通过结合自动化技术和人工审核,建立了一个高效的标注平台。其核心业务是将数据处理外包给劳动力丰富的地区,如非洲和东南亚,以低成本实现高效率。
踩准每个 AI 风口
数据标注虽然是一个看似低门槛的行业,但在 2016 年之前,市场对此并未给予足够重视。那时,仅有谷歌、亚马逊等少数大公司拥有自己的数据标注团队。而 Scale AI 的成功在于敏锐捕捉到了这一机遇,并在 AI 发展的多个关键节点抢占先机。
第一个机遇来自自动驾驶领域。在 Scale AI 成立初期,自动驾驶技术对标注数据的需求急剧增加。车企需要海量视频数据来训练和验证算法,而这些工作大多依赖人工完成。通过引入高效的标注工具和技术,Scale AI 大幅降低了成本和时间,吸引了 Waymo、Cruise 等头部企业。
随后,Scale AI 逐步拓展到 AI 即服务(AIaaS)领域,从单纯的标注服务延伸到数据管理、模型训练和部署等全流程解决方案。为了应对数据不足的问题,公司还涉足合成数据的生成,通过现有数据创建新数据集,帮助客户训练更强大的模型。
近年来,生成式 AI 的爆发为 Scale AI 带来了新的增长点。公司与 OpenAI 合作,利用人类反馈的强化学习技术,推动了生成式 AI 的发展。同时,通过整合标注和合成数据服务,Scale AI 为生成式 AI 提供了强有力的支持。
为何 Scale AI 脱颖而出
尽管中国在人口红利和数据标注成本方面具有天然优势,但国内并未出现类似 Scale AI 的成功案例。这主要归因于行业特性和融资环境的差异。
在国内,许多龙头企业虽然设有数据标注部门,但这些部门更多是为了内部使用,而非开放给其他行业。此外,国内劳动力成本较低,企业缺乏动力采用技术平台。相比之下,美国的高人力成本迫使企业寻找更高效的解决方案。
从融资角度来看,国内数据标注市场长期处于 AI 领域的边缘地位。2021 年中国数据标注市场规模仅为 43 亿元人民币,远不及全球 AI 市场的庞大体量。这使得国内数据标注公司难以获得足够的资金支持。
事实上,数据标注只是冰山一角,数据管理、评估和合成等全流程服务才是行业的真正价值所在。Scale AI 通过这些增值服务,不仅满足了客户需求,还为自己创造了更大的发展空间。
创始人 Alex Wang 指出,未来 AI 的发展需要更多与特定任务和应用场景匹配的数据。这意味着需要挖掘和生产更多差异化的数据,这也是 Scale AI 下一阶段的重点工作。