训练AI取代自己?纺织工和外卖骑手正收集“第一人称视角数据”
近来,为了使 AI 模型和机器人更好地理解物理世界,人类的劳动过程正成为 AI 训练数据的 " 收割 " 对象。印度工厂职工头戴摄像头拍摄 " 第一人称视角 " 的视频素材,被打包成数据集出售;美国外卖骑手兼职记录自己执行各种任务的视频,上传平台赚取额外收入。
" 对于那些试图让机器人模仿人类动作的公司来说, 第一人称视角数据 可能是一种极具成本效益的实现方式。" 印度信息技术研究所海得拉巴分校机器人研究中心助理教授斯潘丹 · 罗伊(Spandan Roy)告诉媒体,喂给系统的数据越多,机器人就越聪明。
传统的机器人训练方式是招募人员,让机器人在计算机生成的虚拟三维环境中复制他们的动作。现在,利用视觉数据成为另一种更为便捷的训练方法。
此类视觉数据收集活动的增加引发了担忧:" 工人是在训练 AI 来取代他们自己吗?" 值得关注的是,有一些工人是在不知情、未被征得同意的情况下被收集第一人称视角数据。
印度工人身上的 " 白鼠实验 "
4 月,印度工厂内的一段视频在网络上疯传。画面里,一排排工人正坐在缝纫机前缝制衣服,他们头上佩戴着装有摄像头的环形设备,记录着每一步操作。

这段疯传的视频中,工人们佩戴着一种可以记录动作的设备,正在缝制衣服。
据印度知名独立媒体 Scroll 报道,这发生在服装制造巨头明珠全球工业有限公司位于古鲁格拉姆(Gurugram)的工厂。" 我们被要求在上午 10 点到下午 4 点之间佩戴这个设备。" 该工厂的一位工人称," 他们说我们必须佩戴一个星期,想看看我们在轮班期间都在干什么,以及干了多长时间。"
" 我们不相信这些理由。" 另一名工人说," 工厂里本来就有摄像头,为什么不用那些?" 该公司大多数工人来自比哈尔邦或西孟加拉邦的村庄,他们从周一到周六每天工作 12 个小时,月薪在 20000 至 30000 卢比(约合人民币 1420 元至 2130 元)之间。
工人每天下班时,管理人员会收回这些配备了 32GB 内存卡的摄像头。每台设备都有一个独特的序列号,这个号码会被记录在工厂提供给工人的身份 ID 旁边。
有几名工人对这个设备感到警惕。" 它的电池就在我们的太阳穴附近,随着电池发热,我们会感到不舒服。" 一位工人说," 感觉它就像在吸我们的血一样。"
还有工人对该设备的过度监视感到不安。" 去洗手间之前,我们必须把它摘下来。"" 而且,戴着它的时候我们不能和配偶说话,它会偷听我们的对话。我们也不能到处走动,有时候我自己会把设备关掉。"
参与这个项目的工人们表示,对于佩戴该设备,公司从未征得他们的同意,无论是通过口头还是书面形式。
致力于研究技术与社会交汇议题的印度非营利机构 Aapti 研究所指出,与其通过个人知情同意的视角来思考数据收集,不如 " 从 集体数据权利 的概念出发,因为它影响的是整个工人集体 "。" 我们需要有集体社区的力量。否则,我们就是在做那些让我们自己失业的工作。"
类似的摄像设备也曾出现在 " 肯印度(Ken India)" 公司的工厂里。这是一家总部位于印度马哈拉施特拉邦的纺织制造商。该公司在领英平台上的一篇帖子中表示,工人佩戴的这些硬件设备属于名为 Egolab AI 的初创公司。
设备收集到的视觉数据会被 " 聚合、处理并打包成数据集 ",提供给 " 构建机器人、计算机视觉和自主系统的全球 AI 公司 "。Egolab AI 在一份文件中称,这些公司包括特斯拉、波士顿动力以及 Figure AI。
Egolab AI 于 2026 年 1 月由印度两名青少年创立,自称为 " 印度最大的第一人称视角(POV)数据聚合商 "。该公司在一份公开文件中表示,到 2027 年,将聚合印度每个主要邦和各个行业的第一人称视角数据,包括纺织、汽车、化工、电子、钢铁和快消品。
创立仅两个月,Egolab AI 就被美国一家公司收购,交易金额达到七位数。" 这一庞大的数据集将成为全球 AI 和机器人训练的基石。"Egolab AI 公司称,工人们会因 " 为 AI 的进步做出贡献 " 而感到自身价值的提升,并且是自愿选择加入数据收集的。该公司强调,这一行为符合印度《2023 年 数字个人数据保护法 》。
Egolab AI 的一份报告样本显示,数据收集系统基于摄像头设备捕捉的画面,利用 AI 生成了工厂工人的 " 生产力分析 ",列出 " 最佳工人 " 和 " 最差工人 " 的生产力,并以此计算出 " 平均生产力 " 得分。

Egolab.AI 的样本报告展示工厂工人的 " 生产力分析 "。
样本报告中的分析写道:" 您的工人平均每天有 2.2 小时没有在工作,这导致您每天因产出减少而损失约 33000 卢比。" 此外,报告还量化地拆解了工人在非工作时间都在做什么,例如 " 空闲比例 " 中有 32% 花在了与同事聊天上,报告甚至指名道姓地指出了特定工人。
随后,报告将这些分数与 Egolab AI 合作过的其他工厂进行对比,从而给出了工人生产力的百分位排名。
纺织业是印度最大的雇工行业之一,直接从业人口近 4500 万,其中许多人来自农村地区。这并不是唯一通过工人收集第一人称视角数据的行业。印度公司阿维格(Awign)企业有限公司也在收集类似数据,用于实现切黄瓜或整理玩具等家务活的自动化。另一家总部位于旧金山的初创公司 Humyn AI 也正试图建立类似的业务。
外卖骑手通过记录自己的工作赚钱
在美国,外卖骑手成为收集视觉数据的 " 工具 ",他们还能从中赚取报酬。今年 3 月,美国外卖巨头 DoorDash 推出一款名为 Tasks(任务)的独立应用。根据该公司公告,Tasks 允许其美国 800 万名零工从业者通过记录自己执行各种任务的视频来赚钱。这些数据随后将被应用于训练 AI 和机器人。
这款新应用中提供的任务包括叠衣服、洗碗筷和铺床等日常家务,根据每项零工付出的劳动和复杂程度提供不同的报酬。像修剪植物和换盆这样难度较高的任务,报酬则更加丰厚。
骑手还可以通过录制其他语言的口语内容来获得报酬。应用上的一个任务列表就提示西班牙语使用者:" 与您的朋友或家人就日常话题进行自然、即兴的对话 "。
" 我们认为,这对于构建 物理智能 的前沿领域将具有巨大意义。"DoorDash 联合创始人兼首席技术官安迪 · 方(Andy Fang)在社交媒体上谈到此次发布时写道。
去年,优步(Uber)也试点了一项类似的任务,允许其美国零工从业者通过执行额外的数字化任务来赚钱,包括上传用于训练 AI 的照片和录音。近年来,数据标注行业蓬勃发展,数十个平台都在雇用合同工来帮助在线训练 AI 模型。
据《洛杉矶时报》报道,一款对接企业与小时工的招聘应用 Instawork,一直在洛杉矶招募工人,让他们戴上配有手机支架的头带,记录打扫房间的过程。
其他机器人开发商也开发了类似的数据收集策略。总部位于美国加州的机器人公司 Sunday Robotics 向全国各地邮寄一种 " 技能捕捉手套 ",人们通过戴着这种机械手套做家务来收集运动数据,数据随后会被用来训练该公司正在研发的 AI 驱动家用机器人。
然而,从收集第一人称视角数据到实现工厂机器人的自动化,科技公司需要来自多个地区的数十亿小时的高质量数据。像 Build AI 这样曾获得重量级投资的科技公司,目前声称收集到的数据也仅仅是冰山一角。