个人声音信息被强制采集用于企业AI模型训练?涉事学校、企业回应

大河报 · 豫视频记者 梁奇慧

近日,一名 IP 属地为湖北的网友小刘(化名)发帖称,自己被学校要求录制日常对话音频,用于企业 AI 语音模型训练,并称该任务与专业课成绩挂钩,她告诉大河报《看见》记者,未完成者将面临 " 成绩不合格、必须重修 " 的后果。

该帖引发广泛关注,评论区多名 IP 在湖北的网友指称,湖北某职业学院也有类似情况。该校多名学生向记者反映,学校近期实行 " 校企融合实训项目 ",项目内容包含 " 语音标注 ",实为音频录制。记者注意到,上述音频信息均提供给安徽某飞科技有限公司使用。

11 月 27 日,涉事公司工作人员回复大河报《看见》记者称,应该是公司的供应商与学校开展的合作,他们此前并不知情," 我们肯定是要求自愿的,涉及到个人生物信息是很严肃的事情 "。27 日下午,涉事学校、湖北省教育厅等针对此事回复了记者。

学校采集音频给企业使用,并与成绩绑定?

11 月 26 日,大河报《看见》记者联系到发帖网友小刘,她表示学校要求他们要在 11 月 30 日前完成音频采集工作,并表示完成录音的同学部分课程可获平时分满分奖励,未完成同学则 " 该门专业课平时成绩不合格,且此门专业课期末考试不能及格,必须重修 "。此外,小刘称,学校也未告知是否有相应报酬。

她提供的一份《声音采集安全声明》显示,所采集声音将用于声线训练、语音合成及变声模型等技术开发,并授权给安徽某飞科技有限公司(以下简称 " 安徽某飞科技公司 ")全线产品使用。尽管已有一些同学配合完成录音,小刘及部分同学仍对此表示疑惑与不满,出于隐私考虑,她未向记者透露所在学校名称。

此外,记者注意到,该帖已引发广泛讨论,部分 IP 属地为湖北的网友反映,湖北某职业学院也存在类似情况。该校多位学生反映称,近期学校开展了包括 " 电商客服 "" 语音标注 "" 游戏直播 " 等在内的校企融合实训项目,学生必须选择其中一项完成。

据学生小杨(化名)介绍," 语音标注 " 即为音频录制,内容为日常对话,如 " 好久不见 " 等。完成相应数量音频后可获得一定的报酬,但具体用途和数据处理方式未明确说明,这也是小杨不愿参与该实训项目的主要原因之一。

小杨称,录音内容要求为日常对话,如 " 好久不见 "" 最近在忙啥呢 " 等,完成语音录制的学生可获得 1500 元左右的收入," 承诺的是 1 条音频时长是 1 个小时,价格是 15 元,每天需要完成 4 条音频,完成 100 条能给 1500 元。"

小杨向记者提供的一份 " 数据授权书及知情同意函 " 的截图显示,被授权人也是安徽某飞科技公司,其中提到音频数据的用途为 "AI 模型训练 ""AI 音色训练 "" 甲方及其关联公司的语音类产品、其他类似产品或服务(含商业 / 非商业目的)",值得注意的是,这些音频的使用年限为 " 自签约日起 30 年内有效,且甲方享有续约权 "。

不过该授权书中也提到,其设置了授权撤回机制,被采集音频信息的个人有权申请撤回授权,撤回后甲方即甲方开展合作的 AI 公司将停止用于 AI 模型训练。

此外,记者注意到,湖北某职业学院数智商贸学院官网曾于 11 月 6 日发文称,该院围绕电子商务、直播电商、跨境电商、物流管理等开展多个校企融合实训项目,其中并未提到音频采集等。

涉事企业:必须遵循自愿原则,此前供应商会找宝妈等居家人员提供

11 月 27 日,记者联系到涉事企业安徽某飞公司的工作人员,对方回应称,公司已于前一日知悉此事,并表示该合作应为供应商与校方直接对接,公司此前并不知情。

该工作人员表示,他们公司要求参与音频录制的当事人必须出于真实意愿,以确保录音情绪自然、内容合格。" 如果(参与录制的人)情绪不好,录的结果就很难合格。" 他向记者强调," 这是个人的生物信息,是很严肃的事情。"

" 我们在跟供应商沟通的时候,曾提到过不建议跟校方合作。" 他表示,之前合作过的一些供应商是找 " 宝妈 " 或寻求兼职的居家人员," 我们给出去的平均价格是几十块钱一小时 ",供应商再从中抽取一部分利润。

他还透露,自己从事音频采集领域已有十多年,相关技术已广泛应用于微信语音转文字等日常生活场景。

据天眼查 APP,安徽某飞科技公司成立于 2019 年,今年 8 月新增多项软件著作权,涉及数据标注运维系统、采集语音处理 APP、语音采集 APP 等。

27 日下午,记者联系到湖北某职业学院办公室,对方称将由相关部门去联系核实,记者多次拨打该校数智商贸学院电话,均无人接听。

随后,记者联系到湖北省教育厅相关部门,在知悉相关情况后,接线人员称不便接受采访,可由相关学校学生联系该部门反映问题。

有业内人士在接受媒体采访时透露,目前 AI 行业获取用户语音的主要途径包括用户回传音频优化、第三方采购及开源数据爬取,但必须遵循知情自愿原则,并在数据采集与使用中符合相关法规。用户的声纹属于个人敏感信息,在音频处理或训练前,必须明确告知用途并取得用户同意。

律师解读:采集个人信息须获得当事人自愿、明确同意

数字化时代,个人信息保护面临极大挑战。北京康达(郑州)律师事务所姚坤律师表示,为保护公民的信息安全,《中华人民共和国个人信息保护法》明确规定,处理个人信息应当遵循合法、正当、必要和诚信原则,具有明确、合理的目的,收集个人信息应当限于实现处理目的的最小范围。不得通过误导、欺诈、胁迫等方式处理个人信息,不得过度收集个人信息。

一般情况下,搜集个人信息需征得其同意。特定情况下,比如为应对突发公共卫生事件、或公共利益实施新闻报道、舆论监督等,可不经本人同意。但上述情况不属于特定情形,如果校方将录制音频纳入学业考核,属于过度搜集个人信息。学生可依法向校方及学校主管部门反映情况。信息已被搜集或泄露、造成损失的,学生可依法提起民事诉讼,要求停止侵害、赔礼道歉、赔偿损失等。

河南泽槿律师事务所主任付建认为,企业应当以显著方式告知学生采集目的、用途且单独取得学生同意,并且不得通过捆绑等方式变相强制授权,需有合法明确的用途,不得过度采集无关内容,并且需采取加密等严格保护措施。如有关部门未征得学生同意就采集个人生物信息,则违反《个人信息保护法》,学生可向学校所属的教育主管部门、网信部门、数据管理部门等投诉。

二十一世纪教育研究院院长熊丙奇表示,如果让学生录制音频来参与 AI 训练,就必须遵循自愿原则,完全尊重学生的意愿。如果校方通过校企合作的形式变相将音频录制与学分、成绩捆绑,则应当叫停," 这种做法不利于对学生进行 AI 伦理教育,因为 AI 伦理教育很重要的一部分就是教育学生如何去使用 AI,其中就包括要保护学生个人的隐私。"