裴同学 | 语音标注员

将“牛德华”变成“刘德华”

裴同学是一名语音标注员,这是一个随着智能语音交互设备的普及而新出现的职业。他的主要工作就是将智能语音交互设备无法识别的字、词、句子进行标注,然后“翻译”过来,再发送回去以便智能设备进行学习。

那么操作起来是什么感觉呢?裴同学这样说道:“比如一个有口音的人对智能音箱或交互设备说‘播放一首牛德华的歌’,智能设备需要分析出用户真正的意思是想要听一首刘德华的歌。我的工作就是将设备收集到的语音‘牛德华’标注成‘刘德华’,再发回给智能设备研发单位,供智能设备进行学习,使智能设备下次听到‘牛德华’时,能准确地转化为‘刘德华’”。

牛德华是不是富二代(将牛德华变成)(1)

因此,裴同学需要每天在群里领取包含各种词、句的数据包,然后进行标注。他每次在群里领取一个包含150条语音的数据包,完成对数据包内语音的标注后再领取下一个数据包。

据裴同学说,这项工作要求熟练使用office等办公软件,因为现在是实习阶段,每标注1个小时的有效时长语音,能得到100元的报酬,一个月可以赚到3000元到3500元。

马同学 | 图像标注员

教人工智能认识新世界

今年24岁的马同学,也是一名数据标注师,但她标注的内容不是语音而是图片,偶尔也会标注一些视频影像。她与裴同学不同的是,她不是通过群来领取任务,而是通过众包平台,“众包平台是开放式的,只要注册并通过在线学习和考核,谁都可以在平台上领取任务。”虽然,马同学和裴同学标注的数据内容和领取任务的方式不同,但他们都是为那个从未见过的AI在打工。

图片标注是根据任务要求,在图片上找到需要标注的物品、部位进行框选或标注记号点。比如,一张人脸图片,有的任务只要求将人脸部进行框选,让AI知道被标注的部分是一张人脸。有的任务却要求在人脸图片上标注几十甚至上百个记号点,以此让AI了解哪里是人的眉毛,哪里是眉梢,哪里是眼睛,哪里是内眼角,哪里是外眼角……”马同学说。

牛德华是不是富二代(将牛德华变成)(2)

虽然马同学从事数据标注的时间还不长,但现在她已经是一名成熟的数据标注员了,每天都能标注2000到3000张图片。

在问到实习图片标注师能赚多少钱时,马同学说,“每张图片根据任务要求的不同,获取的报酬也不同。只是简单框选人脸这样的任务,标注一张图片需要两三秒钟。如果是标注几十个甚至上百个记号点这样的任务,需要的时间稍微长一些,但报酬也会相应提高,平均每张图片在0.3元至0.4元之间。我现在平均每个月能达到3000元左右的收入,对于我这样一个实习生来说,已经是很高的工资了。

以下是大学君和两位数据标注员之间的对话:

从事数据标注需要每天对着电脑,你们不会觉得枯燥吗?

数据标注为我打开了更大的世界,因为经常接触不同的项目,每个项目涉及的领域也不同,会经常带来新鲜感。更重要的是,这会是一个持续发展的行业。

我觉得数据标注师这份‘科幻’的职业实实在在地改变着现实生活。自动驾驶、人脸支付、智慧医疗、智能家居……人工智能正在给生活带来越来越多的便利,这背后都有着数据标注师的功劳,所以,我觉得很骄傲!

看了上面两位数据标注师的介绍,你是不是对数据标注工作有了更深一层的认识呢?如果你想从事数据标注工作,那就随时关注58同城大学未来产业学院的动态吧!

,