提及数据标注,大多数人第一反应就是图像标注。图像标注在人工智能与各行各业的应用简相结合的研究过程中扮演着重要的角色,通过对路况的图片中的汽车和行人进行筛选分类标框等,可以提高安防摄像头以及无人驾驶的识别能力

图像标注的目的(这10种常见的图像标注类型)(1)

如图所示,通过对医疗影像中的骨骼进行描点,特别是对病理切片进行标注分析,能够帮助AI提前预测各种疾病

图像标注的目的(这10种常见的图像标注类型)(2)

什么是图像数据标注

图像标注是一个将标签添加到图像上的过程。其目标范围既可以是在整个图像上仅使用一个标签,也可以是在某个图像内的各组像素中配上多个标签

一个简单的例子是∶我们在向幼儿提供各种动物的电子图像时,可以通过将正确的动物名称标记到每个图像上,以方便幼儿在点触图像时能够获悉其名称

图像标注的目的(这10种常见的图像标注类型)(3)

当然,具体标注的方法取决于实际项目所使用到的图像标注类型。有时候,我们可以将那些通过地图APP采集的地面实况数据(ground truth data),作为带标注的图像,馈入计算机视觉的对应算法。通过反复训练,模型便可以将已标注的实体与那些未标注的图像区分开来

图像数据标注的类型

每个数据科学任务都需要数据。具体地说,是输入系统的干净易懂的数据

图像标注的目的(这10种常见的图像标注类型)(4)

图像标注在计算机视觉中起着至关重要的作用。图像标的目标是为和任务相关的、特定于任务的标签。这可能包括基于文本的标签(类),绘制在图像上的标签(即边框),甚至是像素级的标签。下来我们一起看看常用到的一些图像标注类型

01

拉框

用2D、3D、多边形框等标注出图像中的制定目标对象

02

语义分割

标记图像中存在的内容及位置,根据属性进行像素级分割,支持单属性、多级属性

03

实例分割

实例分割是图像分割的一种子类型,它在像素级别上标识图像中每个物体的每个实例。实例分割和语义分割是图像分割的两种粒度级别之一

图像标注的目的(这10种常见的图像标注类型)(5)

04

目标检测

支持人物ID追踪、视频轨迹追踪,截取视频关键帧,对连续画面中出现的同一目标标注相同的id,从而记录目标轨迹的变化

05

图像分类

图像分类不同于目标检测。目标检测的目的是识别和定位目标,而图像分类的目的是目标属性,对图像划分到不同分类

这个用例的一个常见示例是对猫和狗的图片进行分类。标注者必须为一只狗的图像分配一个类标签"dog",对猫的图像分配类标签"cat"

图像标注的目的(这10种常见的图像标注类型)(6)

06

关键点

在许多计算机视觉应用中,神经网络常常需要识别输入图像中重要的感兴趣的点。我们把这些点称为地标或关键点。例如:可对人脸关键点、人体骨骼关键点、人脸五官等进行关键点标注

图像标注的目的(这10种常见的图像标注类型)(7)

图像标注的目的(这10种常见的图像标注类型)(8)

07

线段标注

支持贝塞尔曲线和普通线段标注,支持对车道线进行贝塞尔曲线标注,使用线段将图像目标的边缘、轮廓用线段标注

图像标注的目的(这10种常见的图像标注类型)(9)

08

ocr转写

OCR转写是对图像中的文字内容进行标记与转写,帮助训练和完善图片与文本识别模型

09

点云标注

点云是三维数据的一种重要表达方式,通过激光雷达等传感器,能够采集到各类障碍物以及其位置坐标,而标注员则需要将这些密集的点云分类,并标注上不同属性,常应用于自动驾驶领域

图像标注的目的(这10种常见的图像标注类型)(10)

10

属性判断

属性判别是指通过人工或机器配合的方式,识别出图像中的目标物体,并将其标注上对应属性

图像数据标注的应用

01

医学

多边形可用于在医用x射线中标记器官,以便将它们输入深度学习模型,以训练x 射线中的畸形或缺陷,这是图像标注最重要的应用之一。

在医疗行业应用较多的则是影像标注,影像标注与车辆的拉框标注所采用的方法比较类似,但是处理起来会涉及较为严谨的专业医学知识,再加之对标注准确性的要求极高,如果标注错误会产生非常严重的医疗事故,这就是要求只能一些医学领域的专业人才来做,比如在职医生和医学院研究生。而面对一些比较复杂的医疗影像,甚至一些在三甲医院实习的研究生都无法完成

图像标注的目的(这10种常见的图像标注类型)(11)

02

零售

2D边框可以用于标注产品的图像,然后机器学习算法可以使用这些图像来预测成本和其他属性。图像分类在这方面也有帮助

图像标注的目的(这10种常见的图像标注类型)(12)

03

自动驾驶汽车

这是另一个重要的领域,图像标注可以应用。利用语义分割对图像中的每个像素进行标记,使车辆能够感知到道路上的障碍物。这一领域的研究仍在进行中

图像标注的目的(这10种常见的图像标注类型)(13)

04

情绪检测

这是里程碑,可以用来检测一个人的情绪(高兴,悲伤,或自然)。这可以应用于评估受试者对特定内容的情绪反应

05

制造行业

线和样条可用于标注工厂的图像线跟随机器人工作。这可以帮助自动化生产过程,人力劳动可以最小化

写在最后的话

如今,世界正在经历一场影响范围甚广的技术革命,信息技术(IT)正快速决定着一切事物的发展进度和计划。

机器学习和人工智能依靠计算算法复制人类的智能行为,包括自动语音识别、增强现实和神经网络机器翻译。这些不同领域技术创新的成功问世促进了人们对计算机可视化和解释图像的深入研究。通过使用不同的软件,计算机视觉努力激活机器的双眼去观察和解释图像。

希望这篇文章对你有所帮助!

,