随着计算机技术的发展,科学技术的不断进步,图像识别技术的应用日益广泛,例如:在一些公司中,通过人脸识别或指纹识别进行员工考勤打卡;支付宝通过人脸识别的方式进行支付;在交通管理系统中,通过采集汽车牌照来识别车辆是否有违规违章行为;在无人监考的考试中,通过识别考生的肢体动作来判断考生是否有作弊行为;在农业方面的种子识别技术、食品品质检测技术;在医学中的心电图识别技术等。

图像识别已经融入在我们的日常生活中,并随着社会实践中越来越丰富的应用场景,被识别的对象内容也越来越复杂。近年来人工智能、深度学习等科学技术的快速发展,图像识别技术也日趋成熟,并在工业、农业、交通、医学等各个领域发挥着至关重要的作用。

图像识别技术的定义和过程(图像识别一)(1)

一、图像识别技术的发展

图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。

文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制出了许多专用设备。

数字图像处理和识别至今也有近50年历史了,数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。

物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。简言之,图像识别的发展经历就是从简单到复杂的识别过程。

图像识别技术的定义和过程(图像识别一)(2)

二、图像识别问题的方法

在图像识别的问题中,其数据本质是模式空间到类别空间的映射问题。目前主要的识别方法有三种:统计模式识别、结构模式识别、模糊模式识别。统计模式识别是结合了统计概率论的贝叶斯决策系统进行模式识别,首先根据待识别对象的所包含的原始数据信息,从中提取出若干能够反映该类对象某方面性质的相应特征参数,并根据识别的实际需要从中选择一些参数的组合作为一个特征向量,根据统计决策的原理对特征空间进行划分,从而达到识别不同特征对象的目的。

主要的分类方法有判别函数法、非线性映射法、K-近邻分类法、特征分析法等。结构模式识别是根据识别对象的结构特征,将复杂的模式结构先通过分解,划分为多个相对更简单的且更容易区分的子模式,若得到的子模式仍有识别难度,则继续对其进行分解,直到最终得到的子模式具有容易表示且容易被识规的结构为止,通过这些子模式就可以复原原先比较复杂的模式结构,主要用于需要对识别对象的各部分之间的联系进行精确识别时。

图像识别技术的定义和过程(图像识别一)(3)

而模糊识别则是对统计方法和结构方法的有用补充,对模糊事物进行识别和判断,其理论基础是模糊数据。它根据人辨别事物的思维逻辑,吸取人脑的识别特点,将计算机中常用的二值逻辑转向连续逻辑。模糊识别的结果是用被识别对象隶属于某一类别的程度,即用隶属度表示。可简化识别系统的结构,更广泛、深入地模拟人脑的思维过程,从而对客观事物进行更为有效地分类与识别。

识别图像对人类来说是件极容易的事情,但是对机器而言,这也经历了漫长岁月。

在计算机视觉领域,图像识别这几年的发展突飞猛进。例如,在PASCAL VOC物体检测基准测试中,检测器的性能从平均准确率30%飙升到了现在的超过90%。对于图像分类,在极具挑战性的ImageNet数据集上,目前先进算法的表现甚至超过了人类。图像识别技术的高价值应用就发生在你我身边,例如视频监控、自动驾驶和智能医疗等,而这些图像识别最新进展的背后推动力是深度学习。深度学习的成功主要得益于三个方面:大规模数据集的产生、强有力的模型的发展以及可用的大量计算资源。

对于各种各样的图像识别任务,精心设计的深度神经网络已经远远超越了以前那些基于人工设计的图像特征的方法。尽管到目前为止深度学习在图像识别方面已经取得了巨大成功,但在它进一步广泛应用之前,仍然有很多挑战需要我们去面对。与此同时,我们也看到了很多具有未来价值的研究方向。

喜欢本文的话,欢迎关注活在信息时代哦:)

,