机器视觉系统概述

Zou, Ning 发布于 8 小时前 理论学习 6059 字 11 次阅读


概念

一个完整的机器视觉系统通常由以下几部分组成:

  • 图像采集部分相机(核心传感器)、镜头光源。这是将物理世界转换为数字图像的关键环节。
  • 处理与控制部分图像采集卡(部分相机需要)、计算机(工控机)处理软件控制系统与执行器

相机

基本介绍

完整的相机包含三大大部分:镜头、传感器和接口。

镜头

基础概念

镜头是机器视觉系统中至关重要的光学部件,其核心作用是将来自拍摄物体的光线进行汇聚与控制,从而在相机的图像传感器上形成一幅清晰、明亮、准确的光学图像。

一个完整的镜头包含以下几个部分:

  1. 镜头组:光学核心部分,由多个精密的玻璃或光学树脂镜片按特定顺序排列组成。他们的作用是折射和汇聚光线,已形成清晰图像。
  2. 光圈装置:位于镜头内部镜片组之间。由一个可以调节大小的孔状结构(遮片越多,越润滑,成像越好),用于控制进入的光线数量。
  3. 调焦装置:这是镜头上的机械旋转环(对焦环),通过旋转它可以改变内部镜片组与相机传感器之间的相对距离,从而调整焦点,使特定距离的物体在图像上变得清晰。

其计算公式如下:

焦距 f = (物距 WD × 靶面尺寸 TS) / 视野 FOV

  • f:镜头焦距。镜头中心到焦点的距离称为焦点距离,FA(Factory Automation) 镜头中有代表性的镜头为焦点距离为 8 mm /16 mm /25 mm /50 mm等规格的镜头。
  • WD:工作距离(镜头前端到物体的距离)。WD表示焦点对准拍摄对象时,镜头顶端到拍摄对象的距离。
  • TS:相机传感器靶面尺寸(如1/1.8英寸)
  • FOV:所需视野范围。视野指工作距离范围中的拍摄范围。一般来说,拍摄对象和镜头的工作距离越长,则视野越广(视野角)。另外,视野的广度由镜头的焦点距离来决定。镜头的焦距越短,视野越广。相反,焦距越长,则可以放大远处的拍摄对象。
  • 景深:相机能够在平面上呈现的清晰的像的物方空间深度范围,对焦点只有一个,不过在一定纵向空间范围内图像能够清晰呈现,称为景深。

    光圈越小,景深越大。焦距越小,景深越大。WD物距越小,景深越大。传感器尺寸越大,景深越大。
  • 光圈F:焦距与通过光孔径之间的比值,F的大小决定进入传感器的光线的量的多少。F越大,进入光线的量越多,画面越亮;F越小,进入光线的量越少,画面越暗。
  • 畸变:由于镜头的圆弧形导致其镜像边缘的画面发生变化,事实上不存在形状完美的镜头。因此,虽然从理论上来说,直射光通过镜头后会沿着直线传播,而实际上光通过镜头后会向外侧或者内侧歪曲。前者称为「桶形失真」,后者称为「枕形失真」。一个镜失真的参数以百分比表示。
  • 暗场:由于镜头大小与传感器不匹配导致画面边缘出现黑色框,称为暗场。

镜头分类

镜头可分为远心镜头和普通镜头,具体表现如下:

特性远心镜头普通镜头
适用场景高精度测量、尺寸测量项目普通图像采集、精度要求不高且需要较大的视野或预算有限
图像畸变极小或没有畸变可能会有畸变,特别是在图像边缘
价格较高较低
视野大小较小较大
光学精度高精度较低
体积与重量较大且较重较小且较轻
对焦精度要求适中
示例图

在一些项目中,如果想要将视野缩小,但是又没法换镜头了,则是通过加接圈的方式来实现。增加接圈虽然能够在不更换镜头的基础上改变视野或者物距,但是同时也会带来一些负面影响:

  • 加接圈会使镜头的光强衰弱。特别是当接圈较长,线阵相机的情况,接圈损失光的情况会特别明显。
  • 加接圈会使景深变小。因为,景深大小与物距成正比。

相关参数计算公式

接口类型

  • USB相机:具有较高的数据传输速度,适用于中小型工业应用。
  • GigE Vision相机(网口相机):通过千兆以太网传输,适合需要长距离传输和高带宽的应用。
  • Camera Link相机:提供高速数据传输,适合高分辨率和高帧率的应用。
  • CoaXPress相机:提供非常高的数据传输速率,适合高速工业应用。
特性USB 3.0GigE VisionCamera LinkCoaXPress
最大传输速度2.8 Gbps980 Mbps2.8 Gbps6.25 Gbps
最大传输距离3 m100 m10 m130 m
延迟极低
成本很高
描述传输距离有限传输距离远,线缆价格低抗干扰强,配件成本高传输距离远,配件成本高
示意图    

功能类型

黑白相机:仅能捕捉黑白图像,适用于光照条件较为稳定的应用,图像对比度高,处理速度快,成本较低。

彩色相机:能够捕捉彩色图像,适用于对颜色敏感的缺陷检测和质量控制。

传感器

传感器是工业相机的核心部件,其核心作用在于实现光电转换。

传感器类型

传感器曝光方式有两种:全局和卷帘。全局曝光方式是整个芯片的每行像素全部同时进行曝光,每一行像元的曝光开始和结束时间相同。曝光完成后,数据开始逐行读出。

卷帘曝光方式是芯片开始曝光的时候,每行均按照顺序依次开始曝光。第一行曝光结束后,便立即开始读出数据,数据完全读出后,下一行再开始读出数据,如此循环。

除此之外,如何将光线转化为电信号的方式有两种,一种是CCD类型,另外一种是CMOS类型。

  • CCD相机(Charge Coupled Device):拥有较高的光电转换效率,通常用于低光照、高精度的图像采集。
  • CMOS相机(Complementary Metal-Oxide-Semiconductor):相比CCD,CMOS相机具有更低的功耗和更高的帧率,适用于高速动态检测和实时监控。

传感器精度

其精度计算公式如下:

像素精度 = 视野范围 / 相机分辨率(或 = 真实物理尺寸 / 图像像素距离)

  • 视野范围:图像对应的实际物体宽度或高度(mm)。
  • 相机分辨率:对应方向的像素数(pixel)。

上例中,两条直线之间有11个格子,每个格子长宽都为1mm即真实尺寸为11mm,两条直线的像素距离为665个像素点,则像素精度为:

像素精度即图像上一个像素点所代表的真实尺寸,计算方式有以下几种:

由以上公式得到视野长边为30mm,相机分辨率是200万(1624 × 1240)像素的相机精度为0.01847毫米每个像素。远心镜头由于物距跟视野是固定不变的,所以可以通过对应型号远心镜头的理论视野大小跟相机分辨率直接计算出像素精度。

CCD

电荷耦合期间,拥有较高的光电转换效率,成像质量好,常用于对图像质量要求较高,光线较弱的环境。

CMOS

互补金属氧化物半导体,功耗低、集成度高、曝光速度快和成本低等优点,是目前主流的传感器类型。

面阵相机

概述

面阵相机的传感器是一个二维像素阵列。在一次曝光,传感器上所有像素点同时(全局快门)或按特定顺序(卷帘快门)感光,一次性捕获一整幅二维图像。它类似于我们常见的数码相机或手机摄像头。

核心优势

  1. 成像直观:直接获得完整图像,处理和分析逻辑更直接。
  2. 适用于静态或低速场景:非常适合对静止或低速运动物体进行拍照、定位、测量和识别。
  3. 部署相对简单:通常无需物体与相机间的精确连续相对运动,系统集成复杂度较低。
  4. 技术成熟,选择多样:产品种类、接口、分辨率范围非常广泛。

技术原理

传感器类型:CCD(高精度、低照度)与CMOS(低功耗、高帧率)。

曝光方式

全局快门:所有像素同时曝光,拍摄高速运动物体无畸变,适合“飞拍”。

卷帘快门:像素逐行曝光,拍摄高速运动物体可能产生“果冻效应”,成本较低,适合“定拍”。

分辨率:图像宽度和高度上的像素数(如500万像素:2592×2044)。

接口类型:USB 3.0(通用,距离短)、GigE Vision(网口,距离远)、Camera Link(高速)、CoaXPress(超高速远距离)。

触发模式

软触发:由软件命令控制拍照,灵活性高,实时性较低。

硬触发:由外部物理信号(如传感器、PLC)控制拍照,同步精度高,实时性极强。

像素精度计算公式

公式:像素精度 = 视野范围 / 相机分辨率(或 = 真实物理尺寸 / 图像像素距离)

  • 视野范围:图像对应的实际物体宽度或高度(mm)。
  • 相机分辨率:对应方向的像素数(pixel)。

用途:计算图像上一个像素点代表的实际物理尺寸,是评估系统检测能力(最小缺陷、测量精度)的核心指标。

系统选型分辨率估算

公式:所需分辨率 ≈ 视野范围 / 所需像素精度

用途:根据客户精度要求反推需要购买多高分辨率的相机。

工作流程

组装相机镜头 → 连接光源与控制器 → 为相机供电并连接数据线(USB/网线等)→ 安装厂商软件(如海康MVS)→ 配置IP(网口相机)或驱动 → 调整镜头光圈、焦距使图像清晰 → 设置曝光、增益等参数 → 进行软触发或硬触发取图。

线阵相机

概述

线阵相机(Line Scan Camera)的传感器通常只有一行(或几行)像素(例如8192×1)。线阵相机每次曝光只采集一行(或几行)像素数据。要形成一幅二维图像,需要相机与被拍摄物体之间产生连续的相对运动。相机在运动过程中逐行扫描,最终由软件将一行行的图像数据“拼接”成一幅完整的二维图像。

核心优势

  1. 超高分辨率:单行像素可以做到很高(如16K=16384像素),在扫描方向上能实现非常高的细节分辨率。
  2. 适合连续、高速运动物体:专为流水线上连续不断的材料(如布料、薄膜、金属带材)或高速运动的物体设计。
  3. 大视野覆盖:通过扫描,可以检测非常宽(取决于行分辨率)且理论上无限长的物体。
  4. 均匀打光容易:只需保证一条线范围内的光照均匀,比照亮整个面更容易实现。

核心公式

p = 视野宽度 / 相机单行分辨率

  • p:单像素精度(mm/pixel)
  • 视野宽度:线阵相机单行能覆盖的实际宽度(mm)
  • 单行分辨率:如8K相机为8192 pixel

用途:计算横向(扫描行方向)的精度。

理想采集率(核心公式)

f_ideal = v / p

  • f_ideal:理想行频(Hz,即行/秒)
  • v:物体运动速度(mm/s)
  • p:单像素精度(mm/pixel),由公式1计算得出

用途:这是线阵系统最重要的公式。确保图像在运动方向(纵向)的像素精度与横向一致,从而防止图像被拉伸或压缩。

脉冲、行频与分频/倍频关系

基础关系:行频 = 脉冲频率 × 倍频系数 / 分频系数

  • 脉冲频率:编码器每秒发出的脉冲数(脉冲/秒)
  • 倍频系数:用于增加有效触发数(2-36)
  • 分频系数:用于减少有效触发数(1-255)

用途:通过设置采集卡的分频/倍频参数,使相机实际行频匹配或接近计算出的理想采集率。

技术原理

行频:相机每秒能采集的最大行数(如80 kHz),决定了能匹配的物体运动速度上限。

触发模式(核心概念)

行触发最常用模式。每个外部脉冲信号触发相机采集一行。脉冲通常来自与被测物体同步旋转的编码器。这确保了图像拼接比例正确,防止图像拉伸或压缩。

分频/倍频:用于微调行频与脉冲频率的匹配关系,以达成“理想采集率”。

帧触发:一个外部信号触发相机采集一“帧”(由预设行数组成的一幅完整图像),适用于匀速、离散物体的拍摄。

行触发+帧触发:结合两者,用行触发控制行采集保证比例,用帧触发控制单幅图像的开始。

理想采集率计算:为确保图像纵向(运动方向)与横向像素精度一致,防止形变,需计算匹配运动速度的理想行频。

公式:理想行频 (Hz) = 物体运动速度 (mm/s) ÷ 单像素精度 (mm/pixel)

其中:单像素精度 = 视野宽度 (mm) ÷ 相机单行分辨率 (pixel)

工作流程

组装相机镜头(常需拓展接圈)→ 连接采集卡与电脑 → 相机、光源供电 → 连接编码器信号线到采集卡(行触发)→ 安装专用软件(如埃科IKapCViewer)→ 进行信号检查排除干扰 → 配置触发模式(行/帧触发)及参数(分频/倍频)→ 设置曝光、行频 → 运动取图并调整,确保图像不变形。

光源

介绍

在机器视觉系统中,光源是非常关键的组件之一。光源的主要作用是为被测物体提供充足且均匀的光照,以便相机能够获取清晰、准确的图像。光源的种类、颜色、亮度、照射角度和波长都会影响到图像的质量和检测效果。

以下是一些典型的光源形状以及照明方式(LED)

光源类型

面光源

面光的特点是发光比较均匀并且尺寸和形状方便定制,通常情况下作为背景光源使用,使用时产品位于背光和镜头之间,通过工件阻挡光线通过,获取产品的轮廓信息。主要用于产品的尺寸测量,以及一些透明产品的划痕、污点检测。

同轴光源

同轴光源可以看作为没有开孔的开孔面光源,因此可以等效为发光面相同的面光源,发光比较均匀,具备高对比度,在检测镜面、光泽面或希望以光泽差异进行辨别时非常有效。

条形光源

因为性价比高并且光源的照射角度和安装角度自由灵活都可以根据需要调节,所以其一般作为大面积打光的首选光源。如果照明目标是高反光物体,最好加上漫射板,如果是黑色等暗色不反光产品,也可以拆掉漫射板以提高亮度;

环形光源

环形光源的特点是可以360°照射,并且根据需求可以选择不同的照射角度,能够很好的突出物体的三维信息同时能够有效减少阴影的形成,尤其是在检测小物体时。

碗型光源

与环形光源类似,碗形光源通过特定角度和均匀的光照设计,能够减少或避免因光源照射不均匀而产生的阴影,适合要求均匀照明的应用。

触发器

概念

触发器的作用是触发相机对作业区域进行拍照,触发器有两种触发类型,分为软触发和硬触发。软触发是通过软件进行的触发,硬触发时PLC或伺服电机发送的脉冲信号进行的触发。简答来说,触发器是启动相机进行图像采集的控制信号或机制。

硬触发

定义

触发器由外部硬件(光电传感器、PLC、伺服电机)产生的电信号来控制相机采集。

工作原理

当外部事件发生时(如物体遮挡光电传感器),传感器产生一个脉冲电信号。这个信号通过线缆连接到相机的触发输入接口,相机在接收到这个信号的上升沿或下降沿时,立即执行一次曝光和图像采集。

软触发

定义

由计算机上的软件发送一条命令来启动相机采集。

工作原理

通过软件或程序控制相机拍照,或在软件判断满足某一个条件的时候,通过API等接口向相机发送采集指令。

采集卡

采集卡(Frame Grabber / Image Acquisition Card)是机器视觉系统中,连接工业相机与计算机(工控机)的关键硬件接口板卡。它充当相机与计算机之间的“桥梁”和“数据处理器”。

采集卡的主要作用

高速图像数据采集与传输:这是最基本的功能。它将相机传感器输出的高速、海量图像数据(通常是未经压缩的原始数据)稳定、高效地传输到计算机内存中,供后续软件处理。这对于线阵相机连续扫描的场景尤为重要。

触发信号的处理与同步(文档核心内容):

  • 接收编码器脉冲:文档中多次提到,线阵相机需要通过编码器获取物体的运动脉冲信号来触发每一行的采集。采集卡提供了专门的接口(如 ShaftEncoder1_A+/A-)来接收这些脉冲。
  • 实现行触发与帧触发:采集卡根据接收到的脉冲信号,精确控制相机何时开始采集一行(行触发)或一帧(帧触发)图像。这是确保图像与物体运动严格同步、防止图像拉伸或压缩的关键。
  • 执行分频与倍频:采集卡可以对接收到的编码器脉冲进行分频(如每2个脉冲取1个)或倍频(如每1个脉冲生成2个),从而灵活调整相机的实际采集行频(行频 = 脉冲频率 × 倍频系数 / 分频系数),以匹配计算出的理想采集率,保证图像比例正确。

提供稳定电源与信号隔离:为相机提供稳定的工作电源,并通过电气隔离减少来自工业现场的电磁干扰,保证图像质量和系统稳定性。

硬件级预处理:部分高端采集卡具备FPGA,可在数据进入计算机前进行简单的图像预处理(如滤波、格式转换),减轻CPU负担。

采集卡的主要类型

采集卡的类型主要根据其支持的相机接口标准功能定位来划分。文档中提到的埃科线阵相机配套采集卡属于特定类型。

按相机接口标准分类(与文档4.2.1节“接口标准分类”对应):

  1. Camera Link 采集卡:专为Camera Link接口相机设计,提供极高的数据传输带宽,适用于高速、高分辨率的面阵或线阵相机。
  2. CoaXPress 采集卡:专为CoaXPress接口相机设计,同样支持超高速率,且传输距离远,布线简单。
  3. GigE Vision 采集卡:通常指高性能的千兆/万兆以太网卡。虽然很多GigE相机可直接通过电脑网口连接,但在多相机、高带宽或需要精确同步的应用中,专用的PoE+或带有FPGA的智能网卡也被视为一种“采集卡”。
  4. USB3 Vision 采集卡:通常指带有多个控制器或提供额外供电/触发功能的USB 3.0扩展卡,用于优化多USB相机系统的稳定性。

按功能与形态分类:

  1. 独立式采集卡:最常见的形态,通过PCIe插槽安装在计算机内。
  2. 外置式采集盒:通过雷电(Thunderbolt)或USB接口连接,用于笔记本电脑或无法安装内置卡的设备。
  3. 智能相机/嵌入式视觉系统:采集与处理功能已集成在相机内部,通常无需单独的采集卡。

综合事项

选型核心考量

  • 精度要求:根据最小缺陷或最小公差,计算所需像素精度,反推所需相机分辨率。
  • 运动速度与节拍:确定是“定拍”还是“飞拍”,选择相应的曝光方式(全局/卷帘)并计算所需帧率(面阵)或行频(线阵)。
  • 视野大小:结合工作距离(WD),确定镜头焦距。
  • 检测内容:颜色识别需彩色相机;高反光、精密测量考虑远心镜头和特殊光源(如同轴光、穹顶光)。
  • 光源选择:选用合适的光源,确保相机能够清晰的区分背景与检测物体,能够准确的拍摄出缺陷。

安装与调试:

所有的系统部件包括:相机,镜头,光源控制器,光源,工控机。

面阵

重点确保镜头对焦清晰,光圈调整景深,光源均匀无干扰。

线阵

编码器接线是关键:必须正确连接A+/A-,B+/B-相位信号,并做好屏蔽,防止干扰。“理想采集率”是生命线:务必根据物体速度、视野和分辨率计算并设置正确的行频(通过分频/倍频),这是获得比例正确、无拉伸压缩图像的前提。先检查信号:配置行触发前,务必在软件中检查编码器脉冲信号是否稳定、无杂波。

图像质量优化:

面阵

通过调整曝光时间、增益、白平衡来优化。

线阵

除曝光和增益外,平场校正至关重要,用于消除传感器各像元响应差异和镜头边缘衰减带来的亮度不均。校正时需使用均匀白纸并在虚焦或匀速运动状态下进行。

欢迎来到XiaoZou123,这里是一个电脑极客、数码爱好者网站。我平时喜欢关注数码新闻,研究计算机技术。如果你看我头像觉得我是二次元,那我其实还算不上!
最后更新于 2026-04-06