3D机器视觉是一种用于三维测量和检查的技术,它通过传感器获取物体的三维空间信息,并进行处理和分析,以实现物体的识别、检测、跟踪和测量等操作。
3D机器视觉系统通过多模块协同工作实现三维空间信息的获取、处理与应用,其核心结构可分为硬件层与软件层两大板块,具体组成及功能如下:

一、硬件层:三维信息采集与传输
三维传感器(核心输入设备)
结构光传感器:投射特定波长的红外激光(不可见)到物体表面,通过分析光栅或线光源的畸变计算深度信息,精度可达亚毫米级,适用于静态物体检测(如工业零件尺寸测量)。
双目立体视觉传感器:模拟人眼视差原理,利用两个相机从不同角度拍摄物体,通过计算图像对应点间的视差获取三维几何信息,成本低且适合室外环境(如自动驾驶障碍物检测)。
飞行时间(ToF)传感器:测量光脉冲从发射到反射回传感器的时间差,直接生成深度图,实时性强但分辨率较低(通常≤640x480),适用于动态场景(如扫地机器人避障)。
激光三角测量传感器:通过激光线扫描物体表面,利用反射角变化建模三维形状,精度达微米级,适合小范围高精度检测(如PCB板焊接质量检测)。
光学系统(辅助成像)
镜头:由多组透镜(凸透镜、凹透镜)组成,负责将物体反射光线聚焦到传感器上,关键参数包括焦距(控制视场范围)、光圈(调节进光量与景深)和分辨率(匹配传感器像元密度)。
光源:增强目标特征(如纹理、边缘)并抑制环境光干扰,类型包括可见光(白光/单色光)、红外光、紫外光等。照明方式可分为背向照明(高对比度图像)、前向照明(便于安装)、结构光照明(投射编码图案)和频闪光照明(高频率光脉冲同步)。
图像采集设备(数据转换与传输)
工业相机:将光学图像转换为数字信号,按扫描方式分为隔行扫描相机和逐行扫描相机,按输出信号分为模拟相机和数字相机。
图像采集卡:将相机输出的模拟或数字信号转换为一定格式的图像数据流,同时控制相机参数(如触发信号、曝光时间),并传输至计算机处理。
二、软件层:三维信息处理与应用
图像处理与分析软件
预处理模块:对原始图像进行去噪、增强、校正等操作,改善图像质量。
特征提取模块:通过算法提取图像中的关键特征(如边缘、角点、纹理),为三维重建提供基础数据。
三维重建模块:利用结构光、双目视觉或ToF数据,通过三角测量、立体匹配等算法生成点云数据,进一步构建三维模型。
深度学习模块:结合Transformer、NeRF(神经辐射场)等模型,实现点云分割、单目深度估计、3D重建等高级功能,提升自动化程度和准确率。
控制与决策系统
计算机处理器:运行图像处理与分析软件,完成三维重建、目标识别等复杂计算任务。
控制器:根据处理器输出的控制指令,驱动机械臂、AGV(自动导引车)等设备完成抓取、分拣、导航等操作。
三、典型3D机器视觉系统工作流程
数据采集:三维传感器投射结构光或发射光脉冲,同时相机拍摄物体图像。
数据传输:图像采集卡将模拟信号转换为数字信号,并传输至计算机。
三维重建:软件对图像进行预处理、特征提取和三维重建,生成点云或三维模型。
目标识别与定位:通过深度学习算法识别物体类型,并计算其位置和姿态。
控制决策:根据识别结果生成控制指令,驱动执行机构完成相应操作。