OpenCV 5正式发布:搭载全新DNN引擎,原生支持大模型

近日,OpenCV团队本周正式发布了OpenCV 5。作为计算机视觉领域最具影响力的开源库之一,OpenCV二十多年来一直是计算机视觉研究、机器人技术、嵌入式视觉、AI应用、工业检测、AR/VR、医学成像以及无数生产系统的基础。目前,该库在GitHub上已拥有超过86000颗stars,每日安装量超过一百万次,并汇集了世界上最庞大的计算机视觉算法集合之一。

OpenCV 5正式发布:搭载全新DNN引擎,原生支持大模型

OpenCV 5在此基础之上,对该库进行了重大的现代化改造。新版带来了全新的DNN引擎、更强大的ONNX支持、硬件加速方面的改进、更好的Python集成、新的数据类型、扩展的3D视觉功能、改进的文档,以及面向未来更清晰的架构。其中,ONNX算子覆盖率从4.x时期不到23%大幅提升至超过80%,显著增强了对各类AI模型的兼容能力。

在具体更新方面,OpenCV 5实现了更好的语言支持,包括现代化的Python接口、更新的语言绑定,以及使用命名参数而非靠猜测来确定参数顺序,大幅降低了开发者的使用门槛。同时,新版拥有更快、更小巧的核心:代码更紧凑、弃用了传统的C API,并提供了更精简的构建方式。

硬件加速方面,OpenCV 5引入了更清晰的硬件加速层,使硬件供应商能够直接插入优化后的内核,而无需陷入杂乱的#ifdef条件编译之中。API设计也更加简洁,提供了规范的0D/1D张量、原生的FP16/BF16支持,以及真正的日志记录机制。

最为引人注目的是下一代DNN引擎的引入。该引擎采用基于图的架构,支持算子融合、广泛的ONNX支持,并原生支持Transformer模型、视觉语言模型及大型语言模型。此外,OpenCV 5还带来了更好的3D视觉功能,包括ChArUco标定板、多相机标定以及可视化功能,文档系统也进行了全面现代化改造,更加易于导航和阅读。

业内人士认为,OpenCV 5的发布标志着这一经典计算机视觉库正式迈向AI原生时代。通过原生支持大模型和深度神经网络,OpenCV 5有望进一步巩固其在计算机视觉领域的基石地位,并为机器人、自动驾驶、智能检测等前沿应用提供更强大的基础设施支撑。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/754488.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论