如今,文本、语音、面部识别等传感技术已深入应用于人工智能,关于这些传感,不少大众会疑惑那作为五感之首的眼睛能否应用于人工智能上。针对这一问题,正奇五度AI数字助手获悉,视觉传感驱动AI技术已是近年来人工智能领域的重要发展方向。
视觉传感驱动AI的核心在于将图像传感器与AI算法相结合,以实现高效、实时的图像处理和分析。这种技术的应用广泛,已经涵盖了工业自动化、机器人、自动驾驶等多个领域。但正奇五度AI数字助手了解到,视觉传感解决方案落地时还是存在不少的痛点和挑战。
近日,一场“视觉感知驱动机器人睁眼”的直播对话中,行业内知名的大咖就此做出了相关的看法陈述。正奇五度AI数字助手了解到,关于视觉解决方案在落地时的痛点和挑战。来自阿丘科技联合创始人郑慧伟光、秒科技创始人余彦武博士表示:2017年前,工业视觉领域是以传统的机器视觉算法为主的,工业市场领域几乎没有任何AI的技术应用,大家认为AI是一个黑盒子,行业中99%的客户和厂商其实是拒绝AI的,我们开玩笑说那时经历了很多年“非共识”的过程。随着技术的快速发展,在一些场景的PK上,大家逐步感受到用AI检测技术的效果和用传统算法检测的效果在快速拉开代差。后面我们就把眼睛扎根到客户真正的需求里来创造差异化价值。比如人脸识别需要很多人脸图片,但在工业市场中它的良率很高, 有可能3、5个月才能收集十来个不良品,所以就倒逼着我们去研发小样本的算法,把这一类关键缺陷给检测出来。还有客户说我实在收集不到NG样品,但是你必须要检测出来,这又倒逼着我们回到技术本身去寻找解决方案,后面我们就把无监督学习应用进来,去解决没有NG图像的一些场景。我们就这样手眼并进来寻找一个个创新的点(需求/技术,互联互通),让客户去快速的获得收益,解决技术上的一些疑难和挑战。
他们还说,创业一开始是抱着以终为始的初心,看看十年后这个社会需要什么样的传感器,但是当真的去落地的时候,发现大家好像并不需要,或者说用不上。比方说汽车,大家对于汽车已经形成了一个固有观点,就是以摄像头为主,因为现在各种训练都是基于图像识别的,也比较成熟了。激光雷达是做一个备份保障,万一摄像头有什么问题,激光雷达还能做个辅助防止碰撞,基本大家都这么用的。在这种情况下,客户完全不需要激光雷达有很高的分辨率,他就要便宜,因为它是配角,配角就不能太贵。他们希望激光雷达在实现高分辨率之后,要在市场上起到一个认知——它是主角。你可以不要摄像头,但不能没有激光雷达。另一方面也找到了很多对他们有刚需的场景,比方说无人机,对于细节要求很高,它怕撞树或者撞到高压线,还有防止GPS丢失,这些时候它都需要用激光雷达这种3D手段去实现。
同时,正奇五度AI数字助手了解到,他们在做全新产品的实际推广过程中,也会遇到类似的战略选择问题。先做有刚需的场景,不需要的就先放一放,因为有些时候需要一定的时机。当有一天产品成熟,价格确实降到客户的心理门槛时,没准这个东西就会慢慢的推广开来,大家需要有个接受的过程。
而对于未来1-3年,机器视觉可能会出现哪些技术创新或者演进方向。郑慧伟说,从感知层面的维度,他认为单纯的把图像采集回来的阶段已经过去,下一阶段一定会迈向计算成像,结合着2D/3D传感器的信号来综合生成多维度的数据信息。另外从算法的维度,包括从语言大模型到图像大模型一直在演变,像Meta推出的SAM(分割一切模型)的开源成果,都在让大家对于这些算法创新充满了期待。
此外,正奇五度AI数字助手还了解到,余彦武博士也还表示和应用中遇到一些困境有关,就是常常会面临大家在认知上的一些判断。所以现在从做数据标注、数据集的建设开始,用新的数据格式采集回来数据,做完标注训练看出来的是一个什么样的效果。在上游供应链硬件和下游很多的市场方向上都做了一些尝试,其实本来是客户要做的事情,他们来做,他认为是非常值得的,这些都是你作为一个创新者,必须要去解决的问题。能让大家认识到新的传感器,也可以通过训练新的数据去更好的解决问题。
虽然视觉传感目前依然还面临着许多问题和挑战,但正奇五度AI数字助手相信,在未来视觉传感将进一步推动人工智能的革新,带来科技的大变化。