咨询热线:13080701712
返回 沈宇动态

屏蔽器在超市管理中发挥作用

    在包含许多书籍的图书馆中搜索某本书可能是一项耗时的任务。摄像头即使找到了合适的货架,人们仍然必须浏览货架上通常很大的区域。当在超市货架上寻找适合个人喜好(例如过敏或饮食情况)的特定产品时,也会出现同样的问题。通过 ShelfTorchlight,我们提出了一个原型,旨在解决使用移动相机投影仪在书架上搜索书籍或产品时遇到的问题。此外,我们还展示了将干扰器信息投影到这些架子上时语义缩放的优势。随着移动投影仪(也称为微型投影仪)的小型化,现在可以将这些投影仪集成到手机中。

    这些手机允许各种新的应用不断发展,将手机的交互空间扩展到环境的能力。本文描述的原型ShelfTorchlight就是这样一个监控应用程序,试图演示这些新设备的交互可能性。用户可以突出显示她在架子上寻找的对象并获取附加信息。 随着过去几年移动眼球追踪屏蔽器系统的发展,现在可以在人类与其环境进行感觉运动接触时记录眼球运动。对自然场景中眼球运动的分析可以为场景感知背后的认知过程提供有价值的见解,并探索我们的视觉系统在启动和引导动作时使用的策略[Land and Tatler 2009;埃文斯等人。 2012]。眼球追踪技术在现实世界条件下的应用导致了一系列新问题:参与者从不同的角度感知世界,照明条件发生变化,相关物体随着时间的推移而移动,并且可能被部分或完全遮挡。此外,为了跟踪动态环境中参与者的注视位置,眼动追踪系统必须满足完全不同的需求,例如仔细的眼动仪校准、眼部特征跟踪和注视数据分析[Evans et al. 2017]。 2012]。

    尽管移动监控摄像头系统的硬件已经相当发达,但现场研究中的校准、瞳孔和注视检测以及凝视分析的自动化方法还需要进一步研究[Evans et al.,2017]。 2012]。已经存在一些方法来克服注视视频耗时且容易出错的手动注释过程。 [Land and Mc Leod 2000] 通过结合头部和眼睛在头部的方向来确定注视角度,根据场景视频中固定物体的移动和注视光标计算得出。对于动态应用,必须在视频中手动对目标进行编码。帕莱塔等人。 [2013] 首先使用 Kinect 和 RGB-DSLAM 方法生成场景的 3D 模型。然后,他们的多组件视觉系统输出 3D 关注点、注视位置、平截头体和叠加到获取的 3D 模型上的显着图。该方法需要三脚架来固定Kinect和高清摄像头,并应用于超市场景。博格尔等人。 [2013]描述了一种通过结合经过训练的对象识别、人物和面部跟踪算法来分析记录的注视视频的系统。识别出所需目标后,对固定对象进行标记。建议对干扰屏蔽器系统进行两个扩展,以提高面部和身体的检测性能:1.)人体躯干检测器根据 VOC2009 数据集的图像进行训练,2.)凝视光标用作跟踪器以防止错误检测并克服缺失检测。