机器视觉:深度学习解决零售或教育方面的问题
扫描二维码
随时随地手机看文章
在过去的五年或十年里,随着深度学习的出现,我们对这个问题有了不同的方法。它更多的是数据驱动,而不是代码或算法设计驱动。
深度学习的想法是,我们有一种算法,它是一种学习机器。因此,我们拥有这种通用的学习结构,而不是在算法中规定步骤来解决特定问题。我们所做的是,我们展示了很多例子。这是一个戴着面具的人;这是一个没有面具的人。这里有10,000个不同情况和方向的戴着口罩的人;这里有 10,000 人没有戴口罩。
这些算法的非凡之处在于它们能够学习。这有点像展示和讲述之间的区别。如果您考虑教孩子系鞋带。如果你试图一步一步地描述这个过程,你永远不会成功。不可能。所以没有人这样做。我们发现那行不通。如果你想教孩子如何系鞋带或做一些类似的任务,你就是在示范。甚至可能更进一步,引导他们完成这些步骤;你握着他们的手给他们看:你把这个放在这个下面,把这个绕在这里。令人惊奇的是:孩子可以学习!
事实证明,这些深度学习算法在通过示例而不是通过详细的处方来学习的能力方面同样令人惊叹。很难夸大这种范式转变的重要性,它使我们能够解决我们想要从图像或视频中提取信息的各种现实世界问题,而这些问题并不是像我们所在的生产线那样控制良好、一致的环境在某些预定位置寻找一定数量的螺栓。
所以现在我们其实可以很好的解决街上走过的人戴不戴口罩这样的问题?
我最近遇到的另一个非常酷的应用程序,他们称之为 Night Nurse。它来自一家名为 Kepler Vision 的荷兰初创公司。它用于老年护理设施,例如,如果一位老年患者晚上从床上掉下来,系统所做的是,它使用安装在天花板上的摄像头,它不仅分析单个图像帧,而且分析序列框架,以了解人的行为并能够区分正常行为(例如有人起身去洗手间)和异常或危险行为(例如人从床上掉下来)。因此,护士不必在晚上经常检查病人并可能打扰他们的睡眠,系统可以持续监控并在病人有危险时立即提醒护士。
这是一种混乱的现实世界问题。我说“凌乱”是因为你如何用文字或数字术语来描述一个人比方说起床并移动到附近的椅子上并坐在那把椅子上与从床上掉下来之间的区别。当你看到它时你就知道它,但是用精确的方式用语言描述它是非常困难的。因此,这是深度学习的出现使我们能够有效解决传统手工算法技术无法解决的各种现实问题的一个例子。
这是过去五年左右发生的一个巨大变化,这种转变是从 1960 年代计算机视觉方法的手工算法到几年前的转变。现在,这种数据驱动的、基于机器学习的方法。这是发生变化并创造了很多机会和兴奋的重大事件之一。
我认为当技术是新技术或变化迅速时,找出应用它的地方总是一个挑战。它真正有意义的地方在哪里?真正能增值在哪里?就深度神经网络而言,有很多关于它的炒作和兴奋。人们渴望使用它。但是很容易选择错误的问题,选择一个实际上没有必要的问题,其中 DNN 是不必要的,经典技术工作正常,所以你只是在浪费时间和金钱。或者选择当前技术无法解决且无法解决的问题。
所以我认为真正归结为,人们需要学习。他们需要学习深度神经网络;他们的能力;他们不能做什么;他们前进的轨迹是怎样的,他们的演变是怎样的;以及如何识别具有适当难度的适当问题。既不太容易(也可以用经典技术解决,而且可能已经解决)也不太难(仍然是一个研究问题,商业部署技术并不能真正解决这个问题)。
这不是我认为可以在文档中总结的内容。我认为这确实需要深入了解技术的当前状态,然后查看您的应用程序领域。老年护理或家庭安全或制造或车辆交通优化。无论您的应用领域是什么。一旦你了解了技术的状态,然后将其映射到最佳问题,在那里它可以增加最大的价值并且实施起来也很实用。
所以这就是我认为意识教育如此重要的地方。电子行业各个领域的人都需要了解这项技术。不一定要掌握它的每一个细节,而是要了解它能做什么,能干什么。
做到这一点的另一个好方法是看看其他人在做什么。其他公司和产品开发商在哪些方面成功使用了该技术?然后将其映射到,如果他们能够解决医疗保健方面的问题,我想我可以解决零售或教育方面的问题。