吃的都是接地气的饭,咱就不AIGC了,沾点边,聊聊工程里的视觉AI部署方案。前几年还是很上得了台面的“云边端”概念,再拿出来聊聊。在智慧城市、智能安防、智能制造等等领域,各种基于视频监控的机器视觉应用出现。如,智慧城管(占道经营、犬只检测、垃圾溢出、违规广告牌、共享单车乱停乱放、道路积水、路面焚烧垃圾…)、智慧校园(越界检测、人员聚集、徘徊检测、烟火检测、打架检测、吸烟检测…)、智能制造(安全帽检测、反光衣检测、通道堵塞、高空作业、仪器仪表识别、开关状态监测…)。为了满足各行各业不同场景的视觉智能需求,“云边端”不同类型的智能分析产品因各自特点活跃在不同解决方案里。不同行业对“云边端”也有不同的定义,此处针对视频监控的智能分析,我们将摄像机侧的智能称为端智能,边缘计算盒子/节点智能分析称为边智能,中心服务器智能分析称为云智能。将智能分析算法集成在摄像机里,即端侧智能。由于功能需求、工程场景等的多样化以及市场需求量的影响,目前的端侧智能仅在少量业务上得到广泛应用,如深度周界、RL识别、车辆识别、人数统计、高空抛物、电瓶车检测等等。此类应用对摄像机的安装位置、角度均有明确的要求,但市场需求广泛。对于指定的功能需求,前端智能部署简单,小规模部署时性价比较高。随着芯片算力的提升,成本的下降,摄像机也可以做到同时进行多种智能分析,但并发多种智能分析的效果往往难以兼顾。比如做RL抓拍和车牌抓拍对摄像机的安装高度、角度往往有着不同要求,进行多目标同时并发检测抓拍必定是折中后的方案。英伟达最新发布的H200 AI芯片的INT8算力高达3958T FLOPS,而摄像机要做类似RL识别、机非人结构化等智能分析,所需算力真可谓“弱水三千,只取一瓢”。基于机非人识别的深度周界甚至连半T算力都不需要(当然,这与不同摄像机制造厂商的算法能力有关)。智能摄像机的算力主要受上游芯片,有时候对于摄像机制造商而言,会出现尴尬的现象,某款芯片做A算法浪费,做B算法又不够用,只有自己尝试慢慢调优,调着调着又有新的芯片选择出现了,这反应在市场上就是部分产品的价格和功能不对等。华为进入安防领域后,提出了“软件定义摄像机”的概念,指出可以根据实际业务需要,对摄像机进行不同算法模型的下发,同时支持第三方算法的适配接入。这是一种很理想的模型,也帮助华为构建了AI合作生态。同样,海康也构建了AI开放平台,推出了AI开放平台摄像机。但是从市场的反应看,安防领域还是更认可摄像机的场景化以及低成本、轻维护。接入普通摄像机的视频/图片流,通过部署在感知设备附近的计算节点进行智能分析,即边缘计算。一般而言,边缘计算节点往往具备多路、多算法并发智能解析能力(常见4路、8路、16路规格),可以满足更多样的业务需求。边缘计算设备,可降低对摄像机的硬件规格要求,可对已建设的非智能摄像机进行智能化改造。边缘计算是典型的分布式方案,轻量化,小快灵,各节点互不影响。边缘计算节点典型的硬件形态类似一台mini工控机,内置高算力GPU芯片,至于算力有多高,倒也没有一个界限(一般8T起步,主要取决于市场需求及上游芯片能力,像海康威视发布的一款高端多目摄像机宣称具备16T算力,目前实属少见)。通过集成POE模块、GPS/BD模块、4G/5G模块等等,边缘计算单元也可以用于解决项目的其他配套需求。此处我们将中心服务器智能分析模式归纳为云边端视觉智能的云部分,可以是中心集中部署的物理机,也可以是虚拟化的云计算资源。中心计算的显著优势是资源管理调度灵活、算法部署升级便捷、大规模部署时更具性价比,同时也可以利用/利旧普通非智能摄像机。但也有显著缺点,需要较大带宽保证视频/图像的实时回传,采用中心集中分析方案时,解析系统自身的可靠性也是需要考虑的问题。
视频智能分析的结果用于实际的业务呈现,还需要大数据、业务平台等对分析结果进行进一步挖掘、归纳、调用、展示。实际上,用于视频监控智能分析的设备多种多样。在网络视频录像机(NVR)上增加算力及算法,则有了智能NVR。在云存储设备上扩展管理、计算能力,则有了集存算管于一身的超融合一体机。 | 项目
| 端
| 边
| 云 |
1
| 算力 | 低
| 较高
| 很高
|
2
| 算法
| 单一
| 较丰富
| 很丰富
|
3 | 成本
| 较高
| 较低
| 低
|
4 | 链路要求
| 低
| 低
| 高
|
5 | 特点
| 方案简单,功能单一
| 分布式部署,可利旧前端,功能较丰富
| 集中部署,调度灵活,可利旧前端,资源利用率高
|
注:链路要求仅指智能分析及其结果回传要求 |
但实际上,因建设规模、功能需求、产品匹配度、建设成本诉求等差异,各种方案的优劣很难直接体现。对于简单的智能功能,比如机非人区域入侵检测,摄像机的能力已经绰绰有余,并可搭配内置或外置的警戒灯、扬声器做业务闭环,此类产品方案已经部署在校园、企业、果园、河道等等大量使用场景。而类似加油站的安全管控,需要算法种类较多(如烟火检测、吸烟检测、
安全帽、卸油流程规范性检测等),单靠摄像机实现可行性较低,单个加油站视频点位又不会太多,采用边缘计算是比较理想的解决方案。对于智慧城市类项目,算法种类需求多(城管类、水利类、安全生产类、应急类等)、视频点位多。采用中心解析,可以避免多部门资源重复建设,通过建设算法仓及视频赋能共享平台,可以充分满足多部门的多样化需求,同时最大限度利用算法、算力资源。
大量CV及安防企业推出了开发算法训练平台,来满足各种细分行业的个性化需求,同时构建其渠道合作生态。所谓的大模型、算法训练、机器视觉,终归是要落地开花,赚钱养家,从阳春白雪到下里巴人,其实并无高低贵贱之分,五花八门,精彩纷呈。叫安防也好,物联感知也好,人工智能也好,卷起来就对了!