当前位置: 澳门新豪天地3559 > 互联网 > 正文

【www.3559.com】博云视觉副高管冯栋:智慧城市怎

时间:2019-07-02 02:39来源:互联网
近几年来,城市大脑概念可谓如火如荼。 5月13日,上海市科学技术委员会发布2019年度人工智能领域项目指南,包括人工智能在内关键共性技术赋能交通领域、卫生健康领域及社区等五

www.3559.com 1

近几年来,城市大脑概念可谓如火如荼。

5月13日,上海市科学技术委员会发布2019年度人工智能领域项目指南,包括人工智能在内关键共性技术赋能交通领域、卫生健康领域及社区等五大领域。自深度学习算法出现后,AI正以雷霆万钧之势从学术界进入产业界,成为了传统行业变革求新、提益的利器。其中,安防俨然成为人工智能落脚点之一。

在构建智慧城市的大背景下,随着人工智能技术赋能行业兴起,“视频监控 AI”成为越来越多的企业所切入的领域。根据前瞻产业研究院《2019年中国视频监控产业全景图谱》中的数据显示,视频监控市场近5年来一直保持着18%左右的稳定增长。但是,大多数摄像头并不智能。在2019全球智博会的论坛上,博云视觉创始人兼CEO陈杰表示,“自闭”(无差别视频汇聚、算力带宽瓶颈明显、视频内容难注意)和“弱视”(摄像头功能单一、感知能力参差不齐、丢失部分信息)是当前视频监控两大突出问题,对这些问题的投入和关注已经成为不可回避的事实。

相比于前两年大家对这一概念比较陌生,如今相信大部分读者应该都已经知道,所谓城市大脑的基本内涵,是指用公路上的大量摄像头,来识别车流、车牌和车辆,以及一些路段广场上机遇摄像头执行人脸识别和人流判断。

AI摄像头尚未进化完备

让摄像头自己具备识别能力是如今智慧城市的主要解决方案,但传统的摄像头不便拆卸,新安装的具备识别能力的摄像头,如人脸识别摄像头、车辆识别摄像头等又各自为政,无法做到汇融并和底层打通,难以进行完整的交通场景分析。如果让包含识别、推理等运算的复杂AI能力在摄像头端运行,又会面临算力不足的问题,且在每个摄像头中加载大量的AI算力和专用硬件模组,将会是一笔巨额成本。

这些“城市之眼”收集的数据,一方面可以帮助提升城市安防的智能化水准,比如预判人群拥堵、识别交通事故与可疑车辆等等;另一方面,城市大脑的作用主要体现在和交通灯、高架桥准入闸口的互动上。通过对车辆数据的识别和判断,进而用城市大脑进行交通指挥,被广泛相信是治理城市拥堵的有效方式。

AI让安防的海量数据发挥出了价值,摄像头不仅可以识别车牌车辆,预测车流,还能够执行人脸识别、判断人流。那么,AI摄像头已经基本发展完备了吗?

基于此,中国工程院院士兼中国计算机学会理事长高文提出的“数字视网膜”理念广为产学各界重视。“数字视网膜”不仅能看,还能够感知,是一种非常理想的智慧城市摄像头体系。如今,“数字视网膜”已从理论逐渐走向现实,包括博云视觉在内,已有一批公司成为积极的践行者。

这些技术逻辑近两年被反复讨论,加之科技巨头的不断加注与宣传,很可能让大众觉得城市大脑已经非常完善,可以真正承担一座城市的“AI交通指挥官”。然而事实上并非如此,从一种产业构思到实际落地,城市大脑,或者称作智慧城市系统,还面临着非常多物理世界中客观存在的困难与障碍。尤其是城市摄像头体系本身,与后加入的AI大脑,二者其实存在着无法忽视的“代沟”。

事实并非如此。AI在摄像头乃至智慧城市系统还面临许多困难与障碍。比如传统摄像头清晰度欠佳,导致AI难以识别。即便摄像头足够高清,但终端设备若缺乏特征提取功能,那么云端必须完成从特征提取到识别再到反馈的全部过程,这将会牺牲一定的识别精度、速度与准确度。

推动视觉特征编码标准化进程,是初心,也是使命

这个问题应该如何解决,近两年也有相当多的学术讨论。比如中国工程院院士、中国计算机学会理事长,北京大学教授、博导高文提出的“数字视网膜”理念,就广为产学各界重视。在这一问题中构成了一种代表性的解题方案。

www.3559.com 2

承载数字视网膜的摄像头不仅能够做好编码,还能为后面的技术提取出需要的信息。其中,视频特征的紧凑表达是数字视网膜的核心技术之一。特征组织是整个视频分析中最为关键的一个环节,如何快速、准确且在占用码流更少的情况下将特征组织起来是需要解决的重要问题。国际标准MPEG CDVS(Compact Deor for Visual Search,面向视觉搜索的紧缩视觉特征描述子)为此提供了答案。

www.3559.com 3

AI监控尚未“进化”完备 两大解决方案被看好

2015年12月,MPEG CDVS国际标准正式颁布,在这项标准中,北京大学通过与美国斯坦福大学、华为、三星、意法半导体、意大利电信等多家公司合作竞争,最终对这项标准的专利贡献达到了60%以上,MPEG CDVS国际标准也成为了多媒体领域内由我国主导制定的首项ISO国际标准。而在此过程中,陈杰自2010年还在北京大学读博的时候,就已经开始参与这项标准的制定。

我们似乎可以从数字视网膜应运而生的现实问题,以及其发展思路中,共同探讨这样两个问题:城市的智能,距离我们究竟有多远?而如果希望拉进这个距离,目前有哪些急需开展的工作?

有人提出使摄像头搭载识别能力。这虽然可以解决云端运算量过大的问题,但由于已部署的摄像头不便拆卸,重复建设问题就不可避免。另外,若数据无法互相打通,后端AI仍旧无法给出真正智能的结果与建议,因此,想要让AI全局化理解城市,各摄像头也必须进行全局汇总。

博云视觉的定位是一家提供标准化的视觉人工智能技术的科技公司,推进视觉特征编码标准化进程始终贯穿于博云视觉成立前后。在MPEG CDVS颁布后,博云视觉又积极投入到下一代国际标准MPEG CDVA(Compact Deors for Video Analysis,面向视频分析的紧凑视觉描述子)中。

从这个角度思考,我们或许会发现数字视网膜既是一种学术创新,也是一个新的产业机遇。

解决之道有哪些?

2017年7月,人工智能产业技术创新战略联盟成立,博云视觉成为首批联盟理事单位成员;同年8月,在大连第62次AVS工作组会上,博云视觉联合北京大学、阿里巴巴提交了“视觉特征编码”标准需求提案;同年10月,在第119次ISO/IEC JTC MPEG国际标准会议上,CDVA标准进入工作组草案阶段。从CDVS到CDVA,博云视觉既是参与者,也是见证者。

“眼疾”未愈,城市大脑依旧幼稚

1、建立视频AI综合平台

在2019全球智博会论坛结束后,博云视觉副总裁冯栋接受了亿欧的专访。在被问及为何会做这种选择时,冯栋表示,这不是选择,而是使命。以前的国际标准基本都是由国外主导,直到CDVS标准颁布,中国第一次在多媒体领域主导了ISO国际标准。未来,中国还要贡献更多的力量。与此同时,带着标准去探索人工智能技术产业化落地的方向,也是AI企业当下的重要任务。

城市大脑概念,在现实执行中面临的第一个问题,也可能是最根源的问题之一,就是原本并不用于智能计算的城市摄像头,如何与AI带来的识别,甚至智能分析能力连接在一起?

随着资本快速涌入、公安和交通领域的应用遍地开花,其他领域的需求不断增长,视频AI综合平台已具雏形。视频AI平台能够使算法AI单体能力规模化,将AI智能推送至云、边、端,并感知动态调配算法AI资源。

从理论到实践,“数字视网膜”为城市大脑赋予真正的“智慧”

这个问题涉及一个基本矛盾,就是智能发生在哪里。

目前针对人脸识别、车辆识别等成熟算法,可以通过平台以简单的SDK方式快速集成,这种模式下,平台能提供针对算法服务的调度,同时算法服务能开放API服务出去;而顾及AI领域创新速度快的状况,一些新算法尚在探索期时,平台也能够提供工程化支撑,通过服务集成的方式提供支持。这或许对解决困扰安防行业多年的多源数据互联互通问题有所助益。

针对城市大脑的视觉系统架构中存在的数据储存及数据分析方面的瓶颈,博云视觉基于数字视网膜技术,赋予端侧一定的AI处理能力。让端侧对视频流中的内容主动进行特征提取,使上传到云端的视频数据,一方面通过高效编码作为数据存储,另一方面经过特征提取直接作为智能大脑的“可读物”。

今天一般的城市大脑与智慧城市项目,主要是将摄像头收集来的视频数据进行存储,从而在云端用算法就行识别和分析。

2、数字视网膜

在此过程中,数字视网膜终端进行实时特征汇聚、按需调取视频,视频图像增强、目标检测跟踪、目标结构化、融合特征提取以及特征压缩与传输等处理工作则利用边缘计算完成。在云端,可以继续利用搜索引擎及识别和推理等智能计算对特征信息进行更深入的处理。

www.3559.com 4

除视频AI综合平台之外,中国工程院院士高文提出的“数字视网膜”理念,也广为产学各界重视。所谓“数字视网膜”,就是将识别和推理等智能计算保留在云端的同时 让端侧完成初步智能化解析,从而平衡两侧成本与效率关系。而云大脑与摄像头的智慧结合,就好像是给城市装了一层“数字视网膜”。

整个过程很好地平衡了端、云两侧的成本与效率关系,形成了“端-边-云-用”标准化城市智能视觉特征联网。通过特征化处理信息不仅能够降低传输带宽压力、减小数据总量,还可以有效提高检索速度,让摄像头终端真正与“城市大脑”实现即时联动。

而这里就有很多矛盾滋生了出来,比如传统摄像头收集的视频数据过于庞大,清晰度也欠佳,AI算法很难识别。

这种视频监控系统需要摄像头具有图像识别、处理、传输的能力,只传输有效信息,这不仅有助于解决AI视频监控的问题,也有助于智慧城市的进一步发展。

此前,陈杰在接受媒体采访时表示,在前端完成运算更适用于城市场景,带有一定算力的摄像机会成为主流趋势。

即使摄像头能够提供高清数据,但由于拍摄的视频没有进行特征提取,于是从提取到识别、检索,再到推理的全链计算都必须发生在云端。这带来的数据量非常庞大,云端将承受难以负载的数据压力,从而影响识别精度与数据处理准确度。同时,把基础视频数据堆积到云端,客观上也会造成过大的延迟,很难满足交通场景里实时反应的刚性需求。

结语:从文章开头可以看出,人工智能从安防、广告与金融领域开始向卫生健康、社区等多个领域蔓延,这反映了AI技术仍处于起步期向快速发展期的过渡阶段,也显示了产业的巨大发展潜力。

编辑:互联网 本文来源:【www.3559.com】博云视觉副高管冯栋:智慧城市怎

关键词: www.3559.com