央廣網深圳3月25日消息(記者黃倩 通訊員嚴偲偲)記者從中國科學院深圳先進技術研究院(以下簡稱“深圳先進院”)了解到,由深圳先進院聯合深圳市商湯科技有限公司、南京大學研發完成的“視頻的深度表征與識別技術及應用”項目今日(25日)獲2019年度廣東省科學技術獎技術發明一等獎。該項目可以讓人工智能“讀懂”復雜視頻。

  深圳先進院方面稱,近年來,隨著信息通信技術的發展,視頻數據呈現爆炸式增長。現有技術雖然能夠較好地采集、存儲和傳輸視頻,但大規模視頻識別仍面臨內容復雜、識別精度低和計算效率低等巨大挑戰。解決這些挑戰的核心是實現對復雜多變內容的理解、對海量對象的高精度識別及快速處理,讓AI技術構建出既能“看得懂”,又能“認得準”,還能“算得快”的能力。

  據介紹,該項目第一完成人深圳先進院數字所所長喬宇研究員帶領團隊,經過多年研究開發和應用驗證,提出了視頻長短時表征與識別等一系列創新性方法,突破了軌跡卷積、中心損失等核心技術,顯著提升了復雜視頻行為分類、大規模人像識別、物體檢測、場景分類等重要視覺任務的性能。

  該技術在多個著名視覺數據庫的驗證下取得了同期國際領先的識別率,并在ImageNet、ActivityNet等重要視覺國際競賽多次取得第一或名列前茅。在計算機視覺重要國際期刊和會議如PAMI、IJCV、CVPR、ICCV等發表一系列創新論文,根據谷歌學術統計論文累計被引超過8000次,獲國內外授權發明專利10余項。

  目前,項目研發的技術已廣泛應用于智慧城市、機器人及互聯網多媒體等多個領域,提高了城市的管理效率和能力,創造了顯著的經濟和社會效益。