侵权投诉
当前位置:

OFweek安防网

视频处理/显示

正文

文字识别刷新世界纪录 海康威视浦世亮解密安防大数据

导读: 在3月27日举行的中国“AI春节”——2017新智元开源·生态AI技术峰会上,海康威视研究院院长浦世亮发表演讲《安防大数据驱动下的智慧生活》,介绍海康在智能+安防领域的技术探索。

在3月27日举行的中国“AI春节”——2017新智元开源·生态AI技术峰会上,海康威视研究院院长浦世亮发表演讲《安防大数据驱动下的智慧生活》,介绍海康在智能+安防领域的技术探索。海康威视是全球视频监控No.1,近年来布局安全视频监控发展,物联网以及视频大数据和智能视频分析,产业表现强劲,在以 ImageNet 为代表的国际技术竞赛中也一直都有抢眼的成绩。

演讲中,浦世亮介绍了应对安防大数据三大挑战,以及海康威视的应对之道:挖掘无标签数据中的隐藏信息做额外反馈,化解标记数据成本高的问题;多传感器融合,应对复杂场景感知问题;使用线上增量学习,弥补前端设备计算力的差距。

日前,海康威视研究院预研团队基于深度学习技术的 OCR(Optical Character Recognition,图像中文字识别)技术,刷新了 ICDAR Robust Reading 竞赛数据集的全球最好成绩,并在“互联网图像文字”、“对焦自然场景文字”和“随拍自然场景文字”三项挑战的文字识别(Word Recognition)任务中取得第一。

ICDAR(International Conference on Document Analysis and Recognition)全称为文档分析与识别国际会议,由国际模式识别协会(IAPR)主办。ICDAR 组织的文档分析与识别竞赛是当前 OCR 技术领域全球最具影响力的比赛,从 2003 年至今已举办 5 届。其中,ICDAR 2015 竞赛,吸引了来自 82 个国家的 2367 支队伍参加,其中包括 Google、微软、百度、三星、旷视等团队,竞赛中涌现的许多方法都对文字识别技术的发展起到了强大的推动作用。

  

图1:RobustReading竞赛的三项主要任务

在竞赛的三大主要任务中,待识别的文字位于复杂图像背景中,成像存在噪声、模糊、透视、倾斜以及排列随意等不利因素,字体格式种类繁多。

海康威视的OCR技术,在三项文字识别任务中均取得了世界第一,在互联网文字任务中以 5.6% 的优势超越第二名,分别在对焦自然场景文字和随拍自然场景文字任务中超越第二名 3.4% 和 3.1%。

图2:Born-Digital Images识别评测结果显示HIK_OCR排名第一。

  

图3:Focused Scene Text识别评测结果显示HIK_OCR排名第一

  

图4:Incidental Scene Text识别评测结果显示HIK_OCR排名第一

文字识别技术近年来的突破,很大程度上依赖于深度学习的发展。海康威视预研团队设计了一个数十层的卷积神经网络来完成图像的信息编码,然后使用启发式的注意力模型,实现从特征到文字的解码。

1  2  3  下一页>  
声明: 本文由入驻OFweek公众平台的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

我来说两句

(共0条评论,0人参与)

请输入评论

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号