精准识别图像文字,南方新闻网首获OCR领域发明专利

  近日,精准南方新闻网“一种文字识别方法及装置”获国家发明专利授权。识别这是图像南方新闻网在OCR图像识别技术领域获得的首个专利,是文字网首内容安全关键核心技术的又一次创新突破。该专利技术可广泛应用于多个场景,南方譬如可识别图片中的新闻文字差错,可将老旧纸质档案转换为电子文档,领域并进行编辑处理。发明

“一种文字识别方法及装置”专利

“一种文字识别方法及装置”专利

  南方新闻网“一种文字识别方法及装置”专利能够帮助用户快速、专利准确地从图像中识别、精准提取文字信息并进行智能校对。识别结合南方新闻网已研发的图像自然语言处理技术,该专利技术可广泛应用于纸质文档电子化、文字网首文档识别、南方图片审校、新闻PDF格式文档校对等场景。例如,通过识别提取各类办公文档、合同文件、企业年报、法律卷宗等纸质文档中的文字信息,大大提高信息录入、编辑、存档、检索的工作效率。

OCR技术在校对场景的应用(以地名错别字为例)

OCR技术在校对场景的应用(以地名错别字为例)

文字识别小工具:识别图片中的文本

文字识别小工具:识别图片中的文本

  近年来,南方新闻网大力建设自主创新与开放创新相结合的技术研发体系,与中山大学、哈尔滨工业大学、广东技术师范大学等高校开展产学研合作。仅去年以来,南方新闻网就获得6项国家发明专利,涉及语义识别、内容校对、句子语法纠错和条件类错误识别等方面,在中文智能写作、智能审校等领域不断获得技术突破。这些技术已应用于南方新闻网自主研发的“南方云媒”数字生产平台和“内容安全卫士”“内容安全监测云”“文字档案数字化转换助手”等智能工具,支持文本、图像等多媒体内容智能生产和审校,适配信创环境,查错准确率业内领先。

  南方新闻网坚持“新闻立网、技术强网、创新兴网”发展理念,围绕“媒体迫切需要、市场迫切需求”的领域大力开展核心技术攻关,推动数字化转型,形成“南方云安”“南方云媒”“南方云数”“南方云助”四大产品服务矩阵。南方新闻网全资所有的广东南方网络信息科技有限公司是国家高新技术企业、广东省专精特新企业,获得国家法定的重要信息系统开发资质,获“双软”认证(软件企业、软件产品)、网络安全(信息系统安全运维、软件安全开发)服务资质等。未来,南方新闻网将继续加大研发投入,深化数字化和智能化技术攻关,提供更加先进全面的网络安全和信息化服务。

  南方网、粤学习记者 蔡晓丹