(资料图片)
周健报道 近期,合合信息旗下扫描全能王“智能高清滤镜”正式上线。该功能基于AI技术及智能扫描引擎,可自动检测图像中存在的问题并判定图像的优化方式,实现模糊、阴影、手指、屏幕纹等干扰因素的一键全处理。使用者无需思考拍摄角度、光源、背景,只要点击单拍、多拍、扫描等任意拍摄按钮,便可得到一张如原稿打印般平整、清晰的图片。
“一键到位”的背后,AI在帮人“思考”图像问题
与传统的手机扫描流程相比,扫描全能王“智能高清滤镜”的亮点之一,便是让AI代替人去“思考”图片中需要解决的问题,并为用户自动选择出最优处理方案,通过算法上的智能研判,达成多个问题一键解决的效果。
据合合信息扫描全能王事业部负责人曹超阳介绍,“智能高清滤镜”的智能研判主要基于精准的图像感知,来达成场景化的决策效果,例如,去除手指产生的遮挡、感知到图像是过暗还是过亮,然后针对性地调整图像的亮度和对比度等。
“智能高清滤镜”能够迅速判定文档种类并进行处理方法决策,在办公文档电子化、教育资料处理、商务资料留存等涉及文档处理的场景中具有广阔的应用前景。
智能扫描引擎,让AI读懂图像与文字
现实生活中,书本等文档并不总是平面的,AI在处理相关图片时需要进行“矫正”。此外,由于拍摄角度和镜头畸变的问题,即使是平面的文档,拍摄后也可能出现透视扭曲。扫描全能王采用了基于深度学习的曲面检测和矫正技术来进行处理,能够应对各种复杂的曲面文档。
据介绍,智能扫描引擎AI-Scan(简称“AI-Scan引擎”),基于合合信息智能文字识别、智能图像处理技术,对图像处理、文字识别及版面还原进行全面优化,综合提升扫描效果。
多语种识别是巨大的挑战。例如,阿拉伯语的书写方向是从右到左,而且同一字母在单词的不同位置有着不同的形态。而扫描全能王采用了一种结合深度学习和自然语言处理的全新方法,能够有效地处理不同语种的字符关联和顺序问题。
在服务全球亿级别用户的过程中,扫描全能王对大量的多语种文本进行预训练,能够对全球41个语种的文档进行识别,满足了全球超过100个国家和地区用户的办公、生活需求。
关键词: