<kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

              <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                      <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                              <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                                      <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                                              <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                                                      <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                                                              <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                                                                      <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                                                                              <kbd id='cc0uTispOE7b6Uu'></kbd><address id='cc0uTispOE7b6Uu'><style id='cc0uTispOE7b6Uu'></style></address><button id='cc0uTispOE7b6Uu'></button>

                                                                                  查看内容

                                                                                  918博天堂COM_光学字符辨认技能:让电脑像人一样阅读

                                                                                  择要:把 手机摄像头瞄准菜单上的法语菜名,屏幕上及时表现出翻译好的中文菜名;将全天下图书馆的藏书转化为电子书;街景车游走于大街小巷,拍摄街景的同时也从街景 图像中自动提取笔墨标识,让舆图信息更富厚更精确……这些场景的背后有一个配合的要害技能——OCR (Optical CharacterRecognition),光学字符辨认。

                                                                                  光学字符辨认技能:让电脑像人一样阅读

                                                                                  OCR让电脑“读”懂天下

                                                                                  鼠标发现人Douglas Engelbart曾经针对人工智能的简称AI提出了另一个理念——Augmented Intelligence,加强智能。在他看来,人已经足够智慧,我们无需再去复制人类,而是可以从越发适用的角度,将人类的智能进一步延长,让呆板去加能人的智能。

                                                                                  智能眼镜就是这样的产物,去超市的时辰带上一副,看到心仪商品上的笔墨,,自动搜刮出具体信息:出产商环境、在差异电商平台的价值等等。让智能眼镜读懂笔墨的正是OCR技能。OCR本质上是操作光学装备去捕捉图像,本日可所以手机、摄影机,将来可所以智能眼镜、可穿着装备等,就像人的眼睛一样,只要有笔墨,就去认出来。

                                                                                  我们也可以假想一下OCR在将来事变中的应用场景T媚课事变集会会议后,无需再把白板上的接头内容誊录下来,然后群发邮件部署使命,只要将白板用手机等智能装备照相留存,体系便能自动辨认并分检出相干职员的后续事变,并将待服务项自动存放到各自的电子日历中。

                                                                                  究竟上,我们已经向这个场景迈进了一步,微软前不久推出的Office Lens应用,已经可以通过视觉计较技能自动对图像举办整理并把它生涯到OneNote,而OneNote中基于云端的OCR技能将对图片举办笔墨辨认,随后你就可以拥有一个可编辑、可搜刮的数字文件,为上述将来应用场景打下基本。微软几年前推出的手机应用Translator,除了支持文本和语音翻译外,还能用手机拍摄差异说话的菜单或指示牌,翻译功效当即显露于原文之上。Office Lens和Translator这两款产物中的“中日韩”OCR焦点技能就来自微软亚洲研究院的语音团队。

                                                                                  光学字符辨认技能:让电脑像人一样阅读

                                                                                  从平板扫描仪到前端手机后端云

                                                                                  回过甚来看,OCR技能经验了奈何的成长过程呢?早在20世纪50年月,IBM就开始操作OCR技能实现种种文档的数字化,早期的OCR装备复杂而伟大,只能处理赏罚干净配景下的某种印刷字体。20世纪80年月,平板扫描仪的降生让OCR进入商用阶段,装备更为精练乖巧,可以处理赏罚的字体数目也增多,但对笔墨的配景要求如故很高,必要很好的成像质量。

                                                                                  平板扫描仪对印刷体文本的辨认率在20世纪90年月就已经到达99%以上,可谓OCR应用迎来的第一个飞腾。其时最闻名变乱是谷歌数字图书馆,谷歌还申请了图书扫描专利,实现了批量化的高速扫描。在此时代,手写字体的辨认也在并行成长,被普及用于邮件分拣、支票分类、手写表格数字化等规模。

                                                                                  这样的成绩一度让各人误觉得OCR技能已经至高无上,但从21世纪开始,精确地说是自从2004年拥有300万像素摄像头的智妙手机降生之日起,这一环境产生了基础改变。越来越多的人顺手拿起手机拍摄所看到的事物和场景,而此类天然场景中的笔墨辨认难度远远高于平板扫描仪时期,即即是印刷字体,也不能获得很高的辨认率,更别说手写体了。学术界因此将天然场景中的笔墨辨认作为全新的课题来看待。

                                                                                  与此同时,云计较、大数据以及通信收集的快速成长,实现了智妙手机的24小时在线,前端回罢手机摄像头举办笔墨捕获,后端可以对其举办及时说明和处理赏罚,二者的团结让OCR的将来应用模式布满想象。因此,对OCR的研究再度成为学术界的核心,无论是前端辨认技能照旧后端的关联应用规模,都有着无穷也许。微软亚洲研究院的研究员们,也很是有幸插手了这个大潮。

                                                                                  天然场景下的笔墨检测获打破性盼望

                                                                                  天然场景图像中的笔墨辨认大浩劫于扫描仪图像中的笔墨辨认,由于它具有极大的多样性和明明的不确定性。如笔墨中包括多种说话,每种说话含有多种字母,每个字母又可以有差异的巨细、字体、颜色、亮度、比拟度等;笔墨凡是以文本行的情势存在,但文本行也许有差异的分列和对齐方法,横向、竖向、弯曲都有也许;因拍摄图像的随意性,图像中的笔墨地区还也许会发生变形(透视和仿射调动)、残破、恍惚断裂等征象。

                                                                                  光学字符辨认技能:让电脑像人一样阅读

                                                                                  天然场景图片中的笔墨多样性示例

                                                                                  与传统 OCR 技能中的扫描文档图像对比,天然场景图像的配景更为伟大。如笔墨也许不是写在平面上而是在曲面上;笔墨地区四面有很是伟大的纹理和噪声;图像中的非笔墨地区有着跟笔墨地区很是相似的纹理,好比窗户、树叶、栅栏、砖墙等。这些伟大配景会极大增进误检率。

                                                                                  因为天然场景下的笔墨辨认难度大,微软亚洲研究院团队对相干技能和算法举办了针对性的优化和创新,从三个方面临文本检测技能举办了改造,并取得打破。凡是,OCR识此外步调可以分为两步:起首是文本检测(Text detection),将笔墨从图片中提取出来;然后,对文本举办辨认(Recognition),此次的打破首要是在文本检测环节的两个子阶段。

                                                                                  阶段 :回收新算法,检测精确高效

                                                                                  一个字母或笔墨凡是可以分为多少个连通地区,如o就拥有一个连通地区,i则拥有两个连通地区,文本检测起主要从图像中切割出也许存在的笔墨,即候选连通地区,然后再对其举办笔墨/非笔墨分类。

                                                                                  在确定候选连通地区阶段,微软亚洲研究院团队在传统检测要领ER(Extremal Region,极值地区)和MSER(Maximally Stable Extremal Region,最大安稳极值地区)基本之上创新地回收了比拟极值地区CER(Contrasting Extremal Region),CER是跟周围的配景有必然比拟度的极值地区,这个比拟度至少要强到可以或许被人眼感知到,在低比拟度的图像上比MSER结果更好,并且得到的候选连通地区数目远小于ER,候选范畴大大缩小,进步了算法的服从。