识别图片中公式和文字的最佳组合:天若文字识别和Mathpix

    谢松兴 蒙宗灿 盘俊春

    

    

    

    教师们都碰到过想要从图片中把需要的文字复制到可编辑的Word文档中。常用的解决办法要么全手工键盘录入,但是费时费力,易出错;要么通过讯飞输入、袋鼠输入等语音识别APP或软件,通过语音转文字方式,前提是普通话相对标准识别率才比较高;也还可以利用QQ截图文字识别或微信小程序,如传图识字等小工具,联通网络后拍照上传识别,再通过计算机逐行选择文字复制,最后发送到Word里进行编辑,但缺点是不能一次选择全文识别,而且要兼顾手机和计算机几方面操作,流程复杂、效率不高;省事的还可以利用专业的软件,如风云PDF转换器、WPS会员版等进行识别转换,但是费用不低。那么有没有免费的中文英文识别,理科公式识别软件呢?今天就介绍两款十分出色的OCR识别工具:天若文字识别软件和Mathpix。

    ● 天若OCR文字识别的主要功能及特点

    天若OCR文字识别工具是一款十分强大的文字智能识别软件,拥有图片识别、PDF识别、屏幕取色、屏幕录像、截图、贴图、录制Gif、文本翻译和段落排版等功能。专业版还增加了识别竖排、识别公式、识别表格、识别三线表、倾斜矫正等一系列功能,可以帮您减少重复劳动、助您提高工作效率。

    天若OCR文字识别的下载地址是https://www.pcsoft.com.cn/soft/175155.html。下载安装好后打开的界面如图1所示。

    天若OCR文字识别界面很简单,软件有以下主要功能及特点:

    (1)图片识别:JPG、BMP、PNG、TIF等格式图片识别为TXT;高效的识别各类复杂字体。

    (2)PDF识别:支持普通PDF文件,PDF扫描件、加密的PDF文件进行扫描识别。

    (3)文字识别后再加工的功能很强大,如置顶功能、字体功能和朗读功能等等十多项文字编辑功能。

    ● 利用天若OCR文字识别工具进行图片文字转换

    天若OCR文字识别简单易用,使用之前我们先确保计算机都处于网络联接状态。具体操作步骤如下:

    (1)先单击软件图标启动软件,在计算机右下方对着天若软件图标双击鼠标左键开始截图识别功能,如图2所示。

    (2)利用十字形标志的光标选定预识别PDF文档或者图片形式的文档, 可以一次选择一整页A4纸张,也可以根据需要按段落或者几行文字选择好,截图之后松开左键即可。完成识别,段落识别图片,越清晰越准确,识别率高达98%;

    (3)识别好中文或英文及一些公式在天若软件以记事本形式呈现,识别速度由计算机使用网络情况而定,用时一般是1~6秒即可完成;

    (4)在天若軟件工具栏,可以对转化好的文字进行适当的排版包括字体、颜色、加粗、错别字识别,自动分栏操作,工具栏还有很多强大功能包括中英文翻译,朗诵录音等;

    (5)最后把识别好的中文或英文理科公式,复制到Word文档中,加以自主编辑使用即可,文字识别完毕,如图3所示。

    总之,天若文字识别软件对中英文识别效果好,易操作,识别成功率高,能力强大,基本上可以满足文科教师的所有要求,唯一遗憾的是对图画插图识别没有能够直接引用成插图原图,那么我们只需要把截图配上文档当中去就可以形成讲义。

    前面我们利用天若文字识别软件解决了文科类教师最大的文字录入、转换的问题,我们发现天若文字识别软件对中英文识别成功率高,但是对理科公式识别会出现乱码,不能直接复制利用,如图4所示,因此很多教师只能采用打开数学公式编辑通过手工录入的方法进行公式录入。

    有什么方法可以帮助理科教师,有什么方法可以快速录入公式和理科符号,提高工作效率呢?下面推荐理科公式精准识别的利器Mathpix软件。

    Mathpix是一款十分出色的OCR公式识别工具,Mathpix界面美观大方,功能强劲实用,能够识别理科符合数学公式,然后将它转换成LaTeX编辑器的代码,使用起来简单便捷。下载地址:http://www.downza.cn/soft/275117.html。

    使用Mathpix前,首先要在官网上注册帐号,得到链接后,每个月每个注册账号可以免费使用500次,若次数不够有可以多用不同邮箱注册,即可免费使用,若从事文档编辑工作经常大量使用的建议注册会员缴费使用次数更多。如图5所示为注册界面。

    ● Mathpix的主要功能及特点

    Mathpix是一个十分强大的排版系统,除了能编写数学公式,还能非常完整的撰写学术论文,并且被国际各大机构接受,但一直以入门难著称。今天我们主要想介绍它的文字识别功能和公式识别功能。软件有以下主要功能及特点:

    (1)Mathpix 能够直接截取数学公式的图片,转换为 LaTeX 语法,非常简单方便,并且支持苹果、windows、Linux三大主流系统;

    (2)可以截图识别中文和公式;

    (3)可以先手工书写纯证明过程中的公式等信息,手机拍照上传计算机端,通过软件截图,能够识别公式然后将它转换成LaTeX编辑器的代码。

    ● 利用Mahpix软件识别PDF格式下数学试卷转换成Word格式

    Mathpix简单易用,具体操作步骤如下:

    (1)启动Mahpix软件:通过输入键盘快捷键苹果计算机上是Ctrl ++ M、在Windows和Linux上按Ctrl+Alt+M,如图6所示软件启动界面。

    (2)利用Mahpix软件捕获公式:在待转换PDF文档或者图片里,鼠标左键单击选定区域,只需单击并拖动松开左键即可完成捕获;如图7所示为截图识别后的效果。

    (3)编辑:其中中文可以全识别,数学公式以latex代码格式呈现,很容易从任务栏直接选择所需的格式,若需要在Word文档对识别后文件加工,点击Copy MS Word 按键即可对文档全选复制,进行编辑等。

    (4)粘贴:将latex代码导入任何兼容的编辑器,它已经被复制到你的剪贴板了,最后粘贴到Word文档效果如图8所示。

    (5)latex代码转变为数学编辑器MathType中的公式:将latex代码复制粘贴到数学公式编辑器MathType中实现公式最后转换,然后把多余的符号文字引用符去掉就直接可以使用。如图9所示是复制到Word后的界面。

    总之,两个软件各有专长,天若OCR文字识别对中英文文档识别效果好,Mahpix软件理科公式识别转换效果好,经过识别,PDF文档和图片公式里文字和公式都能在Word文档中加工编排,完美解决了手工输入的低效率和费时费力的问题。利用这两个软件对电子文档进行识别,公式识别率高,准确度很不错,极大的方便的理科教师对格式转换编辑的需求,会给教育教学带来极大的便利。

    基金项目:本文为广西教育科学“十三五”规划2019年度课题“‘互联网+背景下大数据与云计算技术工具与学科教学融合的实践研究”(课题编号:2019C429)的阶段性研究成果。