智慧生活 | 如何使用白描PC版识别图片和pdf文件

本文转载于中国盲文图书馆


在日常学习和工作中,视障用户经常会遇到图片形式的pdf 文件或图片格式的资料需要阅读,此时需要用到相关转换工具。在众多转换工具中,今天介绍的白描是笔者使用频率最高的一款软件。该软件具有界面简洁、识别准确、操作无障碍等特点,并且支持苹果、安卓手机,微软


windows、苹果macos 电脑以及网页版等多平台使用。今天我们来介绍桌面版的使用方法。


根据官方的介绍,白描是一款像猫一样灵动的OCR 扫描识别工具;具备高准确度的文字识别、表格识别转


Excel 、批量识别、识别后翻译、文件扫描等功能。但需要注意的是,桌面版只包含其中的一部分功能,下面我们逐个进行介绍。


1.主界面介绍:白描的安装非常无障碍,安装后在桌面上找到白描回车打开, 页面上默认进入的是图片文字识别


,用上下光标可以浏览到四个主要功能, 分别是图片文字识别


、数学公式识别、电子表格识别和设置。需要使用哪个功能可以在相应功能上回车确认。下方是几个功能按钮,包括添加文件、从剪贴板导入粘贴文件和开始识别。


2.设置: 由于白描主界面的设置无法使用读屏软件点击打开,推荐使用通知区域托盘菜单中的设置。按


windows加b 切换到通知区域,左右光标找到白描。需要注意的是,白描的名称无法读出来,在这里读屏软件只会给与“按钮”的提示,大家可以多尝试几次,一定可以找到该软件。如果寻找正确,按菜单键弹出菜单,第一项是“屏幕截图”,如果没有此提示,说明寻找错误,还需要继续寻找。


在菜单中按下光标找到设置回车,进入设置界面。界面上包括三个设置,默认停留在通用设置界面。按下光标可以浏览到所有设置项目。首先找到登录按钮回车,此时会打开白描的登录界面,输入账号密码后回车即可登录。白描仅支持移动端注册,如果之前没有白描账号,需要先下载白描手机版进行注册,注册方式选择手机号或邮箱注册才能在


PC 版登陆。登陆后回到了设置界面,继续向下浏览,这里是关于界面语言的设置,默认为“


auto ”,也就是自动模式,通常情况下不需要修改。继续向下有一个是否开机启动的复选框,根据需要进行选择。


按ctrl加home 键(首页键)回到页面顶部,下光标找到快速识别,使用各品牌读屏软件移动鼠标的功能,将鼠标移动到该处并点击,即可进入快速识别设置界面。其中有几个项目需要设置。第一个是截图快捷键,按下该键后会将窗口截图并识别,如果想设置此快捷键,继续按下光标找到“设置快捷键”回车,继续按一次下光标可以切换到一个按钮,在此按钮处回车,然后输入我们想设置的快捷键,如果此快捷键不予其他快捷键冲突,即可设置成功;第二个是显示


/ 隐藏窗口快捷键,顾名思义该快捷键按一次可以显示主窗口,再按一次可以隐藏窗口。如果想设置,同样继续按下光标找到“设置快捷键”回车,设置方法同上;第三个是截屏后弹出结果窗口,截屏识别后是否自动弹出识别结果窗口,如需选择,可以继续按下光标找到一个复选框,用空格键切换状态;第四个是截屏识别后自动复制结果,如需选择,同样继续按下光标找到一个复选框用空格键即可选中。


回到页面顶部,下光标找到“关于”,将模拟鼠标移动到该处并点击,下光标可以找到一个检查更新的按钮,在此处回车,如有新版本会提示更新。设置部分主要就包括这些内容。


  1)Pdf和图片转文本文件 : 在白描主界面按上下光标找到“图片文字提取”回车确认,随后按下光标找到“点此选择图片”,在此处用读屏软件的模拟鼠标点击一次,会弹出选择文件的对话框,选择需要转换的


pdf文件或图片。支持识别的格式包括


JPG/PNG/BMP/GIF/SVG/PDF 。如果想批量识别,只需要在此处用文件多选的方法将多个文件添加到白描中。操作时可以先将所有要识别的文件放入一个文件夹中,在选择需要转换的文件时浏览到该文件夹回车进入,随后按


ctrl加a 全选所有文件后回车。此时会将该文件夹中的文件添加到白描中。白描


一次最多识别50个文件。


添加完成后,按下光标可以浏览到pdf 每一页的名称。如果一次识别多个文件,先浏览的是第一个文件的所有页面,后面是第二个文件的页面,以此类推。查看完所有页面后,继续按下光标可以切换到一个“开始识别”的元素,在此处用模拟鼠标点击一次即可开始识别,开始识别后:原本“开始识别”元素的名称也会变成“识别中”。识别完成后按上下光标可以切换到所有页面的识别情况,正常情况下,每个页面后面都会显示一个“识别完成”的提示。如果想查看某一页的识别结果,可以用模拟鼠标点击页面下面的“点击查看结果”,随后按下光标切换到页面底部,可以查看该页面的识别结果。如果对识别结果不满意,可以用模拟鼠标点击页面下方的“重新识别”,白描会重新识别该页面。如果想查看所有页面的识别结果,可以点击页面底部的“合并结果并查看”。点击后需要等待片刻,随后在页面底部会出现几个元素。第一个是复制,点击后会将所有识别结果添加到剪贴板,我们可以打开一个记事本或


word 将剪贴板中的内容粘贴进去。继续按下光标可以切换到导出为


docx和txt 的选项,点击后会弹出保存对话框,可以将识别内容保存为


word或txt文件。


2)数学公式识别:按ctrl加home (首页键)回到页面顶部,下光标找到数学公式识别回车确认。随后的识别流程与图片文字提取完全相同,在此不再赘述。批量识别最多支持


50张图片。支持的格式包括JPG/PNG/BMP/GIF/SVG。需要注意的是,此处不包括pdf


格式。


支持识别的数学公式共有22种,分别是平面直角坐标系、一元二次方程、概率初步


cz 、函数及其图像、解直角三角形、平面几何、投影与视图、代数、实数与二次根、三角形、相似形、分式、统计初步(初中)、圆锥曲线方程、直线和圆方程、直线和平面、三角函数、复数、概率初步


gz、函数和投影、推理和证明以及平面向量。


3)电子表格识别 :切换到页面顶部,下光标找到“电子表格识别”,随后添加包含表格的图片,识别的流程同上。需要注意的是,电子表格不支持批量转换,一次仅支持转换


1个文件。转换时尽量将表格图片转成正向,可以提高识别准确率。


4)窗口截图识别 :首先找到需要识别的界面,将该窗口最大化,按上面设置过的快速截图的快捷键,此时会弹出一个框选识别区域的界面,通常笔者都是对整个屏幕进行识别,这里的操作需要一点技巧。如果使用的是触屏电脑,可以用一根手指从屏幕的左下角沿对角线滑动到右上角,这样及可框选整个屏幕。如果使用的是传统非触屏电脑,可以先用模拟鼠标将鼠标指针移动到屏幕右下角,随后按住鼠标左键向右上方滑动,只要方向正确,也能成功选取整个屏幕的内容。框选后,程序会自动识别,识别完成后会弹出一个识别结果界面,同时将识别结果拷贝到剪贴板。识别结果界面的无障碍体验不是很完善,推荐大家将剪贴板中的识别结果粘贴到


word、记事本中进行编辑。


以上就是白描PC版的主要功能,大家还发现了哪些实用功能可以在本帖留言讨论

发表于:2022-12-16 20:53
2个回复
您还没有登录,登录后才可回复。 登录 注册