2023年,是人工智能突飞猛进的一年。这一年,国内外人工智能技术如雨后春笋般蜂拥而至,这是令人振奋的技术爆炸,也是信息无障碍的春天。点明软件在过去的一年高度关注人工智能的技术发展,并不断尝试从中寻找到能够赋能于视障者的技术方案,而今天,我们迎来了这一成果的第一次交付。本次升级,新增的视觉对话、图像识别、图标识别、滑块验证码和点选验证码的自动操作,均建立在强大的人工智能基础之上,相信一定能给您带来相对于以往判若云泥的使用体验。
下面是具体升级日志:
点明安卓
1、文字图像识别,新增视觉对话。基于讯飞星火认知大模型,可完成图像理解和基于图像初次理解结果的再次追问;
您可以从点明安卓的文字图像识别菜单中,选择焦点视觉对话或全屏视觉对话。选择焦点视觉对话,将针对当前焦点的图像内容进行识别理解,全屏视觉对话,则将截取整个屏幕进行识别理解;
视觉对话可以用生动全面的自然语言为您详细的描述图片信息,在识别界面,您还可以选择点击继续追问,向大模型追问图片中的细节。同时,点击历史对话,还可以基于之前的识别结果进行提问;
焦点和全屏视觉对话,由于星火认知大模型需要向讯飞购买,为避免被滥用,每日均各提供50次的免费使用,普通使用应该完全足够,超过将按次数收取点币;
2、文字图像识别,新增图像描述功能。图像描述,是点明自行搭建、自行训练的AI识别大模型技术,可以完成对一张图片的概要描述,可以用简洁的自然语言,用一句话为您描述图片中的内容;
您可以选择焦点图像描述和全屏图像描述,焦点图像描述将为您描述当前焦点的图片内容,而全屏图像描述,则将截取当前整个屏幕进行识别并描述;
您还可以打开自动图像描述,在遇到图片时,将自动识别,自动描述图片中的内容;
3、文字图像识别,新增图标识别。图标识别,用于识别部分应用没有文字描述的控件信息,例如我们经常碰到的按钮xx等。基于图标描述的功能,这些应用将在易用性上得到极大程度的提升,您再不用因为找不到第三方软件上的某个按钮而发愁;
您可以选择手动图标识别或自动图标识别。当您打开自动图标识别后,在遇到这类控件时,软件将自动为您尝试识别并读出;
图标识别也是点明自行搭建、自行训练的AI识别大模型技术,目前我们已经针对各种场景下的不同类型、不同形状,不同位置的图标数据进行了多伦训练,但可能还是存在部分应用自定义的特殊图标没有学习到,或者学习的不是非常精准,后续我们会不断学习、训练更多的图标。如果遇到不识别的图标,也可以通过手动焦点图像描述,进行图标形状的一句话描述,供操作参考。
图像描述和图标识别,由于是自行训练,公司承担了所有的费用,目前对大家完全免费,没有使用次数限制,后续根据使用成本压力,可能会适当考虑收取一定的费用;
4、文字图像识别,新增滑块验证码自动操作。基于人工智能的通用解决方案,无需特意适配某个应用,在验证码界面,直接从文字图像识别菜单选择滑块验证码识别即可自动完成操作;
5、文字图像识别,新增点选验证码自动操作。在点选验证码界面,经常会碰到选择某类特定图片的情况,例如,请选择带有自行车的图片。现在,您可以从文字图像识别菜单中选择点选验证码识别,即可自动帮您完成点击;
部分应用的滑块验证和点选验证可能会是一个非常复杂的界面,举个例子,有一些滑块和滑块背景几乎是同色,即隐藏的很深,肉眼有的时候都无法轻易找到,这样的滑块可能不一定能操作成功,大家可以尝试多刷新,我们也会不断优化滑块的识别技术;
滑块和点选验证码识别,每日各有50次的免费使用次数,我们认为正常使用应该完全充足,超过将会有使用限制提示,主要考虑避免一些恶意操作行为;
6、识别设置/查看识别记录下,新增保存手动图像描述识别结果、保存焦点视觉对话识别结果、保存全屏视觉对话识别结果开关,开启后,您的上树识别结果都可以到对应的识别记录中查看;
7、识别设置下,新增自动识别结果提示选项,可选择使用音效、振动等交互提示;
8、识别设置下,新增更新滑块验证数据,用于手动同步更新服务端适配的更多滑块验证码数据;
9、增加更多 emoji 表情的朗读;
10、点明设置/点明账号/会员中心/点明看看下,新增余额转点币入口,使用余额转点币,可将原识别充值剩余余额转换为相同价值的点币;
自该版本起,基于识别服务的支付(原图片验证码识别和百度文字识别)都将以点币进行结算,焦点和全屏视觉对话每日各有50次的免费使用次数,点明看看的讯飞星火认知每日有50次的免费使用次数,超过每日的次数限制,可以通过点币支付继续使用,一次使用为5个点币。
11、点明设置-读屏设置-提示设置-音效主题-主题商店,新增加了"重剑无锋"和"气泡之声",两个主题音效,供大家免费下载使用,这个也是头脑风暴小组团队为大家送上的一份新年贺礼,我们已经上传商店,大家可以直接下载使用
12、由于微信支付引入了更高级别的安全机制,因此暂时移除快捷设置/自动输入密码设置下,微信支付密码功能;
13、提升读屏响应速度以及更多其他细节优化;
点明看看:
1、看图说话,新增讯飞星火认知引擎。使用该引擎,可以用自然、生动的语言和全面的角度描述手动拍摄或从图库中选择的图片。同时,支持对所描述的图片进行追问;
2、看图说话,新增一句话描述引擎,使用该引擎,将以一句话的形式,用简洁的自然语言描述图片中的内容;
3、看图说话,新增保存一句话描述引擎识别结果和保存讯飞星火认知识别结果开关,开启后,可从对应的识别记录中查看过去的识别记录;
点明输入法:
1、优化语音输入,解决快速语音输入时,提示未找到匹配结果和未检测到声音的问题;
2、解决语音输入启动延迟问题;
3、大幅度优化语音输入准确度;
4、调整语音输入标点模式,新增智能标点、无标点、句末无标点、空格替代选项;
AI新纪元,美好的事情刚刚发生。相信在科学技术的不断发展中,在各信息无障碍团队的不断探索下,视障者的生活一定会越来越丰富多彩,越来越美好。
南京点明软件科技有限公司
2024年1月23日
目录
2023年,是人工智能突飞猛进的一年。这一年,国内外人工智能技术如雨后春笋般蜂拥而至,这是令人振奋的技术爆炸,也是信息无障碍的春天。点明软件在过去的一年高度关注人工智能的技术发展,并不断尝试从中寻找到能够赋能于视障者的技术方案,而今天,我们迎来了这一成果的第一次交付。本次升级,新增的视觉对话、图像识别、图标识别、滑块验证码和点选验证码的自动操作,均建立在强大的人工智能基础之上,相信一定能给您带来相对于以往判若云泥的使用体验。
下面是具体升级日志:
点明安卓
1、文字图像识别,新增视觉对话。基于讯飞星火认知大模型,可完成图像理解和基于图像初次理解结果的再次追问;
您可以从点明安卓的文字图像识别菜单中,选择焦点视觉对话或全屏视觉对话。选择焦点视觉对话,将针对当前焦点的图像内容进行识别理解,全屏视觉对话,则将截取整个屏幕进行识别理解;
视觉对话可以用生动全面的自然语言为您详细的描述图片信息,在识别界面,您还可以选择点击继续追问,向大模型追问图片中的细节。同时,点击历史对话,还可以基于之前的识别结果进行提问;
焦点和全屏视觉对话,由于星火认知大模型需要向讯飞购买,为避免被滥用,每日均各提供50次的免费使用,普通使用应该完全足够,超过将按次数收取点币;
2、文字图像识别,新增图像描述功能。图像描述,是点明自行搭建、自行训练的AI识别大模型技术,可以完成对一张图片的概要描述,可以用简洁的自然语言,用一句话为您描述图片中的内容;
您可以选择焦点图像描述和全屏图像描述,焦点图像描述将为您描述当前焦点的图片内容,而全屏图像描述,则将截取当前整个屏幕进行识别并描述;
您还可以打开自动图像描述,在遇到图片时,将自动识别,自动描述图片中的内容;
3、文字图像识别,新增图标识别。图标识别,用于识别部分应用没有文字描述的控件信息,例如我们经常碰到的按钮xx等。基于图标描述的功能,这些应用将在易用性上得到极大程度的提升,您再不用因为找不到第三方软件上的某个按钮而发愁;
您可以选择手动图标识别或自动图标识别。当您打开自动图标识别后,在遇到这类控件时,软件将自动为您尝试识别并读出;
图标识别也是点明自行搭建、自行训练的AI识别大模型技术,目前我们已经针对各种场景下的不同类型、不同形状,不同位置的图标数据进行了多伦训练,但可能还是存在部分应用自定义的特殊图标没有学习到,或者学习的不是非常精准,后续我们会不断学习、训练更多的图标。如果遇到不识别的图标,也可以通过手动焦点图像描述,进行图标形状的一句话描述,供操作参考。
图像描述和图标识别,由于是自行训练,公司承担了所有的费用,目前对大家完全免费,没有使用次数限制,后续根据使用成本压力,可能会适当考虑收取一定的费用;
4、文字图像识别,新增滑块验证码自动操作。基于人工智能的通用解决方案,无需特意适配某个应用,在验证码界面,直接从文字图像识别菜单选择滑块验证码识别即可自动完成操作;
5、文字图像识别,新增点选验证码自动操作。在点选验证码界面,经常会碰到选择某类特定图片的情况,例如,请选择带有自行车的图片。现在,您可以从文字图像识别菜单中选择点选验证码识别,即可自动帮您完成点击;
部分应用的滑块验证和点选验证可能会是一个非常复杂的界面,举个例子,有一些滑块和滑块背景几乎是同色,即隐藏的很深,肉眼有的时候都无法轻易找到,这样的滑块可能不一定能操作成功,大家可以尝试多刷新,我们也会不断优化滑块的识别技术;
滑块和点选验证码识别,每日各有50次的免费使用次数,我们认为正常使用应该完全充足,超过将会有使用限制提示,主要考虑避免一些恶意操作行为;
6、识别设置/查看识别记录下,新增保存手动图像描述识别结果、保存焦点视觉对话识别结果、保存全屏视觉对话识别结果开关,开启后,您的上树识别结果都可以到对应的识别记录中查看;
7、识别设置下,新增自动识别结果提示选项,可选择使用音效、振动等交互提示;
8、识别设置下,新增更新滑块验证数据,用于手动同步更新服务端适配的更多滑块验证码数据;
9、增加更多 emoji 表情的朗读;
10、点明设置/点明账号/会员中心/点明看看下,新增余额转点币入口,使用余额转点币,可将原识别充值剩余余额转换为相同价值的点币;
自该版本起,基于识别服务的支付(原图片验证码识别和百度文字识别)都将以点币进行结算,焦点和全屏视觉对话每日各有50次的免费使用次数,点明看看的讯飞星火认知每日有50次的免费使用次数,超过每日的次数限制,可以通过点币支付继续使用,一次使用为5个点币。
11、点明设置-读屏设置-提示设置-音效主题-主题商店,新增加了"重剑无锋"和"气泡之声",两个主题音效,供大家免费下载使用,这个也是头脑风暴小组团队为大家送上的一份新年贺礼,我们已经上传商店,大家可以直接下载使用
12、由于微信支付引入了更高级别的安全机制,因此暂时移除快捷设置/自动输入密码设置下,微信支付密码功能;
13、提升读屏响应速度以及更多其他细节优化;
点明看看:
1、看图说话,新增讯飞星火认知引擎。使用该引擎,可以用自然、生动的语言和全面的角度描述手动拍摄或从图库中选择的图片。同时,支持对所描述的图片进行追问;
2、看图说话,新增一句话描述引擎,使用该引擎,将以一句话的形式,用简洁的自然语言描述图片中的内容;
3、看图说话,新增保存一句话描述引擎识别结果和保存讯飞星火认知识别结果开关,开启后,可从对应的识别记录中查看过去的识别记录;
点明输入法:
1、优化语音输入,解决快速语音输入时,提示未找到匹配结果和未检测到声音的问题;
2、解决语音输入启动延迟问题;
3、大幅度优化语音输入准确度;
4、调整语音输入标点模式,新增智能标点、无标点、句末无标点、空格替代选项;
AI新纪元,美好的事情刚刚发生。相信在科学技术的不断发展中,在各信息无障碍团队的不断探索下,视障者的生活一定会越来越丰富多彩,越来越美好。
南京点明软件科技有限公司
2024年1月23日