盲人朋友如何使用最近大火的ChatGPT

岁末年初,人工智能ChatGPT横空出世,引起了大家的热烈讨论。作为科技爱好者,笔者第一时间体验了这款人工智能产品。不得不说,其表现非常令人震撼,语言的逻辑性、条理性、流畅性,对信息的加工处理远优于之前的产品。笔者一直在思考,最新一代人工智能技术可以为视障者做些什么,给我们带来哪些帮助,使用点明电脑读屏软件体验一下ChatGPT吧!


1. 什么是ChatGPT?


通俗的讲,ChatGPT是一个聊天机器人,可以通过对话的方式为我们提供信息,工作方式与小爱同学、天猫精灵等语音助手非常类似。但不同的是,ChatGPT远比他们更强大。就我个人的感受而言,如果把上述语音助手比作小学生,经常会犯错,偶尔无法理解用户的意图。那么,ChatGPT就像是大学生,其语言的逻辑性、条理性以及流畅性非常优秀,其表现与真人已经非常接近。这里提供两个我与ChatGPT的问答实录,大家可以感受一下。


超越:你好ChatGPT,我是点明科技电脑读屏项目组产品经理超越,听说你是一个聊天机器人,我和我的小伙伴们对你非常感兴趣,你愿意跟我们聊聊天吗?


ChatGPT:你好!我很乐意尽我所能帮助你。作为OpenAI训练的语言模型,我没有个人的经验或观点来分享,但我可以告诉你一些我如何工作的信息。


我是一个大型语言模型,接受过大量文本数据的训练,这使我能够对各种各样的输入生成类似人类的反应。当你问我一个问题时,我用我的文本数据训练和算法生成与你的问题相关的回答,并用一种听起来自然的方式写出来。我尽我所能提供准确和有用的信息,但我不是一个完美的知识来源,我并不能总是提供完整或正确的答案。


我一直在学习和提升,所以我可能不知道你所有问题的答案,但我很乐意尽我所能帮忙。关于我或我的能力,你还有什么想知道的吗?


从第一个问题中可以窥见ChatGPT的些许不凡。我的问题是用非常自然的方式表达的一串长文字,其中有我的自我介绍,这些对于ChatGPT来说可能是一些需要过滤的无用信息,如果是市面上的其他语音助手,这些无用信息会影响到回答结果,但ChatGPT丝毫未受影响。随后我在问题中用了一种比较模糊的询问方式,提到了我们对他非常感兴趣,而不是“请做个自我介绍”这种比较直接的回答,ChatGPT完全可以理解我们的意图并给出正确回答。下面我们再问一个问题。


超越:让我们从最基本的开始吧。你说你是一个语言模型,什么是语言模型呢?你的训练数据从何而来?


ChatGPT:语言模型是一种机器学习模型,它被用来生成听起来自然和类似人类所用的文本。语言模型的目标是能够基于之前出现的单词,预测给定文本中的下一个单词或单词序列。


训练一个语言模型,需要大量的文本数据。这些数据有许多不同的来源,如书籍、文章、网站等等。用于训练我的具体培训数据不是公开信息,但这些信息是广泛而多样的文本集合,包括许多不同类型的内容和写作风格。


当我被问到一个问题时,我用我的训练生成一个与输入相关的回答,并用一种听起来自然的方式写出来。我在不断地学习和提高,我的反应可能会随着时间的推移而改变,因为我能持续从新的数据中学习。


在第二个问题中,我们提出了两个问题,对于其他语音助手来说,经常只会回答其中的一个,但ChatGPT对这两个问题都给出了准确回答,并且回答的内容比较详细,质量也比较高。


2. ChatGPT是如何工作的?


我们日常接触到的人工智能大致分为两类——决策式和生成式。决策式的典型代表如手机人脸解锁,如果发现拍摄到的人脸与数据库中的人脸数据高度重合,就执行解锁手机的决策;生成式的代表如美颜相机,摄像头拍摄到人脸后,会根据用户的意图进行美化操作,在原有人脸数据的基础上生成一些新内容。ChatGPT属于前沿的生成式AI。首先要理解文本的要求,判断自己的任务,检索相关的内容。最后生成全新的内容,需要预测用户的理解偏好,将回复内容变成流畅的文本。经历了三代模型的进化,ChatGPT才有如今的表现。可能很多小伙伴很好奇,ChatGPT这么厉害,是如何进化的呢?这里就不得不提到工程师们的天才设计。


3. ChatGPT是如何学习进化的?


聊天机器人的工作难点在于对人类语言的理解。人类语言模糊、复杂、多义,还有大量象征、隐喻和联想意义,如何让机器理解呢?工程师们创新性的应用了三步学习法。


第一步:冷启动策略模型。这一步的目的是让系统初步理解人类语言的表达模式,训练方法就是做“填空题”和“选择题”,比如:老王在家里做饭,发现没盐了,他出门向小李借了一点盐,小李最可能是?A、邻居;B、警察;C、儿子。这些题目是开发人员根据各种场景设计的,并会给出正确答案。经过数万次的训练后,让机器慢慢理解人类的意图,并生成各种理解和回答策略。但经过这一步训练后,机器的回答还不够可靠,经常会出现一些文不对题的回答,语言表达上也不够流畅。想要让系统的理解和表达更接近人类,需要它理解人类各种情景下的表达偏好,这就是“奖励模型”。


第二步:训练奖励模型。通过人工反馈的强化学习,让机器的输出内容和人类习惯的输出内容进行比对打分,让系统学会像人类一样表达各种微妙的意思。这一步的具体做法是,先让系统自行生成几个答案,再让开发人员对这些答案的质量进行排序,比如:有人约你吃饭,你不想去,怎么拒绝更委婉?系统通过之前的学习,给出了三个答案:A、谢谢,今晚我有约了;B、今晚不饿,我不想吃饭;C、太不巧了,我今天要加班。对这些答案的质量进行排序:C>A>B,这些排序最终形成一个对答案优劣打分的奖励系统,让机器越来越能预测人类的表达方式。


第三步:自我学习策略。使用第一步的冷启动策略随机生成一段文本,放到第二步的训练奖励策略中进行打分。如果分数高,则将其标注为正确回答,如果分数低,则继续让第一步策略重新生成新文本,反复训练和迭代,最终生成我们现在看到的结果。


4. 如何使用ChatGPT


有三种方法可以使用ChatGPT。第一种方法,申请微软的ChatGPT版必应内测资格。输入网址:https://www.bing.com/new,用微软账户登录。登录后,请求加入新版必应内测。如果申请成功,微软会给你的邮箱发一封申请成功的邮件,等待微软为我们提供内侧资格,这个过程短则几小时,长则数天。申请成功后微软会给我们发送一封通知邮件。我们可以使用手机上的必应应用,或直接在浏览器中访问必应网站:www.bing.com,体验最新版ChatGPT。只要在搜索框中输入问题,系统就会生成一段回答文字。


第二种,使用公众号、小程序或第三方应用。最简单的方法是在微信首页的搜索框中输入ChatGPT,很多公众号和小程序都提供ChatGPT访问功能,除了回答速度较慢外,与直接访问ChatGPT并无太大区别。但通常每日的访问次数有限制,次数用完后可能会要求我们充值。第三方应用可以在网上直接搜索,但有些应用对网络条件也有一定要求,大家可以自行探索。这里提供笔者使用的一个公众号,名称是“都知道大白话”,关注此公众号后,在消息界面会收到一个体验ChatGPT的小程序,点击后在编辑框中输入问题,点击发送,稍等片刻后即可收到回答。


第三种方法是直接登录官网:https://chat.openai.com。需要指出的是,访问该网站需要一定的网络条件,大家可以在网上搜索一下具体的网络要求,本文不再详述。另外,如果想注册ChatGPT,需要有一个能在境外接收短信验证码的手机号。鉴于本文的多数读者都没有境外手机,此处推荐使用接码平台:sms-activate.org。登录该网站后,显示语言默认与系统保持一致。如果为英文,可以用下光标切换到地区选择,用模拟鼠标单击,在弹出的选项中选择China即可。网站的登录按钮没有提示,大家可以切换到“激活”链接,在此处按一次shift加tab反向切换到的无提示链接即为登录。登录后点击OpenAI,继续选择所属地区,可以选择印度或巴西,点击地区后面的图形即可跳转到购物车界面,将该界面上的号码复制下来,粘贴到ChatGPT注册界面的手机号编辑框中,点击发送验证码,回到接码平台查看,将返回的验证码填写到注册界面,完成注册。注册后就可以与ChatGPT聊天了。


由于篇幅限制,先介绍到这里。本文主要介绍了什么是ChatGPT,其工作原理和进化方式,以及使用的三种途径。下期,我们将具体介绍ChatGPT的应用方向,包括描述建筑结构、介绍人体外观、规划旅行路线、撰写简历、总结、辅助文字创作等内容,敬请期待。

发表于:2023-02-24 17:50
14个回复
您还没有登录,登录后才可回复。 登录 注册