
引言
先上参考网页或论文。专业的读者可以直接看 paper。
ChatGPT: Optimizing Language Models for Dialogue ChatGPT: Optimizing
Language Models for DialogueGPT 论 文 : Language Models are Few-Shot
Learners Language Models are Few-Shot LearnersInstructGPT 论文:Training
language models to follow instructions with human feedback Training language
models to follow instructions with human feedbackhuggingface 解读 RHLF 算法:
Illustrating Reinforcement Learning from Human Feedback (RLHF) Illustrating
Reinforcement Learning from Human Feedback (RLHF)RHLF 算 法 论 文 :
Augmenting Reinforcement Learning with Human Feedback
cs.utexas.edu/~ai-lab/pTAMER 框架论文:Interactively Shaping Agents via
Human Reinforcement cs.utexas.edu/~bradknoxPPO 算 法 : Proximal Policy
Optimization Algorithms Proximal Policy Optimization Algorithms
今年 12 月 1 日,OpenAI 推出了一款名为 ChatGPT 的人工智能聊天原型,再次引发
了人们对于 AI 技术的热议,也让人们担忧类似于 AIGC 让艺术家失业的情况是否会
再度发生。
据报道,在开放试用的短短几天里,ChatGPT 便吸引了超过 100 万互联网注册用户。
这款应用在社交网络上更是广受欢迎,许多用户分享了与 ChatGPT 的有趣对话。有
人甚至将 ChatGPT 比喻为结合搜索引擎和社交软件的完美结合,能够在实时互动的
过程中为用户提供最合理的答案。
ChatGPT 是一种专注于对话生成的语言模型。通过根据用户的文本输入,产生相应
的智能回答,这个回答可以是简短的词语,也可以是长篇大论。其中 GPT 是
Generative Pre-trained Transformer(生成型预训练变换模型)的缩写。
ChatGPT 通过学习大量现成文本和对话集合(例如 Wiki),能够像人类那样进行即
时对话,流畅的回答各种问题,无论是英文还是其他语言(例如中文、韩语等)。
ChatGPT 的应用场景非常广泛,可以回答历史问题,写故事,甚至撰写商业计划书
和行业分析。甚至有程序员通过对话对 ChatGPT 进行程序修改。
除此之外,ChatGPT 还可以与其他 AIGC 模型联合使用,获得更加炫酷实用的功能。
例如上面通过对话生成客厅设计图。这极大加强了 AI 应用与客户对话的能力,使我
们看到了 AI 大规模落地的曙光。不难想象,随着时间的推移,ChatGPT 的应用场景
会越来越广泛,助力人们更加高效地工作和生活。