【免费】ChatGPT的发展历程、原理、技术架构详解资源-CSDN文库

共1个文件

docx：1个

需积分: 0 43 浏览量更新于2023-04-01 收藏 306KB ZIP 举报

今年12月1日，OpenAI推出了一款名为ChatGPT的人工智能聊天原型，再次引发了人们对于AI技术的热议，也让人们担忧类似于AIGC让艺术家失业的情况是否会再度发生。据报道，在开放试用的短短几天里，ChatGPT便吸引了超过100万互联网注册用户。这款应用在社交网络上更是广受欢迎，许多用户分享了与ChatGPT的有趣对话。有人甚至将ChatGPT比喻为结合搜索引擎和社交软件的完美结合，能够在实时互动的过程中为用户提供最合理的答案。 ChatGPT是一种专注于对话生成的语言模型。通过根据用户的文本输入，产生相应的智能回答，这个回答可以是简短的词语，也可以是长篇大论。其中GPT是Generative Pre-trained Transformer（生成型预训练变换模型）的缩写。 ChatGPT通过学习大量现成文本和对话集合（例如Wiki），能够像人类那样进行即时对话，流畅的回答各种问题，无论是英文还是其他语言（例如中文、韩语等）。ChatGPT的应用场景非常广泛，可以回答历史问题，写故事，甚至撰写商业计划书和行业分析。甚至有程序员通过对话对ChatGPT进行程序修改。

收起资源包目录

ChatGPT的发展历程、原理、技术架构详解.zip （1个子文件）

ChatGPT的发展历程、原理、技术架构详解.docx 329KB

身份认证购VIP最低享 7 折!

30元优惠券

资源推荐

资源预览

资源评论

引言

先上参考网页或论文。专业的读者可以直接看 paper。

ChatGPT: Optimizing Language Models for Dialogue ChatGPT: Optimizing

Language Models for DialogueGPT 论文： Language Models are Few-Shot

Learners Language Models are Few-Shot LearnersInstructGPT 论文：Training

language models to follow instructions with human feedback Training language

models to follow instructions with human feedbackhuggingface 解读 RHLF 算法：

Illustrating Reinforcement Learning from Human Feedback (RLHF) Illustrating

Reinforcement Learning from Human Feedback (RLHF)RHLF 算法论文：

Augmenting Reinforcement Learning with Human Feedback

cs.utexas.edu/~ai-lab/pTAMER 框架论文：Interactively Shaping Agents via

Human Reinforcement cs.utexas.edu/~bradknoxPPO 算法： Proximal Policy

Optimization Algorithms Proximal Policy Optimization Algorithms

今年 12 月 1 日，OpenAI 推出了一款名为 ChatGPT 的人工智能聊天原型，再次引发

了人们对于 AI 技术的热议，也让人们担忧类似于 AIGC 让艺术家失业的情况是否会

再度发生。

据报道，在开放试用的短短几天里，ChatGPT 便吸引了超过 100 万互联网注册用户。

这款应用在社交网络上更是广受欢迎，许多用户分享了与 ChatGPT 的有趣对话。有

人甚至将 ChatGPT 比喻为结合搜索引擎和社交软件的完美结合，能够在实时互动的

过程中为用户提供最合理的答案。

ChatGPT 是一种专注于对话生成的语言模型。通过根据用户的文本输入，产生相应

的智能回答，这个回答可以是简短的词语，也可以是长篇大论。其中 GPT 是

Generative Pre-trained Transformer（生成型预训练变换模型）的缩写。

ChatGPT 通过学习大量现成文本和对话集合（例如 Wiki），能够像人类那样进行即

时对话，流畅的回答各种问题，无论是英文还是其他语言（例如中文、韩语等）。

ChatGPT 的应用场景非常广泛，可以回答历史问题，写故事，甚至撰写商业计划书

和行业分析。甚至有程序员通过对话对 ChatGPT 进行程序修改。

除此之外，ChatGPT 还可以与其他 AIGC 模型联合使用，获得更加炫酷实用的功能。

例如上面通过对话生成客厅设计图。这极大加强了 AI 应用与客户对话的能力，使我

们看到了 AI 大规模落地的曙光。不难想象，随着时间的推移，ChatGPT 的应用场景

会越来越广泛，助力人们更加高效地工作和生活。

ChatGPT 的传承与特点

OpenAI 家族

我们来更详细地了解一下 OpenAI 的背景。

OpenAI 的总部位于旧金山，成立于 2015 年，由特斯拉的马斯克、Sam Altman 及

其他投资者共同创立。该公司的宗旨是开发 AI 技术，造福全人类。值得一提的是，

马斯克在 2018 年因公司发展方向分歧而离开了 OpenAI。

OpenAI 因其推出的 GPT 系列自然语言处理模型而声名大噪。从 2018 年开始，

OpenAI 就开始发布生成式预训练语言模型 GPT（Generative Pre-trained

Transformer），可用于生成各种内容，如文章、代码、机器翻译、问答等。

每一代 GPT 模型的参数量都越来越大，甚至可以说是“越大越好”。2019 年 2 月发布

的 GPT-2 参数量为 15 亿，而 2020 年 5 月的 GPT-3，参数量已经达到了 1750 亿。

GPT 家族主要模型对比

1.2 ChatGPT 的主要特点

ChatGPT 是基于 GPT-3.5（Generative Pre-trained Transformer 3.5）架构开发的对

话 AI 模型。该模型是 InstructGPT 的兄弟模型，具有以下主要特点：

ChatGPT 可以用于收集大量对话数据，这些数据可以帮助开发更高质量、更自然的

对话 AI 模型。因此，ChatGPT 在 GPT-4 正式推出之前可能被用作演练。

与其他 GPT 家族成员相比，ChatGPT 的架构更为先进，可以更好地理解和分析自然

语言文本，并生成更加自然和流畅的回答。

ChatGPT 在对话生成方面表现出色，可以模拟真实对话中的语言风格和语调，并且

可以根据输入的语境和对话历史来生成相应的回答。

ChatGPT 的主要特点：

OpenAI 使用 RLHF（Reinforcement Learning from Human Feedback，人类反馈强

化学习）技术对 ChatGPT 进行了训练，并加入更多的人工监督进行微调。ChatGPT

还具有以下特征：

1）可以主动承认自身错误。若用户指出其错误，模型会听取意见并优化答案。此外，

ChatGPT 可以通过补充更多的信息来丰富回答。

2）ChatGPT 可以质疑不正确的问题。例如被询问“哥伦布 2015 年来到美国的情景”

的问题时，机器人会说明哥伦布不属于这一时代并调整输出结果。此外，ChatGPT

还可以通过提出问题来引导对话，从而进一步加深对话的内容。

3）ChatGPT 可以承认自身的无知，承认对专业技术的不了解，并在回答中提出更

多问题，以进一步理解用户的需求。

4）支持连续多轮对话，并在对话过程中记忆先前使用者的对话讯息，即上下文理解，

以回答某些假设性的问题。这极大地提升了对话交互模式下的用户体验。

与其他智能音箱和“人工智障”不同，ChatGPT 在对话过程中会记忆先前使用者的对

话讯息，以回答某些假设性的问题。ChatGPT 可实现连续对话，极大地提升了对话

交互模式下的用户体验。

对于准确翻译来说（尤其是中文与人名音译），ChatGPT 离完美还有一段距离，不

过在文字流畅度以及辨别特定人名来说，与其他网络翻译工具相近。ChatGPT 也可

以通过请求人工翻译来提高回答的准确性。

由于 ChatGPT 是一个大型语言模型，目前还不具备网络搜索功能，因此它只能基

于 2021 年所拥有的数据集进行回答。例如它不知道 2022 年世界杯的情况，也不会

像苹果的 Siri 那样回答今天天气如何、或帮你搜索信息。如果 ChatGPT 能上网自

己寻找学习语料和搜索知识，估计又会有更大的突破。

即便学习的知识有限，ChatGPT 还是能回答脑洞大开的人类的许多奇葩问题。为了

避免 ChatGPT 染上恶习，ChatGPT 通过算法屏蔽，减少有害和欺骗性的训练输入。

查询通过适度 API 进行过滤，并驳回潜在的种族主义或性别歧视提示。ChatGPT

也可以通过加入更多的训练数据和人工监督来不断改进自己的回答。

ChatGPT/GPT 的原理

NLP

NLP/NLU 领域已知局限包括对重复文本、对高度专业的主题的误解，以及对上下文

短语的误解。

对于人类或 AI，通常需接受多年的训练才能正常对话。NLP 类模型不仅要理解单词

的含义，还要理解如何造句和给出上下文有意义的回答，甚至使用合适的俚语和专

业词汇。

ChatGPT/GPT 的目标是建立一个自然语言处理系统，可以更好地解决现有 NLP/NLU

领域的局限。这个系统可以通过大量的训练数据来提高自己的性能。目前，

ChatGPT/GPT 已经在很多任务上表现出了非常出色的性能，例如问答、对话生成、

文本摘要等。

本质上，作为 ChatGPT 基础的 GPT-3 或 GPT-3.5 是一个超大的统计语言模型或顺

序文本预测模型。它可以被视为是一种自然语言处理技术的进化，它的强大之处

在于它能够自动预测并生成接下来的文字。这种能力是由其庞大的语料库和复杂

的算法所支持的。

GPT v.s.BERT

与 BERT 模型类似，ChatGPT 或 GPT-3.5 都是根据输入语句，根据语言/语料概率

来自动生成回答的每一个字（词语）。从数学或从机器学习的角度来看，语言模

型是对词语序列的概率相关性分布的建模，即利用已经说过的语句（语句可以视

为数学中的向量）作为输入条件，预测下一个时刻不同语句甚至语言集合出现的

概率分布。

然而，GPT-3.5 不同于 BERT 的是，它可以自动扩展其语料库，从而进一步提高

其翻译和生成计算机代码等任务的性能。同时，它还可以自动完成文章摘要和回

答问题等任务。

ChatGPT 是通过强化学习进行训练的。在训练过程中，人类训练者扮演着用户和

人工智能助手的角色，并通过近端策略优化算法进行微调。这种方法通过人类干

预来增强机器学习以获得更好的效果。

由于 ChatGPT 更强的性能和海量参数，它包含了更多的主题的数据，能够处理更

多小众主题。因此，ChatGPT 可以进一步扩大其应用范围，如处理回答问题、撰

写文章、文本摘要、语言翻译和生成计算机代码等任务。此外，ChatGPT 还可以

通过不断学习和训练来提高其性能和应用范围。

本质上，作为 ChatGPT 基础的 GPT-3 或 GPT-3.5 是一个超大的统计语言模型或顺

序文本预测模型。它可以被视为是一种自然语言处理技术的进化，它的强大之处

在于它能够自动预测并生成接下来的文字。这种能力是由其庞大的语料库和复杂

的算法所支持的。

ChatGPT 的技术架构

GPT 家族的演进

说到 ChatGPT，就不得不提到 GPT 家族。

ChatGPT 之前有几个知名的兄弟，包括 GPT-1、GPT-2 和 GPT-3。这

几个兄弟一个比一个个头大，ChatGPT 与 GPT-3 更为相近。

永钊源码

粉丝: 2638
资源: 615

ChatGPT的发展历程、原理、技术架构详解

ChatGPT发展历程、原理、技术架构详解和产业未来.pdf

ChatGPT发展历程原理技术架构详解和产业未来.docx

ChatGPT发展历程、原理、技术架构详解和产业未来.zip

ChatGPT发展历程、原理、技术架构详解和产业未来 （收录于GPT-4_ChatGPT技术与产业分析） - 知乎.pdf

ChatGPT发展历程、原理、技术架构详解和产业未来

详解现象级ChatGPT发展历程、原理、技术架构详解和产业未来y240203.pptx

ChatGPT发展历程、原理、技术架构详解和产业未来.rar

ChatGPT发展历程、原理、技术架构和未来展望（7篇）

ChatGPT发展历程、原理、技术架构详解和产业未来.pdf.zip

ChatGPT发展历程、原理、技术架构详解和产业未来 .pdf

ChatGPT的发展历程、原理、技术架构详解和产业未来！

ChatGPT的发展历程和实现原理

ChatGPT：发展历程、原理、技术架构和产业未来！

17ChatGPT发展历程、原理、技术架构详解和产业未来.zip

ChatGPT技术教程详解.docx

五千字详解chatgpt原理

ChatGPT模型原理介绍

ChatGPT技术的对话驱动学习方法研究.docx

微博技术架构发展历程.pdf

详解内存工作原理及发展历程

豆瓣网技术架构的发展历程

最新资源

ChatGPT发展历程、原理、技术架构详解和产业未来（收录于GPT-4_ChatGPT技术与产业分析） - 知乎.pdf