没有合适的资源?快使用搜索试试~ 我知道了~
20230210-德邦证券-传媒行业AIGC专题一:探析AIGC的技术发展和应用.pdf
试读
20页
需积分: 0 3 下载量 25 浏览量
更新于2023-07-30
收藏 2.18MB PDF 举报
20230210-德邦证券-传媒行业AIGC专题一:探析AIGC的技术发展和应用.pdf
请务必阅读正文之后的信息披露和法律声明
[Table_Main]
证券研究报告 | 行业专题
传媒
2023 年 02 月 10 日
传媒
优于大市(维持)
证券分析师
马笑
资格编号:S0120522100002
邮箱:maxiao@tebon.com.cn
研究助理
市场表现
相关研究
1.《传媒互联网行业周报:ChatGPT
加速商业化,AIGC 或带来泛娱乐和
互联网的革新》,2023.2.5
2.《分众传媒(002027.SZ)首次覆
盖报告:当风轻借力,一举入高空》,
2023.2.1
3.《腾讯控股(0700.HK)22Q4 业绩
前瞻及观点更新:宏观经济波动致收
入端承压,降本增效成果释放带来利
润端高增速》,2023.1.31
4.《百度集团-SW(9888.HK)22Q4
及 2022 年全年业绩前瞻:疫情扰动
或致经营短期承压,展望后续收入业
绩双端修复》,2023.1.30
5.《春节档期票房超 65 亿,行业持
续 复 苏 估 值 业 绩 双 升 可 期 》,
2023.1.28
AIGC 专题一:探析 AIGC 的技术发
展和应用
[Table_Summary]
投资要点:
AIGC 成为新的内容生产方式,跨模态生成值得重点关注。区别于 PGC 与 UGC,
AIGC 是利用人工智能技术自动生成内容的新型生产方式。按照模态区分,AIGC
可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态
生成,细分场景众多,其中,跨模态生成需要重点关注。
自然语言处理(NLP)赋予了 AI 理解和生成能力,大规模预训练模型是 NLP 的发
展趋势。NLP 的两个核心任务分别是自然语言理解(NLU)和自然语言生成(NLG)。
以 ELMo、BERT、GPT 为代表的预训练模型,降低了 NLP 的技术门槛。ELMo 解
决了“一词多义”的问题;BERT 通过 MLM(类似于完形填空)和 NLP(判断句
子是否相连)进行预训练,增强了上下文的理解能力。GPT 通过预测下一个词,
获得了生成能力;GPT-3 在此基础上使用了更大的数据和更大模型,无需针对下游
任务进行传统的微调,并且采用了小样本学习提升生成效果。
ChatGPT 是 NLP 发展中具有里程碑式意义的模型之一。ChatGPT 是 OpenAI 从
GPT-3.5 系列中的模型进行微调产生的聊天机器人模型。它能够通过学习和理解人
类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交
流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。
生成模型赋予了 AI 创造力,扩散模型是最前沿的技术之一。AIGC 的快速发展归
功于生成算法领域的技术积累。GAN 的核心思想是“生成”与“对抗”,相比传统
的深度神经网络,GAN 能产生更好的生成样本,但是仍需解决应用中的问题。扩
散模型较 GAN 更接近人的思维模式,是基于马尔科夫链,通过学习噪声来生成数
据。扩散模型实现了跨模态应用,包括 OpenAI 的 GLIDE 和 DALL·E 2、谷歌的
Imagen、Stability AI 的 Stable Diffusion 等。
人工智能由单模态智能,向多种模态融合方向发展。建立统一的、跨场景、多任务
的多模态基础模型或将成为人工智能发展的主流趋势之一。CLIP 模型将语言信息
和图像信息联合训练,能够链接文本和图片,成为跨模态生成应用的一个重要节点,
“CLIP+其他模型”在跨模态生成领域成为一种较为通用的做法。2022 年,微软
提出的 BEiT-3 多模态基础模型,在视觉-语言任务处理上具备出色表现,包括视觉
问答、图片描述生成和跨模态检索等。多模态提高了基础模型的灵活性,使其在其
他模态的应用中发挥新的潜质。
未来,值得关注的技术要素包括:长文本生成、开放式文本生成、NeRF 模型、扩
散模型、跨模态大型预训练模型(支持的模态数据类型、模态对齐架构设计、支持
的下游应用)、小样本学习及自监督算法、强化学习及环境学习等。
投资建议:把握 AIGC 技术催化和商业落地的投资机会。技术发展有望促进生产效
率提升,并进一步创造新的消费和需求,有利于文娱内容和互联网行业。在 AIGC
和 ChatGPT 方面,我们建议持续关注技术发展和应用情况,把握技术催化和商业
化落地带来的投资机会:1)具备 AIGC 和 ChatGPT 的技术探索和应用的公司:
百度集团-SW、商汤-W、万兴科技、拓尔思等;2)具有海量内容素材且具有 AIGC
探索布局的,图片/文字/音乐/视频内容及平台公司腾讯控股,阅文集团、美图公司、
视觉中国、中文在线、汉仪股份、昆仑万维、天娱数科、风语筑等。
风险提示:技术发展不及预期、监管政策变化、知识产权相关问题等。
-29%
-24%
-20%
-15%
-10%
-5%
0%
5%
2022-02 2022-06 2022-10
沪深300
行业专题 传媒
2 / 20 请务必阅读正文之后的信息披露和法律声明
内容目录
1. AIGC 的跨模态生成值得重点关注 ................................................................................ 5
2. 基于大模型预训练的 NLP 赋予了 AI 理解和生成能力 ................................................. 5
2.1. ELMo 将输出的词向量作为特征,解决了“一词多义” ........................................... 7
2.2. BERT 通过上下文预训练,提高了理解能力 ........................................................ 8
2.3. GPT-3 利用超大数据和超大模型,省去了微调的过程 ......................................... 9
2.3.1. ChatGPT 趋近人类价值观及意图,有望进一步商业化 ............................. 11
3. 基于大模型的主流生成模型赋予了 AI 创造力 ............................................................ 12
3.1. GAN 是基于“生成”与“对抗”提出的生成模型 ....................................................... 13
3.2. 扩散模型更接近人的思维模式,实现了跨模态应用 .......................................... 13
3.2.1. 扩散模型实现了从文本到图像的跨模态应用 ............................................. 14
4. 人工智能由单模态智能,向多种模态融合方向发展 ................................................... 16
5. AIGC 技术不断发展,有望带来更多商业化价值 ........................................................ 16
6. 投资建议:把握 AIGC 技术催化和商业落地的投资机会 ............................................ 18
7. 风险提示 .................................................................................................................... 19
dWdVeYPBpPtQ6M9R7NsQoOpNpMjMmMnPeRoPmObRtRtRvPqMnMxNqRuN
行业专题 传媒
3 / 20 请务必阅读正文之后的信息披露和法律声明
图表目录
图 1:内容生产模式的四个发展阶段 ................................................................................ 5
图 2:自然语言处理的发展历史 ....................................................................................... 6
图 3:大规模预训练模型大幅提升研发效率 ..................................................................... 6
图 4:BERT 的每一层都是双向模型;GPT 为单向模型;ELMo 为单项模型叠加 ........... 7
图 5:大规模预训练语言模型的发展趋势之一是参数量不断增加 .................................... 7
图 6:ELMo 基于 RNN,双向 RNN 可以利用前后文信息................................................ 8
图 7:ELMo 将词嵌入作加权和,给出最终的词向量 ....................................................... 8
图 8:ELMo 解决了一词多义问题,且兼顾语义与词性 ................................................... 8
图 9:BERT 的结构是 Transformer 中的 Encoder 部分 ................................................... 9
图 10:BERT 采用了预训练+微调的两阶段模型 .............................................................. 9
图 11:NSP 任务中输入向量生成示意图 ......................................................................... 9
图 12:GPT 模型结构 .................................................................................................... 10
图 13:GPT-3 将例子直接作为模型输入 ........................................................................ 10
图 14:Few Shot 较 Zero Shot 在模型增大后表现提升更显著 ...................................... 10
图 15:GPT-3.5 的进化树 .............................................................................................. 11
图 16:RLHF 工作原理 .................................................................................................. 11
图 17:ChatGPT 的训练模式 ......................................................................................... 11
图 18:ChatGPT 能够进行对话,甚至能完成撰写代码 ................................................. 12
图 19:ChatGPT 上线 2 个月后月度用户数量破 1 亿 .................................................... 12
图 20:OpenAI 推出付费订阅项目 ChatGPT Plus,价格$20/月 ................................... 12
图 21:不同生成模型之间的区别 ................................................................................... 13
图 22:GAN 的基本思想 ................................................................................................ 13
图 23:训练后的 GAN 生成案例 .................................................................................... 13
图 24:Diffusion Model 基于马尔科夫链,通过学习噪声来生成数据 ............................ 14
图 25:GLIDE 可以进行文本到图像的生成 .................................................................... 14
图 26:GLIDE 可以执行图像修复 .................................................................................. 14
图 27:unCLIP 模型示意图 ............................................................................................ 15
图 28:DALL·E 2 的生成案例 ........................................................................................ 15
图 29:Image 的架构示意图 .......................................................................................... 15
图 30:Image 的生成案例 .............................................................................................. 15
图 31:Stable Diffusion 生成效果 .................................................................................. 16
图 32:Stable Diffusion 2.0 引入了图像深度扩散模型 ................................................... 16
行业专题 传媒
4 / 20 请务必阅读正文之后的信息披露和法律声明
图 33:AIGC 相关技术场景及成熟度分类 ...................................................................... 17
表 1:ELMo、BERT 与 GPT 系列的对比 ........................................................................ 6
表 2:国外主要 AIGC 预训练模型一览表 ....................................................................... 17
表 3:部分公司在 AIGC 领域的布局(截至 2023/2/6) .................................................. 18
剩余19页未读,继续阅读
资源推荐
资源评论
2023-06-05 上传
132 浏览量
5星 · 资源好评率100%
157 浏览量
2023-07-30 上传
2021-08-24 上传
2023-07-30 上传
2023-11-14 上传
5星 · 资源好评率100%
151 浏览量
2023-11-14 上传
189 浏览量
2023-06-06 上传
2024-08-12 上传
2023-08-07 上传
187 浏览量
184 浏览量
资源评论
2301_76429513
- 粉丝: 15
- 资源: 6728
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- chromedriver-win64_134.0.6944.2.zip
- chromedriver-win64_134.0.6944.0.zip
- chromedriver-win64_133.0.6943.6.zip
- chromedriver-win64_134.0.6945.2.zip
- chromedriver-win64_134.0.6945.0.zip
- chromedriver-win64_134.0.6946.0.zip
- SpringBoot天气预报小程序
- chromedriver-win64_134.0.6947.0.zip
- chromedriver-win64_134.0.6949.0.zip
- chromedriver-win64_134.0.6948.0.zip
- chromedriver-win64_134.0.6952.0.zip
- chromedriver-win64_134.0.6953.0.zip
- chromedriver-win64_134.0.6950.0.zip
- chromedriver-win64_134.0.6954.0.zip
- chromedriver-win64_134.0.6956.0.zip
- chromedriver-win64_134.0.6955.0.zip
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功