大语言模型作为AI领域的明星,凭借其强大的语言理解和生成能力,正深刻地改变着人们的生活与工作。其兴起得益于预训练和生成式AI技术的发展,未来将在多领域发挥重要作用,但同时也面临隐私、伦理等挑战。
本书全面介绍大语言模型(Large Language Model,LLM)的前世今生、工作原理、应用实践及未来趋势。全书共4篇:基础篇追溯了大语言模型的起源与兴起,深度揭秘了其工作原理,并对当前现状与研发竞赛进行深入分析,同时展望了其未来发展前景。进阶篇聚焦于模型规模化、提示工程、思维链推理等关键技术,详细介绍了以ChatGPT为代表的大语言模型背后的技术原理,并探讨问答系统在实际应用中的落地实践。高阶篇深入剖析了Transformer架构与预训练模型的核心机制,探讨微调技巧在提升模型性能中的作用,以及大语言模型在多领域的应用实践,同时构建和完善了大语言模型的API生态体系。展望篇探讨了大语言模型如何重塑互联网格局,驱动各行业创新升级及其面临的社会挑战与应对策略,展望了以DeepSeek为代表的大语言模型对未来技术发展与人们生活方式可能带来的深远变革。
本书适合AI从业者、研究人员及对大语言模型感兴趣的读者阅读。
封面
前折页
书名页
版权
序言1
序言2
前言
基础篇 初识大语言模型
1 大语言模型是什么(了解AI时代大语言模型的前世今生)
1.1 大语言模型什么时候突然走进我们的视野
1.2 追溯大语言模型的前世
1.3 预训练模型的兴起:AI进化的方向
1.4 生成式AI时代的到来:大语言模型“TOP-1”
2 大语言模型是如何工作的(解密大语言模型的工作原理)
2.1 大语言模型:放大版的生成式AI
2.2 大语言模型的左膀右臂:微调与提示
2.3 大语言模型+:AI平台时代的到来
2.4 大语言模型生态的繁荣:第三方框架与软件库的持续发展与完善
2.5 开源大语言模型:驱动未来AI腾飞的灵魂
3 深度剖析大语言模型的现状与研发竞赛(企业与科研院所的竞相角逐与创新探索)
3.1 AI技术的持续创新与突破
3.2 加速发展+突破想象力的AI产品不断涌现
3.3 企业:资金与数据的双重驱动
3.4 科研院所:学术与技术的深度融合
3.5 国产大语言模型的开发及竞争的意义
3.6 未来竞争的焦点
3.7 基准测试:揭秘大语言模型的性能密码
进阶篇 与模型互动
4 模型规模化效应:评估模型性能指标(选择适用的模型规模,实现资源优化配置)
4.1 如何衡量模型的规模
4.2 权衡FLOPS与Accuracy
4.3 模型的选择策略
5 语境内学习:利用提示工程有效提升服务(利用提示控制语言模型,推动智能系统的应用)
5.1 走近提示工程
5.2 提示工程驱使语言模型“万能化”
5.3 懂“提示”的AI会“驱逐”程序员吗
5.4 熟悉几种具体的提示形式
6 思维链(CoT)推理:加强文本逻辑和连贯性(提升模型的语言理解和生成水平)
6.1 趣聊思维链推理,让AI更聪明更有逻辑
6.2 巧用思维链,改善LLM推理能力
6.3 提高思维链推理的稳健性
6.4 思考树(ToT):进化版的思维链
7 指令微调器:优化模型在特定任务中的表现(提供高效的智能解决方案)
7.1 有效利用已有的数据集
7.2 与“指令微调”容易混淆的技术
7.3 指令微调存在的问题和挑战
8 人类反馈强化学习:实现个性化和协同学习(利用人类反馈实现模型学习的精准性和个性化,促进人机协同合作)
8.1 强化学习的奖励机制
8.2 奖励标准的考量
8.3 奖励标签能否AI化
9 ChatGPT热潮:深度解析其学习来源和问答精度(探究ChatGPT的学习数据和黑匣子技术,提升人机交互质量)
9.1 LLM的学习数据从哪里来
9.2 LLM通过深度学习提高精度
9.3 LLM生成的文章很自然
9.4 LLM也懂巧妙措辞吗
9.5 LLM的语言风格很文雅
10 问答系统实践:将ChatGPT融入大语言模型应用的领先地位(文档检索模型,实现智能化和个性化应用效果的极致体验)
10.1 问答系统是什么
10.2 问答系统的基本类型
10.3 包含文档检索的问答系统
10.4 将文档检索模型用于专业问答
高阶篇 模型应用与实践
11 深度解析Transformer核心机制:从自注意力机制到文本生成(Transformer推动自然语言处理技术进步)
11.1 Transformer工作原理
11.2 词嵌入,文本的数值化表示
11.3 神经网络中的词嵌入应用
11.4 注意力机制,聚焦关键信息
11.5 趣解Query-Key-Value机制
11.6 Transformer的文本生成能力
12 预训练语言模型解析:GPT、RoBERTa、T5(透视预训练语言模型的丰富表达与跨语言能力)
12.1 文字预测的过程
12.2 GPT:文本生成的鼻祖
12.3 BERT·RoBERTa:文本生成的新思路
12.4 T5:模型融合的全新范式
12.5 模型如何应对多语言任务
12.6 中文处理策略:微观视角的分词
13 模型微调深入分析:揭秘自然语言处理任务(情感分析、自然语言推理、语义相似度和语境多项选择的微调技巧)
13.1 大语言模型擅长的基本任务
13.2 情感分析:本质是文本分类
13.3 自然语言推理:机器理解文本的逻辑思维挑战
13.4 微调与语义相似度的结合:智能的“双重奏”
13.5 多项选择问答:打造智能问答高手
13.6 LoRA微调策略
14 摘要生成:提高信息获取效率的精练技术(探讨如何提高信息获取效率,助力知识传播与创新)
14.1 摘要生成的基本概念
14.2 面向查询VS非面向查询
15 命名实体识别:助力多领域NLP应用的信息提取(深度挖掘文本中有价值的信息,为多领域应用提供强大支持)
15.1 什么是命名实体识别
15.2 有哪些基本任务
15.3 解决任务的基本方法
16 语句嵌入:优化文本处理与理解技术(发掘语句嵌入的应用潜力,提升智能系统的服务能力)
16.1 什么是语句嵌入
16.2 解锁语义相似度计算,赋能智能问答
17 大语言模型API框架生态:打造智能应用部署新范式(基于RAG、LangChain和分布式的创新工具与生态系统建设)
17.1 为什么要重视API框架生态
17.2 RAG:结合信息检索的方法创新
17.3 RAG对大语言模型进化的影响
17.4 LangChain登场:智链地球村
17.5 LlamaIndex:轻松打造个性化问答聊天
17.6 LM Studio:你的私人AI实验室
17.7 分布式学习:多GPU与多节点训练
展望篇 迎接大语言模型
18 大语言模型对未来互联网的影响(大语言模型技术将推动新一代技术平台的形成)
18.1 新一代技术平台的构建
18.2 互联网交互体验的重塑
19 大语言模型在各行业的应用前景(大语言模型在医疗、金融、教育等垂直行业的创新应用和潜力)
19.1 医疗与AI跨越式融合与创新
19.2 AI病理诊断与未来健康
19.3 AI走近焦虑抑郁防线
19.4 AI为下一代教育提供有效建议
19.5 AI无雇员超市的兴起
19.6 AI语音产品与人类的积极互动
20 大语言模型时代的社会挑战与应对(大语言模型应用可能带来隐私安全、社会伦理与公平等问题)
20.1 不是所有的数据都有权获取
20.2 不能因为是AI就与伦理无关
20.3 AI可以涉足“公平性”任务吗
21 大语言模型技术的发展趋势(展望大语言模型未来的技术突破)
21.1 AI监控街道交通真的很有效吗
21.2 AI解析通缉犯特征
22 大语言模型对人类生活的影响(大语言模型技术如何改变人们的日常生活、工作、交流方式)
23 深探智能:DeepSeek大模型技术的新里程(引领中文AI新纪元,开启人机共生新篇章)
23.1 破茧而出:DeepSeek的诞生背景
23.2 智芯跃迁:技术解码与创新突破
23.3 智启未来:应用图景与社会影响
参考文献
后折页
封底
机械工业出版社 京icp备14043556号-1 (署)网出证(京)字第214号 Copyright (C) 2001 CmpBook. All Rights Reserved