本书是一本AI智能体(AI Agent)应用与开发的实用手册。共分6章:认识AI Agent、各具特色的AI Agent平台、用好AI Agent的关键——提示词(Prompt)、玩转AI Agent、基于AI平台定制AI Agent、基于开发工具定制企业级AI Agent。无论技术背景如何,通过本书清晰的指导和丰富的实践案例,依照书中提供的学习路径,读者都能快速掌握AI Agent基本概念和实践技巧,快速上手AI Agent。
本书是智能化的读物,特别配备了名为“才兔”的专属AI Agent,可辅助读者学习阅读,增强用户体验和学习效果。
封面
前折页
书名页
版权
前言
第1章 认识AI Agent
1.1 什么是AI Agent
1.1.1 AI Agent:AI时代的App
1.1.2 AI Agent的演进:从专家系统到GPT大模型
1.1.3 AI Agent初体验
1.2 AI Agent的基本原理
1.2.1 AI Agent的功能范式
1.2.2 AI Agent的核心能力:感知、决策、执行
1.2.3 AI Agent如何“思考”:从提示词到数据反馈
1.2.4 AI Agent如何“执行”:AI如何根据决策实施行动
1.3 AI Agent的分类
1.3.1 按创意性分类
1.3.2 按功能分类
1.3.3 按角色分类
1.3.4 按照任务分类
1.3.5 按照应用场景分类
1.3.6 按照交互方式分类
1.3.7 按自定义的实现方式分类
1.4 为什么AI Agent特别重要
1.4.1 AI应用的发展方向
1.4.2 AI产业的下一个风口
1.4.3 发挥AI效能的最佳形式
1.4.4 AI Agent将重构所有软件
1.4.5 未来AI Agent的终极形态
第2章 各具特色的AI Agent平台
2.1 DeepSeek:强大的推理型AI Agent
2.1.1 网页访问DeepSeek
2.1.2 App访问DeepSeek
2.1.3 DeepSeek的特色功能
2.2 文心一言(百度):多功能的AI平台
2.2.1 访问和使用文心一言
2.2.2 文心一言的“智能体广场”
2.2.3 文心一言的AI Agent开发平台
2.3 ChatGPT:AI Agent平台先导者
2.3.1 访问和使用ChatGPT
2.3.2 ChatGPT的功能特色
2.3.3 GPTs:OpenAI的AI Agent市场
2.4 微软Azure OpenAI:企业级AI Agent开发与服务平台
2.4.1 访问和使用Azure OpenAI
2.4.2 Azure OpenAI Service的特色功能
2.5 元宝(腾讯):小程序中可快速使用的AI平台
2.5.1 访问和使用元宝
2.5.2 元宝的特色功能
2.5.3 元宝应用广场
2.6 可灵AI(快手):AI媒体创意平台
2.6.1 访问和使用可灵AI
2.6.2 可灵AI的特色功能
2.7 豆包(字节跳动):个人超级助手
2.7.1 访问和使用豆包
2.7.2 豆包的特色功能
2.7.3 使用豆包快速创建AI Agent
2.8 ChatU(软积木):基于混合模型的企业级AI Agent平台
2.8.1 访问和使用ChatU
2.8.2 ChatU的特色功能
2.9 扣子(字节跳动):支持快速部署的AI Agent应用开发平台
2.9.1 访问和使用扣子
2.9.2 扣子的特色功能
2.10 紫东太初:专为企业打造的AI应用开发平台
2.10.1 访问和使用紫东太初
2.10.2 紫东太初的特色功能
第3章 用好AI Agent的关键——提示词(Prompt)
3.1 提示词是什么
3.1.1 提示词的作用:与AI Agent交流的根本手段
3.1.2 提示词的基本构成:工作指令、上下文和输出限定
3.1.3 提示词的重要性:天差地别的AI反馈
3.2 提示词的编写要点
3.2.1 工作指令的编写要点
3.2.2 复杂任务指令的构建策略
3.2.3 控制提示词的知识范围
3.2.4 限定提示词的输出格式
3.3 提示词的调优五步法
3.3.1 总体要求
3.3.2 任务详情
3.3.3 输出格式
3.3.4 示例
3.3.5 注意事项
3.3.6 按照调优五步法生成新的提示词
3.4 设计有效提示词
3.4.1 使用角色扮演
3.4.2 使用提示词框架
3.4.3 使用工具优化提示词
3.4.4 使用魔法语句
3.5 提示词的场景化应用
3.5.1 创作型场景:文案生成与脚本写作
3.5.2 分析型场景:数据总结与报告生成
3.5.3 高效沟通型场景:邮件编写与翻译助手
3.5.4 音乐生成场景:歌词处理
3.5.5 图片生成场景:生成图像的提示词
3.5.6 强化自我学习场景:任意知识的自学助理
第4章 玩转AI Agent
4.1 应用AI Agent高效办公
4.1.1 自动生成PPT大纲、数据报告与工作总结
4.1.2 快速整理会议纪要、翻译文档
4.1.3 内容创作与优化
4.1.4 3D模型生成
4.2 应用AI Agent进行商业决策
4.2.1 推理型AI Agent:零成本的顶级咨询顾问
4.2.2 Multi-Agent:多角色头脑风暴智能体
4.3 应用AI Agent实现自动操作
4.3.1 利用AI Agent自动监视高拍仪,识别内容自动入库
4.3.2 利用AI Agent进行任意Windows操作
4.4 应用AI Agent操作物理实体
4.4.1 Tesla的类人型机器人:Optimus
4.4.2 小米的类人型机器人:CyberOne
4.4.3 Tesla的自动驾驶系统
4.5 应用通用型AI Agent Manus完成任务
4.5.1 Manus的特性
4.5.2 应用Manus执行任务
4.5.3 Manus的发展前景
第5章 基于AI平台定制AI Agent
5.1 定制AI Agent的四个原则
5.1.1 原则一:生产力至上
5.1.2 原则二:成本考量
5.1.3 原则三:注重便利性
5.1.4 原则四:注重用户体验
5.2 定制AI Agent的五个步骤
5.2.1 明确需求
5.2.2 根据需求选择不同能力的大模型
5.2.3 根据需求选择不同平台的插件能力
5.2.4 编写提示词
5.2.5 参数调试
5.3 基于AI平台定制你的AI Agent
5.3.1 使用“扣子”平台定制高等数学助手
5.3.2 使用“ChatU”平台定制精美海报助手
5.3.3 使用“豆包”平台定制小红书文案助手
5.3.4 使用“文心一言”平台定制公文写作助手
5.3.5 使用“ChatU”平台定制Excel可视化助手
5.3.6 使用“ChatU”平台定制俄罗斯方块游戏
第6章 基于开发工具定制企业级AI Agent
6.1 基于开发者的开发框架和平台推荐
6.1.1 Azure AI:通用型AI开发的佼佼者
6.1.2 Ollama:本地运行任意开源模型的框架
6.1.3 Hugging Face:模型开源与快速部署
6.1.4 LangChain:面向开发者的任务流框架
6.1.5 Semantic Kernel:大模型高效开发工具包
6.2 必备的大模型能力
6.2.1 能力一:Azure文档智能
6.2.2 能力二:Azure的沙箱代码解释器
6.3 当前流行的RAG库
6.3.1 知识图谱:GraphRAG
6.3.2 知识库:LightRAG
6.4 开发一个企业级AI Agent:基于Azure OpenAI
6.4.1 基本需求
6.4.2 服务器端:接入大模型
6.4.3 客户端:完成简单的对话逻辑
6.4.4 集成多模态能力:构建可以通过图片进行数据分析的AI Agent
6.4.5 集成代码解释器:增强AI Agent的功能
6.4.6 开发一个可视化数据分析AI Agent
6.4.7 开发食品标签批量智能检测AI Agent
6.5 开发本地运行的AI Agent:基于Ollama+DeepSeek
6.5.1 集成推理能力:通过Ollama调用DeepSeek-R1
6.5.2 通过Ollama开发公司内部知识库智能体
6.5.3 为智能体增加记忆能力
6.5.4 通过Ollama与UFO结合实现全自动RPA
后折页
封底
机械工业出版社 京icp备14043556号-1 (署)网出证(京)字第214号 Copyright (C) 2001 CmpBook. All Rights Reserved