高级检索结果页
欢迎来到工程科技数字图书馆
登录 | 注册
 
您当前的位置:图书 > 存储网络中拥塞的检测、排查和预防

存储网络中拥塞的检测、排查和预防

相关推荐

本书是构建高效率的存储网络和快速解决拥塞问题的完整实用指南。本书首先介绍了存储网络拥塞,其次讨论了光纤通道结构中的拥塞及其检测、故障排除和预防,以及如何通过存储I/O性能监控解决拥塞,然后研究了以太网和TCP存储网络中的拥塞管理,最后阐述了思科UCS服务器中的拥塞管理。通过案例研究,本书介绍了作者多年经验的行之有效的故障排除方法,以及用于监控存储结构和获得预测性信息的分析技术,以检测大规模存储网络中的拥塞。

封面
前折页
书名页
版权
译者序
推荐序
前言
献辞
致谢
关于技术审稿人
第1章 存储网络中的拥塞简介
 1.1 数据中心的存储类型
  1.1.1 基于位置的存储类型
  1.1.2 基于访问级别的存储类型
 1.2 存储协议、传输和网络
  1.2.1 基于帧格式和编码的网络类型
  1.2.2 基于流量控制使用情况的网络类型
  1.2.3 跨越网络类型的边界
  1.2.4 网络层之上
  1.2.5 再次跨越网络类型的边界
 1.3 存储网络
  1.3.1 存储网络架构
  1.3.2 术语
  1.3.3 光纤通道和FCoE术语
  1.3.4 存储的选择
  1.3.5 存储网络的选择
  1.3.6 存储流量的专用网络与共享网络
  1.3.7 存储网络的常见问题
 1.4 存储网络中的拥塞概述
  1.4.1 拥塞扩散
  1.4.2 存储网络中拥塞的原因
  1.4.3 存储网络中拥塞的来源
  1.4.4 存储网络中拥塞的常见问题
 1.5 NVMe-oF
 1.6 QoS
  1.6.1 网络延迟的来源
  1.6.2 存储网络中QoS的常见问题
 1.7 本章小结
 1.8 参考文献
第2章 理解光纤通道网络中的拥塞
 2.1 光纤通道流量控制
  2.1.1 B2B信用的初始传递
  2.1.2 帧流期间的B2B信用返回
  2.1.3 多跳网络中的B2B流量控制
 2.2 光纤通道网络中的拥塞扩散
  2.2.1 慢速设备导致的拥塞
  2.2.2 过度利用导致的拥塞
  2.2.3 比较慢排空和过度利用导致的拥塞
  2.2.4 单交换机网络中的拥塞
  2.2.5 ISL中的拥塞
  2.2.6 缓冲和吸收拥塞的能力
 2.3 光纤通道交换机内的帧流
  2.3.1 思科MDS交换机内的帧交换
  2.3.2 光纤通道交换机的帧交换架构
 2.4 比特差错对拥塞的影响
  2.4.1 光纤通道帧格式
  2.4.2 光纤通道分层
  2.4.3 光纤通道上的数据传输
  2.4.4 光纤通道端口上的计数器
  2.4.5 案例研究:一家在线零售商
  2.4.6 比特差错对拥塞的影响总结
 2.5 B2B信用的丢失与恢复
  2.5.1 比特差错导致的发送B2B信用丢失
  2.5.2 零remaining-Tx-B2B-credits持续较长时间
  2.5.3 通过B2B状态变更机制实现信用丢失恢复
  2.5.4 通过链路重置协议实现信用丢失恢复
  2.5.5 B2B状态变更机制与链路重置协议的比较
 2.6 光纤通道计数器总结
 2.7 本章小结
 2.8 参考文献
第3章 检测光纤通道网络中的拥塞
 3.1 拥塞检测工作流程
  3.1.1 拥塞的影响(拥塞严重程度)
  3.1.2 拥塞的原因
  3.1.3 拥塞的源头(肇事者)
  3.1.4 拥塞的扩散(受害者)
  3.1.5 拥塞事件的时间
  3.1.6 如何检测拥塞
  3.1.7 何处检测拥塞
  3.1.8 拥塞方向:入口或出口
 3.2 拥塞检测指标
 3.3 思科MDS交换机的拥塞检测指标
  3.3.1 发送信用不可用时间(μs):TxWait
  3.3.2 接收信用不可用时间(μs):RxWait
  3.3.3 发送信用不可用持续时间(ms):Slowport-monitor
  3.3.4 发送信用不可用持续时间(100 ms):Tx-credit-not-available
  3.3.5 TxWait、Slowport-monitor和Tx-credit-not-available之间的差异
  3.3.6 何时启用Slowport-monitor
  3.3.7 接收信用不可用持续时间(100 ms):Rx-credit-not-available
  3.3.8 超时丢弃
  3.3.9 发送信用丢失恢复
  3.3.10 链路故障:链路重置失败,接收队列非空(LR Rcvd B2B)
  3.3.11 信用和剩余信用
  3.3.12 信用降至零
  3.3.13 链路利用率
  3.3.14 比特差错
 3.4 自动警报
 3.5 使用远程监控平台检测拥塞
  3.5.1 NDFC拥塞和慢排空分析
  3.5.2 MDS流量监控应用程序
  3.5.3 指标导出机制
  3.5.4 监控网络流量的陷阱
 3.6 检测慢排空和过度利用导致的拥塞
 3.7 同时出现慢排空和过度利用
 3.8 检测长距链路上的拥塞
 3.9 本章小结
 3.10 参考文献
第4章 排查光纤通道网络中的拥塞
 4.1 排查方法与工作流程
  4.1.1 拥塞的严重程度和级别
  4.1.2 排查的目标
  4.1.3 方法
 4.2 排查拥塞的提示与技巧
  4.2.1 首先排查较高级别的拥塞
  4.2.2 使用show tech-support slowdrain命令
  4.2.3 时钟同步和时序考量
  4.2.4 超时丢弃异常
  4.2.5 启用和使用自动警报功能
  4.2.6 使用远程监控平台(NDFC或DCNM)
 4.3 排查拥塞的思科MDS NX-OS命令
  4.3.1 show interface命令
  4.3.2 show interface counters [detailed]命令
  4.3.3 show interface txwait-history |rxwait-history命令
  4.3.4 OBFL命令:show logging onboard
  4.3.5 常用排查命令
  4.3.6 系统消息:show logging log
 4.4 案例研究1:在单交换机网络中寻找拥塞的肇事者和受害者
  4.4.1 网络A分析
  4.4.2 网络B分析
  4.4.3 肇事者分析
  4.4.4 受害者分析
  4.4.5 案例研究1总结
 4.5 案例研究2:信用丢失恢复导致帧丢弃
  4.5.1 初步调查
  4.5.2 网络A分析
  4.5.3 网络B分析
  4.5.4 肇事者分析
  4.5.5 受害者分析
  4.5.6 案例研究2总结
 4.6 案例研究3:单一设备的过度利用导致严重拥塞
  4.6.1 3级
  4.6.2 2级
  4.6.3 肇事者分析
  4.6.4 受害者分析
  4.6.5 案例研究3总结
 4.7 案例研究4:长距ISL导致拥塞
  4.7.1 3级
  4.7.2 2级
  4.7.3 1.5级
  4.7.4 肇事者分析
  4.7.5 受害者分析
  4.7.6 案例研究4总结
 4.8 本章小结
 4.9 参考文献
第5章 通过存储I/O性能监控解决拥塞
 5.1 为什么要监控存储I/O性能
 5.2 如何以及在何处监控存储I/O性能
  5.2.1 主机中的存储I/O性能监控
  5.2.2 存储阵列中的存储I/O性能监控
  5.2.3 网络中的存储I/O性能监控
 5.3 思科SAN分析架构
  5.3.1 流量检查
  5.3.2 指标计算
  5.3.3 指标导出
 5.4 理解存储网络中的I/O流
  5.4.1 光纤通道网络中的I/O流
  5.4.2 I/O流与I/O操作
 5.5 I/O流指标
  5.5.1 延迟指标
  5.5.2 性能指标
 5.6 I/O操作和网络流量模式
  5.6.1 光纤通道网络中的读I/O操作
  5.6.2 光纤通道网络中的写I/O操作
  5.6.3 网络流量方向
  5.6.4 网络流量吞吐量
  5.6.5 I/O操作、流量模式和网络拥塞的相关性
  5.6.6 案例研究1:一家贸易公司通过SAN分析预测了拥塞问题
  5.6.7 案例研究2:一所大学通过纠正多路径配置错误避免了拥塞问题
  5.6.8 案例研究3:一家能源公司成功解决了拥塞问题
  5.6.9 案例研究4:一家银行通过基础设施优化解决了拥塞问题
 5.7 本章小结
 5.8 参考文献
第6章 预防光纤通道网络中的拥塞
 6.1 消除或减少拥塞概述
  6.1.1 定义方法的结果
  6.1.2 手动与自动方法的对比
 6.2 链路容量
 6.3 通过断开肇事设备实现拥塞恢复
  6.3.1 断开肇事设备的考虑因素
  6.3.2 如何断开连接
 6.4 通过丢弃帧实现拥塞恢复
  6.4.1 根据在交换机中的存留时间丢弃帧
  6.4.2 根据边缘端口的慢排空丢弃帧
 6.5 流量隔离
  6.5.1 分类流量以实现隔离
  6.5.2 将流量隔离至专用ISL
  6.5.3 案例研究:一家银行通过流量隔离避免了拥塞
  6.5.4 使用虚拟链路进行流量隔离
  6.5.5 流量隔离的考虑因素
 6.6 在存储阵列上使用限速器预防拥塞
 6.7 在交换机上使用动态入口速率限制预防拥塞
  6.7.1 DIRL如何预防拥塞
  6.7.2 DIRL的优势
  6.7.3 启用和使用思科MDS交换机上的DIRL
  6.7.4 DIRL的效果
  6.7.5 DIRL与其他方法的比较
 6.8 通过向终端设备发送通知预防拥塞
  6.8.1 光纤通道网络中通知和信号的准备情况
  6.8.2 光纤通道网络中的通知和信号
  6.8.3 RDF、EDC、FPIN和拥塞信号的示例
  6.8.4 对比拥塞预防方法:使用DIRL与通知终端设备
 6.9 网络设计的考虑因素
  6.9.1 降低存储端口的链路速率
  6.9.2 边缘-核心-边缘、边缘-核心或折叠核心设计
  6.9.3 在单个交换机上增加流量本地化
  6.9.4 将大型网络分成较小的孤岛网络
 6.10 本章小结
 6.11 参考文献
第7章 以太网存储网络中的拥塞管理
 7.1 以太网流量控制
  7.1.1 以太网流量控制原理
  7.1.2 以太网暂停帧与光纤通道B2B信用的比较
  7.1.3 优先级流量控制
  7.1.4 融合以太网
  7.1.5 配置无损以太网
  7.1.6 专用和融合以太网
 7.2 理解无损以太网中的拥塞
  7.2.1 无损以太网中的慢排空
  7.2.2 无损以太网中的链路过度利用
  7.2.3 比特差错
  7.2.4 单交换机无损以太网中的拥塞扩散
  7.2.5 边缘-核心无损以太网中的拥塞扩散
  7.2.6 无损脊叶网络中的拥塞扩散
 7.3 检测无损以太网中的拥塞
  7.3.1 拥塞方向:入口或出口
  7.3.2 拥塞检测指标
  7.3.3 存储I/O性能监控
  7.3.4 在远程监控平台上检测拥塞
 7.4 排查无损以太网中的拥塞
  7.4.1 目标
  7.4.2 拥塞的严重程度和级别
  7.4.3 方法
  7.4.4 排查脊叶拓扑中的拥塞
  7.4.5 实际效果验证
  7.4.6 使用远程监控平台排查拥塞
  7.4.7 同一网络中的FC和FCoE
  7.4.8 同一链路上的多个无损类别
  7.4.9 无损流量和有损流量之间的带宽分配
 7.5 预防无损以太网中的拥塞
  7.5.1 消除或减少拥塞概述
  7.5.2 通过丢弃帧进行拥塞恢复
  7.5.3 路由无损以太网中的拥塞通知
 7.6 使用VXLAN的无损流量
  7.6.1 VXLAN概述
  7.6.2 VXLAN传输
  7.6.3 物理拓扑
  7.6.4 MAC地址学习
  7.6.5 通过VXLAN实现无损流量传输
  7.6.6 VXLAN封装
  7.6.7 VXLAN解封装
  7.6.8 通过VXLAN进行拥塞通知
  7.6.9 VXLAN的流量控制和拥塞通知
  7.6.10 VXLAN中的拥塞管理
 7.7 本章小结
 7.8 参考文献
第8章 TCP存储网络中的拥塞管理
 8.1 理解TCP存储网络中的拥塞
  8.1.1 与无损网络的比较
  8.1.2 iSCSI和NVMe/TCP如何交换数据
  8.1.3 TCP存储网络中的拥塞
 8.2 存储I/O性能监控
  8.2.1 TCP流监控与I/O流监控
  8.2.2 iSCSI的I/O操作
  8.2.3 NVMe/TCP的I/O操作
  8.2.4 I/O操作、流量模式和网络拥塞的相关性
  8.2.5 与无损网络的比较
  8.2.6 从TCP流性能估算I/O流性能
  8.2.7 IP MTU和TCP MSS的考虑因素
 8.3 预防TCP存储网络中的拥塞
  8.3.1 消除或减少拥塞概述
  8.3.2 TCP存储网络中的拥塞通知
  8.3.3 交换机缓冲区的管理
  8.3.4 与无损以太网的比较
  8.3.5 与光纤通道网络的比较
  8.3.6 主动队列管理
 8.4 检测TCP存储网络中的拥塞
  8.4.1 终端设备内的拥塞源头
  8.4.2 网络中的拥塞源头
  8.4.3 使用远程监控平台检测拥塞
  8.4.4 使用思科Nexus Dashboard Insights检测拥塞
  8.4.5 指标导出机制
 8.5 排查TCP存储网络中的拥塞
  8.5.1 目标
  8.5.2 拥塞的严重程度和级别
  8.5.3 方法
  8.5.4 TCP存储网络中的负载均衡
  8.5.5 专用和共享存储网络的QoS考虑因素
  8.5.6 同一网络中的FCoE、RoCE、iSCSI和NVMe/TCP
 8.6 无损网络中的iSCSI和NVMe/TCP
 8.7 使用VXLAN的iSCSI和NVMe/TCP
 8.8 基于TCP/IP的光纤通道
  8.8.1 思科FCIP交换机上存储流量的TCP优化
  8.8.2 检测FCIP链路上的拥塞
 8.9 改进的TCP实现
 8.10 本章小结
 8.11 参考文献
第9章 思科UCS服务器中的拥塞管理
 9.1 思科UCS架构
  9.1.1 UCS域
  9.1.2 UCS域中的流量
  9.1.3 UCS域中的流量控制
 9.2 理解UCS域中的拥塞
 9.3 检测UCS域中的拥塞
  9.3.1 入口拥塞
  9.3.2 出口拥塞
  9.3.3 FI服务器端口与IOM/FEX交换矩阵端口之间的拥塞
  9.3.4 UCS拥塞检测的注意事项
 9.4 UTM应用程序
  9.4.1 UTM的发展历程
  9.4.2 UTM入门
  9.4.3 UTM架构
  9.4.4 使用UTM的概述
  9.4.5 使用UTM排查拥塞
  9.4.6 UTM的拥塞排查工作流程
  9.4.7 案例研究1:查找UCS域的拥塞原因及源头
  9.4.8 案例研究2:背板端口慢排空导致的拥塞
  9.4.9 案例研究3:FI上行端口的非均匀利用
  9.4.10 案例研究4:多路径I/O不均衡导致的拥塞
 9.5 本章小结
 9.6 参考文献
后折页
封底

机工科技数字图书馆