网络排查案例课 - 案例 + 策略 + 技巧,全面提升网络排查能力
你将获得
- 40+ 真实网络排查案例解析
- 20 个网络故障疑难点的排查思路
- Wireshark、tcpdump 工具使用技巧
- 18 年架构老兵的网络排障心法
作者简介:
杨胜辉,eBay 资深运维专家,流量系统负责人。主要负责 eBay 全球的流量管理业务,推动 Kubernetes 在 eBay 流量管理场景中的落地。
杨胜辉是一名经验丰富的运维专家。在 UCloud,他解决过很多网络相关的疑难杂症,是技术服务团队的中流砥柱。在 eBay,他作为 Team Leader,积极推动新技术的落地,包括 Envoy、eBPF 等。他对于网络排查这个领域也深感兴趣,在 18 年工作经验的基础上,不断打磨出了对网络排查这个宏大主题的认知和实践体系,尤其在抓包分析这个领域的能力颇为突出。
杨胜辉乐于分享,擅长把复杂的技术用简单的语言讲清楚。他坚信,在容器化的今天,网络通信已经取代本地通信,成为应用间进行沟通的主要媒介,网络排查是每个工程师都应该掌握的必备技能。
课程简介:
网络排查可以说是每个开发、运维、测试的基本能力,尤其是对服务端工程师来说,一个功能上线后出了问题,能快速定位、排查、解决十分必要,这也是为什么面试时经常会考 HTTP、TCP 协议相关的内容,你总要弄清楚网络传输的底层逻辑。
当然,程序本身还好排查,主要是因为程序在自己这边,只要花时间总有希望搞定。而网络的难度,一方面是领域不同,很多专门写程序(特别是偏上层的应用)的工程师,对网络很不了解;一方面网络是双方的事,也就是客户端和服务端,还包括中间路径上的设备等,“变量”更多……--[引用请说明:www.iquizhi.com(爱求知-知识付费下载)]--
尤其是这几年,随着微服务和云计算的普及应用,越来越多的系统从本地的单体服务,变成跨网络的分布式的微服务。随之而来的,就是数不清的跟网络相关的问题。比如:
- 为什么我的应用在单体应用的时候很正常,拆分成微服务以后却时常超时、报错呢?
- 为什么我的带宽是足够的,但数据传输速度却很慢?
- 为什么我的应用偶尔会卡住,但又不是每次都这样?
- 为什么……
面对这么多问题,我们经常束手无策。当然也有一波优秀的 “SRE”(Server Restart Engineer),遇到问题先上“重启大法”,也许也能搞定不少问题。但是,根因依然是未知,即使问题暂时消失了,不知道什么时候,它又会再次到来,然后再次重启……
可见,我们的工程师,太需要网络排查方面的能力了。
但是,因为大部分同学并不是网络出身,对于跟网络相关的问题,经常无从下手,或者事倍功半。所以这次,我们邀请了 eBay 的资深运维专家杨胜辉,围绕案例这个核心,展开排查过程,并会聚焦到工具的使用,以及深入到关键技术点的分析上,让你能真正把问题根因搞清楚,把抓包分析技术掌握住。并通过对底层原理和实践经验的理解,达成融会贯通的目的,从而实现真正突破网络排查瓶颈的最终目标。
课程大纲:
- 网络模型和工具:网络为什么要分层?
- 抓包分析技术初探:你会用tcpdump和Wireshark吗?
- 握手:TCP连接都是用TCP协议沟通的吗?
- 挥手:Nginx日志报connection reset by peer是怎么回事?
- 定位防火墙(一):传输层的对比分析
- 定位防火墙(二):网络层的精确打击
- 保活机制:心跳包异常导致应用重启?
- 分段:MTU引发的血案
- 长肥管道:为何文件传输速度这么慢?
- 窗口:TCP Window Full会影响传输效率吗?