当前位置：首页|资讯

Kubernetes-ClusterIP访问异常-Linux网络协议栈学习

作者：BeijingToTokyo发布时间：2024-10-14

1 背景

笔者近期遇到了Kubernetes网络问题，在处理过程中加深了对Linux网络协议栈的理解。

在此记录分享。

2 环境介绍

Kubernetes环境：双网卡的实体机 * 2

Master节点双网卡：192.168.33.67/24【enp26s0网卡】 71.11.33.67/21【eno1网卡】
Work节点双网卡： 192.168.33.208/24【eno5网卡】 71.11.33.208/21【eno1网卡】
kube-apiserver组件： hostnetwork方式运行在Master节点，监听196.168.33.67:5444，且拥有svc-clusterip地址 10.247.0.1:443。

=主机的ip信息和路由信息

3 异常现象&报错信息

在部署calico时（crosssubnet模式），Master节点上的calico-node正常，Worker节点上的calico-node报错。

报错信息

在两个节点上分别进行telnet，Master节点正常，Worker节点不通。

telnel测试网络

但奇怪的是，svc-iptables规则正常，从Worker节点直接请求apiserver-pod-ip 竟然是通的。

直接请求api-server-podip是正常的

.

4 异常分析

经过telnet，已经定位是网络不通，于是进行抓包。

抓包结果显示发包成功，但是没有回包。

tcpdump结果

5 问题一：多网卡多IP主机，使用哪个IP作为网络包的源IP？

5.1 分析iptables日志

从抓包中可以看到，源地址是71.11.33.208，而目的地址是192.168.33.67。很明显不在同一网段，现象比较奇怪。使用同网段的192.168.33.208岂不是逻辑上更通顺？

因为此问题是请求svc-clusterip（10.247.0.1），于是猜测和kubernetes-proxy的iptables规则有关。

日志内容如下：

flj-iptables.log内容

从日志中可以看到：请求经过DNAT，最终从eno5网卡发出，这是符合预期的。

可为什么这个网络包从最开始就被赋予了71.11.33.208这个源地址IP？

主机拥有双网卡拥有两个IP地址，源IP为什么是71.11.33.208 而不是 192.168.33.208？

5.2 分析Linux网络协议栈处理过程

Linux网络协议栈在网上可以查到很多资料，下图是笔者搜到的信息。

Linux网络协议栈

结合网络协议栈和iptables日志，我们可以得出网络包的处理过程：

发请求，DST为10.247.0.1:443
到路由表，根据路由规则，此网络包从eno1发出。因为此时没有SRC-IP，把eno1的ip设置为网络包的SRC-IP，即71.11.33.208。
执行iptables规则，进行了DNAT，DST改为192.168.33.67:5444
再到路由表，匹配规则，此包从eno5发出。因为此时已经有SRC-IP了，不做修改。
网络包从eno5发出。

因此，看似奇怪的源IP竟然是正常的。

可是从路由层分析，依然很奇怪。

Worker节点上，"请求发出的网卡" 竟然不是 ”响应接收的网卡“。

请求发出网卡不是响应接收网卡

5.3 Master节点添加路由

本着：网络数据包的发出网卡和响应接收网卡理论上应该是同一个。

来到master节点添加一条路由后，竟然通了!

6 问题二：为什么“请求发出网卡”不是“响应接收网卡”时会出现异常？

6.1 在redhat官网中找到了答案

Linux RPF 的功能简介

在Linux内核中，`rp_filter`（Reverse Path Filtering）功能可以防止中间人攻击和其他形式的IP欺骗攻击。

RPF查看数据包到达的接口是否与内核用于将数据包发送到该 IP 的接口相同。如果接口相同，则数据包已通过严格过滤测试，并正常处理。如果接口不同，则数据包将被丢弃，无需任何进一步处理。

此时已经得出异常现象的理论原因：。Worker节点的RPF功能拦截了响应网络数据包。

6.2 查看Worker主机的RPF设置，实践验证理论结果

默认情况下RPF值为1 为严格检验模式

删掉5.3中添加的路由，将Worker主机eno5网卡的RPF设置为0后，请求测试成功。

修改RPF参数请求正常响应

若主机有很多网卡需要修改，可以通过net.ipv4.conf.all.rp_filter进行"一键修改"。

推荐体验

相关资讯

基于深度神经网络的心电图异常信号检测

进行基于深度学习的心电图（ECG）异常信号检测研究是一个涉及医学、计算机视觉和机器学习的项目。这个研究的目标是利用深度学习技术来准确地识别和分类心电图中的异常信号，这对于心脏疾病的早期诊断和治疗至关重要。以下是一个概要和实现这个研究的基本步骤。研究设计概要引言心电图异常信号检测的重要性和应用场景深度学习在心电图分析中的作用研究目标和预期成果相关工作传统心电图分析方法深度学习技术在心电图分析中的应用现有研究的局限性和改进空间研究方法数据收集（心电图数据集）数据预处理（信号去噪、归一化）深度学习模型的选择和设

深度学习机器学习

邝煜云 2024-01-03

Linux中的机器学习: Piper

我们的Linux中的机器学习系列专注于使机器学习实验变得容易的应用程序。本系列中介绍的所有应用程序都可以自行托管。用于神经文本到语音的神经网络处理大型数据集以学习从输入到输出的最佳路径。这是一种机器学习形式，因为这些网络使用神经声码器合成语音波形而无需用户输入。Piper被宣传为快速、本地的神经文本到语音系统。它是用C++和Python编写的免费开源软件。在评估系统之前，我们将为您介绍安装过程。安装该项目的GitHub详细说明了使用pip的安装过程。本系列中展示的软件主要在Manjaro，一种基于Arch

机器学习 GitHub

Linux-Story 2023-09-10

揭秘 ChatGPT 背后的技术栈：OpenAI 如何将 Kubernetes 扩展到了 7500 个节点

作者 OpenAI 译者 Sambodhi 策划褚杏娟在本文中，OpenAI 的工程师团队分享了他们在 Kubernetes 集群扩展过程中遇到的各种挑战和解决方案，以及他们取得

InfoQ 2023-04-05

为什么要学习LINUX云计算?

互联网/移动互联网经历了高速发展的二十年，我们有幸一起见证了华为、阿里、腾讯百度、字节跳动、京东、滴滴、拼多多等互联网公司的崛起，让普通技术人实现逆袭拿到高薪，也让小镇做题家们有了阶层跨越的机会。但机会都是留给有准备的人，正所谓:“猪站在风口都能飞起来”。抓住这个时代的风口和机会就显得尤为重要。那下一个风口在哪里呢?一定是人工智能，不能说是风口，更被喻为第四次工业革命;要让人工智能起飞，除了需要算法，数据，还需要非常重要的算力。OPENAI的CHATGPT，SORA背后的每一次文本和视频处理，需要耗费大量

华为腾讯百度字节跳动 OpenAI

武汉誉天 2024-05-28

ChatGPT成功背后的网络功臣，全栈智能网络技术揭秘

孟庆谈道，在AI快速发展的过程中，后进入市场的参与者如果想要赶超已进入市场的参与者，有两种方式，一是按照已成功的范例来投入资源，二是投入同样的资源但要跑得更快，跑得更快必然需要提高效率，而提高效率就需要DPU。

智东西 2023-04-17

近期资讯

参与开源一年半，我收获了什么

最开始接触到开源，还是因为公司的某个 H5 的项目需要一个图片预览组件，刚开始选择了 vant，但是很不幸，并没有满足我的需求，而且还有一些bug。于是我又去网上翻了翻其他的移动端组件

笨笨狗吞噬者 2024-10-09

自驾游注意！中国最美公路今日封闭

快科技10月10日消息，根据新疆维吾尔自治区交通运输厅发布的通告，近期独库公路山区大部气温降至0℃以下，通行存在较大安全隐患。综合天气、路况等因素，决定自2024年10月10日20时起，对G217线

2024-10-10

我是万没想到诺贝尔化学奖也给了程序员

昨天诺奖物理颁给 AI ，大家人都傻了，深度学习也是物理？尽管有网友也想着找补点，万一今天的化学奖，颁给物理学家了呢？结果今天化学奖出来，大家再次被惊掉下巴，没完了是吧！&nbs

2024-10-10

女子投放死虫6次敲诈海底捞：法院判了

10月10日消息，微博话题“女子投放死虫6次敲诈海底捞”冲上热搜榜，引发热议。据媒体报道，女子李某将死虫子偷偷放进海底捞的调料碗中，先后6次敲诈海底捞门店，最终北京市西城区人

2024-10-10

解决Nginx出现“Too many open files”的问题

在那个不经意的瞬间，我感到一阵莫名的恍惚。同事突然提出要看我的手机，她的目光落在了我那泛黄的手机壳上。出乎意料地，她开始细心地擦拭，从内到外，动作轻柔而专注。那一刻，我的思绪飘忽不定——

IT小辉同学 2024-10-09

还搞不明白浏览器缓存？

本文概括了浏览器存储，介绍了强缓存和协商缓存并带友友们使用，相信在面试遇到浏览器缓存问题就能说个一二了

midsummer18 2024-10-09

跑分干到300万联发科的新芯片到底有多猛

差友们乡亲们，这个国庆假期过得怎么样啊？虽然托尼知道大家都不愿意上班，但是我们编辑部假期结束后可是一刻都没闲着，因为这个月就是国产旗舰机换代的爆发月了。基本上你能叫得上名

2024-10-10

抢先上手微信原生鸿蒙版！和安卓、iOS有啥不一样

家人们！这回是真的，纯血鸿蒙，有微信了！这两天，估计再不爱冲浪的人，也知道了纯血鸿蒙能用微信了的消息。不过也有小伙伴问， “ 为什么我升级了 HarmonyOS NEXT 公

2024-10-10

2024双11来了！时间表公布：京东10月14日提前开启

快科技10月10日消息，一年一度的“双11”来了，日前，京东公布2024年“双11”活动时间表，今年京东“双11”将提前到10月14日晚8点正式开启。据了解，2024年京东

2024-10-10

10万元崔克自行车被小孩碰倒后续车主：没追究小孩责任了

快科技10月9日消息，据报道，近日，在北京发生了一起引人注目的天价自行车被碰倒事件。报道称，10月7日，北京故宫西华门附近，自行车车主正在台阶上拍照，并将车停放在石凳旁。不料，一名跟

2024-10-10

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1