32.9. リッスンキューのロック競合の回避

キューロックの競合により、パケットドロップや CPU 使用率の上昇を引き起こす可能性があり、その結果、レイテンシーが長くなる可能性があります。アプリケーションをチューニングし、送信パケットステアリングを使用することで、受信 (RX) キューと送信 (TX) キューでのキューロックの競合を回避できます。

32.9.1. RX キューのロック競合の回避: SO_REUSEPORT および SO_REUSEPORT_BPF ソケットオプション
リンクのコピー

マルチコアシステムでは、アプリケーションが SO_REUSEPORT または SO_REUSEPORT_BPF ソケットオプションを使用してポートを開くと、マルチスレッドネットワークサーバーアプリケーションのパフォーマンスを向上することができます。アプリケーションがこれらのソケットオプションのいずれかを使用しない場合、すべてのスレッドは受信トラフィックを受信するために単一のソケットを共有するように強制されます。単一のソケットを使用すると、次のような問題が発生します。

パケットドロップや CPU 使用率の上昇を引き起こす可能性のある受信バッファーでの重大な競合。
CPU 使用率の大幅な増加
パケットドロップの可能性

SO_REUSEPORT または SO_REUSEPORT_BPF ソケットオプションを使用すると、1 つのホスト上の複数のソケットを同じポートにバインドできます。

Red Hat Enterprise Linux では、カーネルソースで SO_REUSEPORT ソケットオプションを使用する方法のコードサンプルを提供します。コード例にアクセスするには、以下を実行します。

rhel-9-for-x86_64-baseos-debug-rpms リポジトリーを有効にします。

subscription-manager repos --enable rhel-9-for-x86_64-baseos-debug-rpms

# subscription-manager repos --enable rhel-9-for-x86_64-baseos-debug-rpms

Copy to Clipboard

Toggle word wrap

kernel-debuginfo-common-x86_64 パッケージをインストールします。
```
dnf install kernel-debuginfo-common-x86_64
```
```
# dnf install kernel-debuginfo-common-x86_64
```
Copy to Clipboard Toggle word wrap
コード例は /usr/src/debug/kernel-<version>/linux-<version>/tools/testing/selftests/net/reuseport_bpf_cpu.c ファイルで利用できるようになりました。

32.9.2. TX キューのロック競合の回避: 送信パケットステアリング
リンクのコピー

複数のキューをサポートするネットワークインターフェイスコントローラー (NIC) を備えたホストでは、送信パケットステアリング (XPS) によって送信ネットワークパケットの処理が複数のキューに分散されます。これにより、複数の CPU が送信ネットワークトラフィックを処理できるようになり、送信キューのロック競合と、その結果として生じるパケットドロップを回避できます。

ixgbe、i40e、mlx5 などの特定のドライバーは、XPS を自動的に設定します。ドライバーがこの機能をサポートしているかどうかを確認するには、NIC ドライバーのドキュメントを参照してください。ドライバーがこの機能をサポートしているかどうかを確認するには、NIC ドライバーのドキュメントを参照してください。ドライバーが XPS 自動チューニングをサポートしていない場合は、CPU コアを送信キューに手動で割り当てることができます。

注記

Red Hat Enterprise Linux には、送信キューを CPU コアに永続的に割り当てるオプションがありません。インターフェイスがアクティブ化されたときに実行される NetworkManager ディスパッチャースクリプト内のコマンドを使用してください。詳細は、How to write a NetworkManager dispatcher script to apply commands on interface start を参照してください。

前提条件

NIC が複数のキューをサポートする。
numactl パッケージがインストールされている。

手順

使用可能なキューの数を表示します。
```
ethtool -l enp1s0
```
```
# ethtool -l enp1s0
Channel parameters for enp1s0:
Pre-set maximums:
RX:		0
TX:		0
Other:		0
Combined:	4
Current hardware settings:
RX:		0
TX:		0
Other:		0
Combined:	1
```
Copy to Clipboard Toggle word wrap
Pre-set maximums セクションにはキューの総数が表示され、Current hardware settings には受信キュー、送信キュー、その他のキュー、または結合されたキューに現在割り当てられているキューの数が表示されます。
オプション: 特定のチャネルにキューが必要な場合は、それに応じてキューを割り当てます。たとえば、4 つのキューを Combined チャネルに割り当てるには、次のように入力します。
```
ethtool -L enp1s0 combined 4
```
```
# ethtool -L enp1s0 combined 4
```
Copy to Clipboard Toggle word wrap
NIC がどの Non-Uniform Memory Access (NUMA) ノードに割り当てられているかを表示します。
```
cat /sys/class/net/enp1s0/device/numa_node
0
```
```
# cat /sys/class/net/enp1s0/device/numa_node
0
```
Copy to Clipboard Toggle word wrap
ファイルが見つからない場合、またはコマンドが -1 を返す場合は、ホストは NUMA システムではありません。
ホストが NUMA システムの場合は、どの CPU がどの NUMA ノードに割り当てられているかを表示します。
```
lscpu | grep NUMA
```
```
# lscpu | grep NUMA
NUMA node(s):       2
NUMA node0 CPU(s):  0-3
NUMA node1 CPU(s):  4-7
```
Copy to Clipboard Toggle word wrap
上の例では、NIC には 4 つのキューがあり、NIC は NUMA ノード 0 に割り当てられています。このノードは CPU コア 0 - 3 を使用します。したがって、各送信キューを 0 - 3 の CPU コアの 1 つにマッピングします。
```
echo 1 > /sys/class/net/enp1s0/queues/tx-0/xps_cpus
echo 2 > /sys/class/net/enp1s0/queues/tx-1/xps_cpus
echo 4 > /sys/class/net/enp1s0/queues/tx-2/xps_cpus
echo 8 > /sys/class/net/enp1s0/queues/tx-3/xps_cpus
```
```
# echo 1 > /sys/class/net/enp1s0/queues/tx-0/xps_cpus
# echo 2 > /sys/class/net/enp1s0/queues/tx-1/xps_cpus
# echo 4 > /sys/class/net/enp1s0/queues/tx-2/xps_cpus
# echo 8 > /sys/class/net/enp1s0/queues/tx-3/xps_cpus
```
Copy to Clipboard Toggle word wrap
CPU コアと送信 (TX) キューの数が同じ場合は、TX キューで何らかの競合が発生するのを避けるために、1 対 1 マッピングを使用してください。複数の CPU を同じ TX キューにマップすると、各 CPU の送信操作によって TX キューのロック競合が発生し、送信スループットに悪影響が発生します。
CPU のコア番号を含むビットマップをキューに渡す必要があることに注意してください。次のコマンドを使用してビットマップを計算します。
```
printf %x $((1 << <core_number> ))
```
```
# printf %x $((1 << <core_number> ))
```
Copy to Clipboard Toggle word wrap

検証

トラフィックを送信するサービスのプロセス ID (PID) を特定します。
```
pidof <process_name>
```
```
# pidof <process_name>
12345 98765
```
Copy to Clipboard Toggle word wrap
XPS を使用するコアに PID を固定します。
```
numactl -C 0-3 12345 98765
```
```
# numactl -C 0-3 12345 98765
```
Copy to Clipboard Toggle word wrap
プロセスがトラフィックを送信している間、requeues カウンターを監視します。
```
tc -s qdisc
```
```
# tc -s qdisc
qdisc fq_codel 0: dev enp10s0u1 root refcnt 2 limit 10240p flows 1024 quantum 1514 target 5ms interval 100ms memory_limit 32Mb ecn drop_batch 64
 Sent 125728849 bytes 1067587 pkt (dropped 0, overlimits 0 requeues 30)
 backlog 0b 0p requeues 30
 ...
```
Copy to Clipboard Toggle word wrap
requeues カウンターが大幅な速度で増加しなくなると、TX キューロックの競合は発生しなくなります。

32.9.3. UDP トラフィックが多いサーバーでの汎用受信オフロード機能の無効化
リンクのコピー

高速 UDP バルク転送を使用するアプリケーションは、UDP ソケットで UDP Generic Receive Offload (GRO) を有効にして使用する必要があります。ただし、次の条件が当てはまる場合は、GRO を無効にしてスループットを向上させることができます。

アプリケーションは GRO をサポートしていないため、機能を追加できません。
TCP スループットは関係ありません。
警告
GRO を無効にすると、TCP トラフィックの受信スループットが大幅に低下します。したがって、TCP パフォーマンスが関係するホストでは GRO を無効にしないでください。

前提条件

ホストは主に UDP トラフィックを処理している。
アプリケーションは GRO を使用していない。
ホストは、VXLAN などの UDP トンネルプロトコルを使用していない。
ホストは仮想マシン (VM) やコンテナーを実行していない。

手順

オプション: NetworkManager 接続プロファイルを表示します。

nmcli connection show

# nmcli connection show
NAME     UUID                                  TYPE      DEVICE
example  f2f33f29-bb5c-3a07-9069-be72eaec3ecf  ethernet  enp1s0

Copy to Clipboard

Toggle word wrap

接続プロファイルで GRO サポートを無効にします。
```
nmcli connection modify example ethtool.feature-gro off
```
```
# nmcli connection modify example ethtool.feature-gro off
```
Copy to Clipboard Toggle word wrap
接続プロファイルを再度アクティベートします。
```
nmcli connection up example
```
```
# nmcli connection up example
```
Copy to Clipboard Toggle word wrap

検証

GRO が無効になっていることを確認します。

ethtool -k enp1s0 | grep generic-receive-offload

# ethtool -k enp1s0 | grep generic-receive-offload
generic-receive-offload: off

Copy to Clipboard

Toggle word wrap

サーバー上のスループットを監視します。この設定がホスト上の他のアプリケーションにマイナスの影響を与える場合は、NetworkManager プロファイルで GRO を再度有効にします。

トップに戻る

32.9. リッスンキューのロック競合の回避

32.9.1. RX キューのロック競合の回避: SO_REUSEPORT および SO_REUSEPORT_BPF ソケットオプション
リンクのコピー

32.9.2. TX キューのロック競合の回避: 送信パケットステアリング
リンクのコピー

32.9.3. UDP トラフィックが多いサーバーでの汎用受信オフロード機能の無効化
リンクのコピー

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

32.9. リッスンキューのロック競合の回避

32.9.1. RX キューのロック競合の回避: SO_REUSEPORT および SO_REUSEPORT_BPF ソケットオプションリンクのコピーリンクがクリップボードにコピーされました!

32.9.2. TX キューのロック競合の回避: 送信パケットステアリングリンクのコピーリンクがクリップボードにコピーされました!

32.9.3. UDP トラフィックが多いサーバーでの汎用受信オフロード機能の無効化リンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

32.9.1. RX キューのロック競合の回避: SO_REUSEPORT および SO_REUSEPORT_BPF ソケットオプション
リンクのコピー

32.9.2. TX キューのロック競合の回避: 送信パケットステアリング
リンクのコピー

32.9.3. UDP トラフィックが多いサーバーでの汎用受信オフロード機能の無効化
リンクのコピー