1.2. リリースの概要
1.2.1. Red Hat Enterprise Linux 6 における新機能
本セクションでは、Red Hat Enterprise Linux 6 に含まれるパフォーマンス関連の変更についての簡単な概要を説明しています。
1.2.1.1. 6.6 リリースでの新機能
- perf がバージョン 3.12 に更新され、以下の新機能が含まれています。
perf record
の-j
および-b
の各オプションで、連続するブランチの統計サンプルを行います。詳細は、man perf-record
を参照してください。--group
および--percent-limit
を含む新たなperf report
パラメーターと、perf record
-j
および-b
のオプションを有効にして収集されたデータを分類する追加オプション。詳細は、man perf-report
を参照してください。- ロードおよび保存メモリーアクセスをプロファイリングする新たな
perf mem
コマンド。 --percent-limit
および--obj-dump
を含むperf top
の新オプション。--force
および--append
のオプションがperf record
から削除されました。perf stat
の新オプション--initial-delay
。perf trace
の新オプション--output-filename
。perf evlist
の新オプション--group
。perf top
-G
およびperf record
-g
の各オプションが変更されました。これらはもう、--call-graph
オプションの代わりにはなりません。今後の Red Hat Enterprise Linux バージョンにlibunwind
サポートが追加されると、これらのオプションは設定済みアンワインドメソッドを有効にします。
1.2.1.2. 6.5 リリースでの新機能
- カーネルへの更新で、IRQ テーブルのサイズが 1 GB 以上の場合、I/O ロードが複数のメモリープールに拡散することが可能になることで、メモリー管理のボトルネックが取り除かれ、パフォーマンスが改善します。
- cpupowerutils パッケージが更新され、turbostat および x86_energy_perf_policy ツールが含まれるようになりました。これらのツールは、「turbostat」 および 「ハードウェアパフォーマンスポリシー (x86_energy_perf_policy)」 で説明されています。
- CIFS がより大型の rsize オプションと非同期の readpage をサポートすることで、スループットの大幅な増加が可能になりました。
- GFS2 が Orlov ブロックアロケータ―を提供するようになり、ブロック割り当てが速く行われるようになりました。
- tuned の
virtual-hosts
プロファイルが調整されました。kernel.sched_migration_cost
の値は、カーネルのデフォルトの500000
ナノ秒 (0.5 ミリ秒) ではなく、5000000
ナノ秒 (5 ミリ秒) となっています。これにより、大規模な仮想化ホスト用の実行キューロックにおける競合が減ることになります。 - tuned の
latency-performance
プロファイルが調整されました。サービスの電力管理の質であるcpu_dma_latency
要件の値が、0
ではなく1
になっています。 - カーネル
copy_from_user()
およびcopy_to_user()
の関数にいくつかの最適化が含まれ、この両方のパフォーマンスを改善しています。 - perf ツールに、以下のものを含む多くの更新および機能強化がなされています。
- Perf が、System z CPU 測定カウンター機能が提供するハードウェアカウンターを使用できるようになりました。利用可能なハードウェアカウンターの 4 つのセットは、基本カウンターセット、問題状態カウンターセット、暗号化アクティビティーカウンターセット、および拡張カウンターセットです。
- 新たに
perf trace
コマンドが利用可能になりました。これにより、perf インフラストラクチャーを使用した strace のような動作で追加ターゲットの追跡が可能になります。詳細は、「Perf」 を参照してください。 - スクリプトブラウザーが追加され、ユーザーは現行の perf データファイルに利用可能なすべてのスクリプトを閲覧できるようになりました。
- いくつかの追加のサンプルスクリプトが利用可能になっています。
- Ext3 が更新され、ロックの競合を減らしています。これにより、マルチスレッド書き込み操作のパフォーマンスが改善しています。
- KSM が、NUMA トポロジーを認識するように更新されました。これにより、ページ結合の際に NUMA の場所を考慮することが可能になっています。これで、ページがリモートのノードに移動することに関するパフォーマンス低下が避けられます。Red Hat では、KSM の使用時にクロスノードのメモリーマージを避けることを推奨しています。この更新では、新たに調整可能な
/sys/kernel/mm/ksm/merge_nodes
を導入してこの動作を制御しています。デフォルト値 (1
) は、異なる NUMA ノードにまたがるページをマージします。merge_nodes
を0
に設定すると、同一ノード上のページのみがマージされます。 - hdparm が
--fallocate
、--offset
、および-R
(読み-書き-検証 の有効化) を含む新たなフラグで更新されました。また、--trim-sectors
オプションが--trim-sector-ranges
および--trim-sector-ranges-stdin
のオプションに置換されています。これで、複数セクターの範囲が指定できます。これらのオプションの詳細情報は、man ページを参照してください。