URL正規化（canonical）の仕組み

URL正規化とは、内容が同一または非常に類似する複数のURLが存在する場合に、検索エンジンに対して「どのURLを正式なものとして扱うか」を宣言する処理である。この宣言には canonical タグを使用するのが一般的であり、HTMLの head セクション内に link 要素として記述する。複数のURLが同じコンテンツを持つ状態を放置すると、評価が分散するだけでなく、クロールリソースの無駄な消費にもつながるため、正規化の設計はサイト構築の初期段階から検討することが望ましい。

URLが重複する原因はさまざまである。wwwあり・なしの違い、HTTPとHTTPSの混在、末尾スラッシュの有無、大文字と小文字の差異、UTMパラメータなどのトラッキングパラメータの付与などが代表的なケースである。これらの違いを放置すると、検索エンジンが複数のURLに評価を分散させてしまい、本来一つのページに集中させたい評価が希薄化する問題が生じる。ECサイトでは同一商品が複数のカテゴリパスからアクセスできる構造になりやすく、こうした場合に canonical を活用して正規URLを一本化することが重要になる。

canonical タグはあくまでヒントであり、検索エンジンが必ずしも指定したURLを正規URLとして採用するわけではない。クローラーは内容の類似度や被リンク状況なども考慮したうえで正規URLを独自に判断することがある。確実な正規化のためには、301リダイレクトと canonical タグを組み合わせ、内部リンクもすべて正規URLに向けるという一貫した設計が求められる。また、正規URLにnoindexが設定されていたり、canonical が循環参照を形成していたりするケースはインデックスの問題につながるため、定期的な確認が欠かせない。