xmlサイトマップとは | | まーくんのアフィリエイト学校

アフィリエイトを始めるために知っておきたいことなどの基礎から、運営に関する知識やテクニックなどの応用まで様々なノウハウを学ぶことができます

xmlサイトマップとは

公開日 最終更新日

サイト内のページ情報を記述したファイルのこと。検索エンジンによるページ情報の取得をスムーズにできる。

「xml(※)」と呼ばれる形式で記述され、サイト内の各ページのURL・最終更新日・更新頻度などの情報を登録することが可能。

 

xmlとは↓

文書構造を記述するためのマークアップ言語。HTMLと同じ言語から派生した。

記述の自由度が高く、検索エンジンなどのロボットに対しても効率的に情報を伝達できる。

データ管理を簡易化できるため、Web制作やシステム運用などに幅広く用いられている。

 

xmlサイトマップとは

xmlサイトマップは、サイト内のページ情報を記述したxml形式のファイルのことです。

サイト内の各ページのURL・最終更新日時などの情報を構造的に記述することで、検索エンジンによる情報取得をサポートできます。

 

xmlサイトマップのメリット

xmlサイトマップがないと、サイト情報が検索エンジンに全く伝わらないのかくま?
そいうわけではないです~。でも、xmlサイトマップを活用することで、検索エンジンがスムーズに情報を読み取れるようになるんです~。

 

サイト内の状態によっては、検索エンジンが各ページの情報をうまく読み取れない場合があります。

 

検索エンジンがサイト内のページ情報を読み取る際には、「クローラー」と呼ばれる情報収集プログラムを使用しています。

 

 

クローラーはインターネット上のリンクを経由してさまざまなサイトを巡回し、各ページの情報を読み取ります。

しかし、サイトの規模が大きかったり、リンクの階層構造が複雑だったりすると、下記のような問題が発生しやすくなります。

 

・クローラーがページ情報を正しく読み取れない

・巡回に時間がかかり、ページ評価が検索順位に反映されるまでのタイムラグが大きくなる

 

 

一方、xmlサイトマップが設置されている場合は、そこに記述された情報が、クローラーによるサイト構造の理解をサポートしてくれます。

その結果、リンク経由では巡回しづらいページの情報をスムーズに読み取れるようになります。

 

xmlサイトマップの有無とクロール時間

xmlサイトマップがクローラーに及ぼす影響については、SEOツール等を提供する企業「MOZ」の公式ブログにおいて、2009年1月6日にCaseyHenry氏による検証記事が投稿されました。

 

記事によると、xmlサイトマップの有無によって、Google・Yahooの各検索エンジンが新規ページをクロールするまでの所要時間が下記の通りに変化しました。

 

▼xmlサイトマップの有無によるクロール所要時間の変化

検索エンジン

xmlサイトマップ無

xmlサイトマップ有

Google

1375分

14分

Yahoo

1773分

245分

参考:Do Sitemaps Affect Crawlers? – Moz(英語)

 

※検証方法の詳細は参考サイトをご確認ください。

 

頑張って作ったページを検索エンジンにいち早く読み取ってもらうには、xmlサイトマップをうまく活用するのが大事なんだくまね!

はいです~。特に以下のようなサイトは、xmlサイトマップを設置することでクローラー巡回を効率化できる可能性が高いですよ~!

xmlサイトマップはこんなサイトにオススメ!

・全体の規模が大きい

・新規のサイト

・記事の追加・更新が頻繁

・サイト内に、他ページとリンクで繋がっていないページが存在する

 

xmlサイトマップの作成方法

xmlサイトマップがどんなものか分かったところで、実際の作成方法を解説してくです~。

 

xmlサイトマップのファイル名・設置場所は自由に設定できますが、一般的には「sitemap.xml」というファイル名が用いられ、サイトのトップディレクトリに設置されます。

記述内容は以下を参考にしてください。

 

▼xmlサイトマップのサンプル

<?xml version=”1.0″ encoding=”UTF-8″?>

  <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

   

 <url>

       <loc>http://www.example.com/</loc>

       <lastmod>2019-01-01</lastmod>

       <changefreq>daily</changefreq>

       <priority>1.0</priority>

    </url>

 

    <url>

       <loc>http://www.example.com/contents/0103</loc>

       <lastmod>2019-01-03</lastmod>

       <changefreq>monthly</changefreq>

       <priority>0.5</priority>

    </url>

 

    <url>

       <loc>http://www.example.com/contents/0105/</loc>

       <lastmod>2019-01-05</lastmod>

       <changefreq>weekly</changefreq>

       <priority>0.5</priority>

    </url>

 

</urlset>

参考:sitemaps.org – プロトコル

 

上記のサンプルは、大きく2つのセクションから成立してます。

 

1.xmlサイトマップの記述ルールを宣言する部分(背景色が灰色の部分)

2.サイトのページ情報を記述する部分(背景色が黄色の部分)

 

1.xmlサイトマップの記述ルールを宣言する部分

<?xml version=”1.0″ encoding=”UTF-8″?>

→xmlのバージョンと文字コード(※)を指定しています。

 

※文字コードとは、コンピュータが文字情報を処理する際に必要なコードのことです。

 上記の例では、「UTF-8」と呼ばれる文字コードが指定されています。

 

 <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9“>

 

 

</url>

→コンピュータ同士がデータをやり取りする際の取り決め(プロトコル)を宣言しています。

 

2.サイトのページ情報を記述する部分

<url>

</url>

→各ページ情報を記述する部分です。

内部に下記のようなタグをセットすることで、さまざまな情報を登録することができます。

 

 

タグ

記入

概要

<loc>

必須

ページのURLを2048文字以下で指定する。

ウェブサーバーによっては、URL末尾に「/(スラッシュ)」を記述する必要がある。

<lastmod>

任意

ファイルの最終更新日を記述できる。

半角英数で「西暦年-月-日」という形式で入力する。(※)

時刻情報を含めることもできる。

<changefreq>

任意

ページの更新頻度を記述できる。

この値は検索エンジンに参考情報として利用されるが、クロール頻度を厳格にコントロールするものではない。

指定できる値と、それぞれに対応する更新頻度は下記の通り。

 

・alwys:アクセスするたびに更新

・hourly:1時間更新

・daily:毎日更新

・weekly:毎週更新

・monthly:毎月更新

・yearly:毎年更新

・never:更新しない(アーカイブページのURLに指定)

 

<priority>

任意

サイト内におけるページの優先度を0.0~1.0の数値で指定できる。

優先度の高いページは、検索エンジンによって優先的にクロールされる。

ただし、この値が検索順位に影響することはない。

また、「sitemaps.org」公式ページでは、全てのページに高い優先度を設定しないよう注意喚起されている。

 

各タグに値を指定する際は、以下の形式で記述します。

 

<タグ></タグ>

たとえば、<loc>タグに「http://www.example.jp」というURLを指定したい場合は、下記のように記述します。

<loc>http://www.example.jp/</loc>

 

【サイトマップインデックスファイルについて】

xmlサイトマップファイルひとつにつき、どれぐらいのページ情報を記述できるんだくま?

xmlサイトマップファイルには以下の制限が設けられています。

・登録可能なURL:50,000個

・サイズ容量:50MB(非圧縮時)

上記を超える場合は、xmlサイトマップを複数に分割し、それらをまとめる「サイトマップインデックスファイル」を作成する必要があります。

 

 

サイトマップインデックスファイルは50,000 個のサイトマップを登録でき、サイズ容量は 50 MBです。

 

サイトマップインデックスファイルの設置場所については、xmlサイトマップと同じく、サイトのトップディレクトリが推奨されています。

 

▼サイトマップインデックスファイルのサンプル↓

<?xml version=”1.0″ encoding=”UTF-8″?>

<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

 

   <sitemap>

      <loc>http://www.example.com/sitemap1.xml.gz</loc>

      <lastmod>2004-10-01T18:23:17+00:00</lastmod>

   </sitemap>

 

   <sitemap>

      <loc>http://www.example.com/sitemap2.xml.gz</loc>

      <lastmod>2005-01-01</lastmod>

   </sitemap>

 

</sitemapindex>

xmlサイトマップの記述と比べると、<url>タグが<sitemap>タグに変わってますが、基本的な考え方は同じですね~。

登録したいxmlサイトマップのURLを<loc>タグに、最終更新日時を<lastmod>タグに記述すればOKです~。

 

xmlサイトマップ作成後の流れ

xmlサイトマップの作成が完了したら、ファイルをサーバーにアップロードしたうえで、各検索エンジンの管理ツールに登録する必要があります。

 

アップロードが完了したら「Google Search Console」「Bing Webmaster Center」など、各検索エンジンの管理ツールにxmlサイトマップを登録しましょう。

 

なお「Yahoo!japan」はGoogleと同じ検索エンジンを使用しているため、「Google search console」への登録を行えば、個別に対応する必要はありません。

 

また、複数のxmlサイトマップをサイトマップインデックスファイルにまとめている場合、管理ツールにはインデックスファイルのみを登録します。

インデックスファイルの登録が完了すれば、内部のxmlサイトマップの情報は自動で認識されます。

 

全体の流れは分かったけど、サイト更新のたびにxmlサイトマップを自分で作るのは、なかなか骨が折れそうくま…。

実はxmlサイトマップは、ツールで自動生成することもできるです~。

ブラウザ上で作動する「sitemap.xml Editor」や「XML Sitemap xml Generator」などのほかに、ワードプレスの「Google XML Sitemaps」というプラグインも有名ですよ~。

 

「xmlサイトマップ」のおさらい

簡単に今回のまとめをしておくです~。
xmlサイトマップのまとめ

・xmlサイトマップとは、ページ情報を記述したxml形式のファイル

・xmlサイトマップを使用すると、検索エンジンの巡回がスムーズになる

・xmlサイトマップファイルひとつにつき、登録可能なURLは50,000個、サイズ容量は50MBまで

上限を超える場合は、サイトマップインデックスファイルを作成する

 

関連用語

HTML

・search console

・SEO

インデックス

・ディレクトリ

ブラウザ

・検索エンジン

構造化データ

 

その他参考になる記事

Sitemaps:Wikipedia

sitemaps.org – ホーム:sitemaps.org

サイトマップの作成と送信:Search Console ヘルプ

 

 

アフィリエイト用語辞典 一覧に戻る