Webサイトの「バックアップデータをなくした」時や「昔のコーポレーサイトの内容がみたい」と言った話が出た時に活用したいのが過去のWebデータを見れる「Internet Archive(インターネットアーカイブ)」。
日常で使う機会はほとんどありませんがWeb制作の困った時に頼りになるツールです。
ただ見るだけでも楽しめるしWebサイトの歴史が分かるので勉強になるサイトです。
このブログ初投稿の記事になりますが今回はWeb業界では有名な「Internet Archive(インターネットアーカイブ)」を紹介します。
Internet Archive(インターネットアーカイブ)の凄いところ
先に説明しましたが、Internet Archive(インターネットアーカイブ)は過去のWebデータをネット上で確認することが出来るツールです。
過去のデータはサービスを開始した1996年以降Webデータならばほとんど残っていると思います。
データを残すだけでも凄いのですが、Internet Archive(インターネットアーカイブ)は無料で誰でも見ることが出来るのではじめてサービスを知ったときは驚きました。
実際に過去のデータを見て何に役立つかというと、
- 自社のの過去のWeb内容を知る事ができる
- 他社の過去データも分かるのでリニューアル前後の分析できる
- 取得したドメインの過去のデータを知る事ができる
などWebデータが無くてもネット上で確認が出来るのでかなり優秀なサイトです。
データの確認と比較分析に利用するケースが多いですね。
目指しているのはWebの図書館
Internet Archiveとはどんな会社なのかを簡単に説明します。
Internet Archiveはサンフランシスコにある非営利団体の団体名で、サービスの正式名称は「ウェイバックマシン(Wayback Machine)」と言います。
ただ団体名で呼ぶ人がほとんどなのでInternet Archive(インターネットアーカイブ)で浸透しているみたいです。
Web上のサービスを保存して文化を後世へ繋ごうと取り組んでいる団体でWikipediaに詳細が書いてありました。
電子資料の保存を支援し、研究者・歴史家・学界のためのインターネットライブラリを構築することを目的に無償でデータを提供している素晴らしい団体です。
使命は大抵の社会はその文化、歴史遺産の保存を重視している。そのような資料が無ければ、文明はその成功または失敗から学ぶための手段も記憶も持てない。我等の文化は現在電子形態での資料を大量に生産している。アーカイブの使命は、これらの電子資料の保存を支援し、研究者・歴史家・学界のためのインターネットライブラリを構築することにある。
Wikipedia
Internet Archive(インターネットアーカイブ)はWebサイト以外でも動画なども保存されているのでデータ量は凄い事になっていますね。
保存されているものはコチラ
- Webサイト
- 動画
- 電子書籍
- 音源
- アート作品
- ゲーム など
数えてたらキリがないくらいたくさんのデータが残っています。TOPページから下にスクロールしていくとアーカイブが乗っていますので見てみてください。
Internet Archive(ウェイバックマシン)の使い方
Internet Archive(ウェイバックマシン)の使い方を紹介します。
TOPページにいくと検索窓がありますので調べたいURLを入力して下さい。英語の表記なので少し分かりにくいですが無料で使えるので好き勝手いじって大丈夫ですよ。
Web以外でに本や映画、音楽なども検索が出来ますが今回はWebサイトの説明なので小窓にURLを入力して下さい。
試しにGoogleやYahoo!JAPAN、マイクロソフトなどで検索してみました。検索すると年単位表示とカレンダー表示が出てきます。
上のグラフで「何年のWebサイトを見たいか」を選択して、下のカレンダーで「何日のWebサイトを確認したいか」を選択します。
一番古いものだと1996年からアーカイブされているので見たい日付をカレンダーから選択して下さい。
今回はYahoo!JAPANのサイトの中で一番古い日付を選択してみました。
日付を選択すると時間が表示されるのでクリックするとWebサイトが表示されます。
緑色とか水色とか色が何個かありますが、データの収集手段が違うだけなのでどれを選択しても大丈夫です。
Yahoo!JAPANで一番古く残ってたのは1996年の11月でした。当然今と違うけど雰囲気は同じですね。全部のデータ内容が残っている訳ではないので表示は崩れたりします。
Googleを調べるとこんな感じでした。
同じでびっくりしますね。2001年のデータですが今とほぼ同じでした。
このように昔のWebサイトを丸裸にできるので調べたいサイトがあればURL検索で調べてみてくださいね。
注意点
注意点と言う程大げさではないのですが何個か気になった事があるので書いておきます。
[1]見れないページもある
今までのWebサイト全てが登録されている訳ではないので検索しても出てこない場合も多々あります。
主要サイトからのリンクを辿りアーカイブしているので新しいドメインとかは登録されていないと思います。また、削除依頼されたページや、IDなどで制限があるページなども登録がないので覚えておいて下さいね。
見れないページはコチラ
- 新規で登録されたWebサイト(時間が経つと登録されます)
- 削除依頼されたページ
- IDなどの制限があるページ など
ちなみに、私のブログは登録されていました。なんか恥ずかしいですね。個人ブログでも残っているので自分のサイトをチェックしてみて下さい。
補足ですが自分でサイトを登録する事も出来ます。今後残していきたいと思っている方は登録しておきましょう。
[2]表示は遅い
日付をクリックしてWebページを見るときの読み込み速度は遅いです。昔は30秒くらい表示されなかったのですが、今検索したら10秒待てば表示されたので速度は改善されてきた気がします。
時間帯によって違うのかもしれませんので一応注意点に書いておきました。
アーカイブを体験して感じた事
最後に実際に体験して感じた事を。
昔から利用していたInternet Archiveですが、今見てもずっと検索していたくらい魅力的なサイトでした。記事を書いた後でも10社位調べてみたので。
困った時に助けてくれるお助けツールとして、また暇つぶしに見れるツールとして覚えておいてほしいサイトです。
Web関係の方の中では有名なサイトだけど一般的に知られていないのでもっと知ってほしいですね。ぜひ活用してみて下さいね。