インターネットの利用はその歴史で伝えられるとおり、学術ネットワークが民間に開放されて、テキストベースのコマンドインターフェースが、ネットスケープなどのブラウザ(HP閲覧ソフト)によって、拡大しています。
世界中で、HPが作成され、どんどん増殖しましたが、そのコンテンツ(情報の中身)について評価・基準が設定されていたわけでなく、というよりも特定の評価・基準を排したことを特徴として急速な普及が実現しています。
これは『インターネットはからっぽの洞窟』という評価につながりますが、その意味するところは『玉石混交』です。
玉と石を分離も含めて、検索エンジンが登場しました。
当初Yahooが登録を受け付けて、独自というある権威によって振り分けたのに対して、Googleは登録という作業を排し、存在するすべての情報の収集を目指しました。
勝手に作って、勝手に公開しているHPを勝手に巡回して集めてしまう。
Googleは起業の基本が情報の収集です。
全世界で作成される膨大な情報を、収集し、特定のシステム化された基準で、キーワードで検索させるサービスです。
他の情報サービス同様、検索機能の利用者に対する広告掲載が収益モデルです。
ご存じのとおり大成功ですが、コンテンツへのこだわりが強く、情報の収集のために開発したエンジン、ソフトウェアを無償サービス、オープンソースとして公開しました。
Googleが開いた、HPからの情報収集の世界にだれでも入れる環境が整いました。
数十年前ですが、IBM事件というIBMの基本ソフトの知的所有権に関する国際紛争、といっても日本とアメリカです、が起きました。
IBM互換機を日立、富士通が開発したことへのアメリカとIBMの抵抗でした。
ソフトウェアの知的所有権の侵害をしない証明として、外部仕様書の作成、内部仕様書、ソースコード製作と工程が分離され、相互間の情報交換が禁止されていました。
類似機能開発に、日立、富士通は膨大な人的投資余儀なくされました。
時代背景も異なり、経営者の感性も違っているということだと思います。逆流はなさそうです。
以下継続します。
無料体験を案内中です。メルアド、名前の登録で、体験サイトのURL,ID,パスワードをメール送信します。
1. Googleインパクト:HPからの情報を集めることはGoogleから始まった。
2. 電話帳、飲食など特定サイト情報の制約:従来存在する情報サイトの制約、限界。
3. 調査会社情報の価値:ネットだけですべての情報が収集できるわけではない。
4. 不定型なHPからの情報抽出:見れば明らかな情報を自動的に抽出する困難さ。
5. ストレージ価格ゼロの時代:テラレベルのデータ蓄積コストを無視できる環境。
6. 多次元情報からの近似解:特定の権威筋ではなくて、たくさんの情報で、近似する。
7. 増大、迅速化するHPでの情報公開:現在から将来の見通し。
8. 世界への飛躍:海外展開への可能性
9. 情報基盤としてのSorl/Hudoop:利用しているオープンソースツール、ソフトウェアの紹介