Web担トップ » ユーザー投稿一覧 » グーグルのクラウドを支えるテクノロジー　＞　第35回　社内横断データセット検索システム「Goods」（パート1）

グーグルのクラウドを支えるテクノロジー　＞　第35回　社内横断データセット検索システム「Goods」（パート1）

CTC教育サービス 2018/3/26 16:57

0 3 1

※この記事は読者によって投稿されたユーザー投稿です：

編集部の見解や意向と異なる内容の場合があります
編集部は内容について正確性を保証できません
画像が表示されない場合、編集部では対応できません
内容の追加・修正も編集部では対応できません

CTC教育サービスはコラム「グーグルのクラウドを支えるテクノロジー＞第35回社内横断データセット検索システム「Goods」（パート1）」を公開しました。

＃＃＃

はじめに
　今回からは、2016年に公開された論文「Goods: Organizing Google's Datasets」をもとにして、Bigtable、Spanner、GFSと言った、Google社内のデータストアを横断的に検索可能にするツール「Goods（Google Dataset Search）」を紹介していきます。最近、複数のデータストアにまたがった情報を横断的に検索・活用する手法として、「データレイク」という考え方を耳にするようになりました。これは、260億件という膨大な数のデータセットに対してデータレイクの仕組みを実現した、Googleの社内事例と言えるでしょう。

Goodsの役割
　Googleの社内には、ソフトウェアエンジニアが開発中に使用するファイルシステム（Google Filesystem）やデータ分析に利用するデータベース（Spanner）など、さまざまなデータストアがあります。これらのデータストアに含まれるデータセットをカタログ化して検索可能にすることが、Goodsの大きな目的です。具体的には、図1のような情報をカタログ化しています。

この続きは以下をご覧ください
https://www.school.ctc-g.co.jp/columns/nakai2/nakai235.html

この記事が役に立ったらシェア!3 1

※記事へのコメント機能は2021年11月をもって終了しました。編集部へのご連絡は、問い合わせフォーム・メール・Twitterなどをご利用ください。

Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]

[SILVER SPONSOR]

株式会社ミツエーリンクス Repro株式会社

[SPONSOR]

株式会社日本レジストリサービス株式会社キノトロープ株式会社サイズプライム・ストラテジー株式会社