ビューティフルデータ
ビューティフルデータ (THEORY/IN/PRACTICE)
オライリー・ジャパン
編者:Toby Segaran、Jeff Hammerbacher
訳者:堀内孝彦、真鍋加奈子、苅谷潤、小俣仁美、篠崎誠
はじめに
目次
1章 データの中に生活を見る(Nathan You)
PEIR(Personal Environmental Impact Report)
YFD(your.flowingdata)
パーソナルデータの収集
データの蓄積
データ処理
データの可視化
まとめ
参加するには
2章 ビューティフル・ピープル─ユーザの存在を忘れることなくデータ収集の手段をデザインする(Jonathan Follett、Matthew Holm)
はじめに:ユーザへの共感がこれからのデザインの基本原則
プロジェクト:あるラグジュアリー新製品のための顧客調査
データ収集に伴う特有の課題
我々のデザインについて
結果と考察
3章 火星上での組み込み画像処理(J. M. Hughes)
概要
はじめに
背景知識
詰めるか、詰めまいか
3つのタスク
スロットへの画像格納
画像の受け渡し:3つのタスク間でのやりとり
写真を取得する:画像のダウンロードと処理
画像圧縮
ダウンリンク、あとは地球へまっしぐら
おわりに
4章 PNUTShellにおけるクラウドストレージの設計(Brian F. Cooper、Raghu Ramakrishnan、Utkarsh Srivastava)
はじめに
データの更新
複雑なクエリ
他のシステムとの比較
まとめ
5章 情報プラットフォームと データサイエンティストの登場(Jeff Hammerbacher)
図書館と脳
自己認識能力を持つようになったFacebook
ビジネスインテリジェンスシステム
データウェアハウスの停止と復活
データウェアハウスを超えて
チーターとゾウ
データの不合理な有効性
新しいツールと応用研究
MADスキルとCosmos
データスペースとしての情報プラットフォーム
データサイエンティスト
まとめ
6章 写真アーカイブの地理学的な美(Jason Dykes、Jo Wood)
地理データの中の美:Geograph
視覚化と美、そしてツリーマップ
Geographの単語頻度における地理学的観点
発見の中の美
考察とまとめ
7章 データの自己発見(Jeff Jonas、Lisa Sokol)
はじめに
ジャスト・イン・タイム発見の利点
ルーレットでイカサマをする
企業内発見能力
横串検索ですべては解決しない
ディレクトリ:プライスレス
関連性:問題は何か?それは誰にとって問題なのか?
構成要素と注意点
プライバシーについての考察
まとめ
8章 リアルタイムのポータブルデータ(Jud Valeski)
はじめに
最新技術
ソーシャルデータの標準化
まとめ:Gnip経由での仲介
9章 ディープウェブを活用する(Alon Halevy、Jayant Madhaven)
ディープウェブとは
ディープウェブへのアクセスを提供するための2つの手法
まとめと今後について
10章 Radiohead「House of Cards」の プロモーションビデオができるまで(Aaron Koblin、Valdean Klump)
ビデオ作成のきっかけ
データキャプチャ機器
2つのデータキャプチャシステムを使う利点
データのキャプチャ「撮影」
データ処理
データの後処理
ビデオの公開
まとめ
11章 都市データの視覚化(Michal Migurski)
はじめに
背景
難問の解決
データサービスの公開
再検討
まとめ
12章 sense.usの設計(Jeffrey Heer)
データの視覚化と社会調査のためのデータ分析
データ
データの視覚化
コラボレーション機能
探索者と観察者
まとめ
カラー図版
13章 データでできないこと(Coco Krumme)
データの導きが得られないとき
まとめ
14章 自然言語のコーパスデータ(Peter Norvig)
ワードセグメンテーション
暗号
スペル訂正
他の適用分野
議論とまとめ
15章 データの中の生命:DNA物語(Matt Wood、Ben Blackburne)
データ格納庫としてのDNA
デジタルストレージとしてのDNA
データソースとしてのDNA
DNAの未来
16章 実世界のデータをビューティフルにする(Jean-Claude Bradley、Rajarshi Guha、Andrew Lang、Pierre Lindenbaum Cameron Neylon、Antony Williams、Egon Willighagen)
現実のデータが持つ問題
実験ノートの生データを公開する
クラウドソースされたデータを検証する
ネット上でのデータの表現
改善サイクルを回す:可視化して新しい実験を見つける
オープンデータとフリーサービスでデータウェブを構築する
17章 外見のデータ解析:数百万人の社会的ステロタイプ調査(Brendan O’Connor、Lukas Biewald)
はじめに
データの前処理
データの調査
年齢、魅力、性別
タグを見る
性差のある語はどれ?
クラスタリンク
まとめ
18章 ベイエリア・ブルース:住宅市場崩壊の影響(Hadley Wickham、Deborah F. Swayne、David Poole)
はじめに
データをどのように得たのか
ジオコーディング(Geocoding)
データのチェック
分析
インフレの影響
金持ちはより金持ちに、貧乏人はますます貧乏に
地理的差異
国勢調査の情報
サンフランシスコの調査
まとめ
19章 政治に関するビューティフルデータ(Andrew Gelman、Jonathan P. Kastellec、Yair Ghitza)
事例1:選挙区画の再編成と政党の偏り
事例2:推定値の時系列
事例3:年齢と票
事例4:最高裁判事指名に関する世論と上院での投票
事例5:ペンシルバニア州における党派の局所的な偏り
まとめ
20章 データをつなぐ(Toby Segaran)
パブリックなデータには、実際どんなものがあるか
データの結合が可能にすること
企業の中で
データ結合の障害
解決策
まとめ
訳者あとがき
索引