情報
データサイエンティスト・ハンドブック
目指す・育てる・活用する人 必携!!
「データサイエンティストほど素敵な仕事はない」(ビジネス誌Harvard Business Reviewの2012年10月号)と言われるほど、この職種は世界的に注目されている。しかし、実際にこの職種に就こう、育てよう、また組織としてこの職種を活用していこうと考えたときに、どのよう進めていけばよいのか、新しいがゆえに指標となるものが少ない。
本書は、著者らの統計数理研究所・IBMコンサルタント部門で培った知見をもとに、この仕事を目指す人、育成する人に必要な情報、組織としていかに活用するかを、分かりやすい事例と整理された内容で理解しやすいよう解説する。
まさにデータサイエンティストに係わるすべての読者必携である!
電子書籍¥2,750 小売希望価格(税込)
紙の書籍¥2,750定価(税込)
基本情報
発売日 | 2015年9月2日 |
---|---|
本体価格 | 2,500円 |
ページ数 | 168 ページ ※印刷物 |
サイズ | A5 |
ISBN | 9784764904903 |
ジャンル | 情報 |
タグ | データサイエンス |
電子書籍形式 | 固定型 |
主要目次
はじめに
第1部 データサイエンティスト
第1章 データサイエンティストとは
1.1 データ分析の仕事
1.2 データサイエンティストの人物像
第2章 データサイエンティストになるには
2.1 データサイエンティストに要求されるスキル
2.2 学習の方法
2.3 データ分析を理解するリテラシー
2.4 キャリアとしてのデータサイエンティスト
2.5 若いうちに何を学ぶべきか
第3章 データサイエンティストの育成
3.1 カリキュラム
3.2 実習・インターンシップ
3.3 実習用のデータ
3.4 ツールの利用
第2部 データ分析の手法
第4章 データ分析の局面
4.1 データ分析の目的
4.2 目的変数と説明変数
第5章 データの準備と可視化
5.1 データの概要を知る
5.2 データの可視化
第6章 アソシエーション分析
6.1 POS データからのパターン発見
6.2 信頼度と支持度
6.3 ルールを選ぶ指標
第7章 クラスタリング
7.1 レコード間の類似
7.2 階層的クラスタリング
7.3 k平均法
第8章 分類・回帰
8.1 分類
8.2 回帰
8.3 モデル選択
8.4 フィッティング (パラメタ適合)
第9章 統計的機械学習
9.1 特徴量の抽出
9.2 高次元データの扱い
9.3 訓練データによる学習結果の評価
9.4 機械学習を用いる際の考慮点
第10章 時系列解析
10.1 確率過程と時系列
10.2 定常性
10.3 定常から非定常へ
10.4 状態空間モデル
第11章 最適化
11.1 線形計画法
11.2 凸計画法
11.3 勾配法
11.4 離散最適化
第12章 実験計画
12.1 相関と因果
12.2 A/Bテスティング
12.3 直交表に基づく分析
第3部 データ分析を有効活用できる組織
第13章 データを活用する組織の形態
13.1 専門組織型
13.2 埋め込み型
13.3 専門組織型と埋め込み型の比較
13.4 ハイブリッド型
13.5 あなたの組織に適した分析組織形態
13.6 意思決定の体制
第14章 データサイエンティストの調達
14.1 組織内部での育成・転用
14.2 外部からの採用
14.3 外部サービスの利用
14.4 プロジェクトチームの編成と運用
14.5 継続的な研鑽とコミュニティの利用
第15章 データ活用プロセスの構築
15.1 4つのステップ
15.2 構想ステップ
15.3 検証ステップ
15.4 パイロット展開ステップ
15.5 本格展開準備・運用ステップ
15.6 スキルを加味したデータ活用プロセスの再整理
15.7 データ活用プロセスに基づく分析テーマの統治
第16章 分析基盤の整備とデータの管理
16.1 ビッグデータ時代の分析基盤
16.2 データ管理
第17章 意思決定のありかた
17.1 意思決定の方法論
17.2 予測と意思決定
第18章 データの分析・利用に関する権利と義務
18.1 データ分析における利害関係者 (ステークホルダ)
18.2 知的財産権に関わる法律
18.3 個人情報保護
18.4 契約と秘密の保護
18.5 オープンデータの動き
おわりに
索引
第1部 データサイエンティスト
第1章 データサイエンティストとは
1.1 データ分析の仕事
1.2 データサイエンティストの人物像
第2章 データサイエンティストになるには
2.1 データサイエンティストに要求されるスキル
2.2 学習の方法
2.3 データ分析を理解するリテラシー
2.4 キャリアとしてのデータサイエンティスト
2.5 若いうちに何を学ぶべきか
第3章 データサイエンティストの育成
3.1 カリキュラム
3.2 実習・インターンシップ
3.3 実習用のデータ
3.4 ツールの利用
第2部 データ分析の手法
第4章 データ分析の局面
4.1 データ分析の目的
4.2 目的変数と説明変数
第5章 データの準備と可視化
5.1 データの概要を知る
5.2 データの可視化
第6章 アソシエーション分析
6.1 POS データからのパターン発見
6.2 信頼度と支持度
6.3 ルールを選ぶ指標
第7章 クラスタリング
7.1 レコード間の類似
7.2 階層的クラスタリング
7.3 k平均法
第8章 分類・回帰
8.1 分類
8.2 回帰
8.3 モデル選択
8.4 フィッティング (パラメタ適合)
第9章 統計的機械学習
9.1 特徴量の抽出
9.2 高次元データの扱い
9.3 訓練データによる学習結果の評価
9.4 機械学習を用いる際の考慮点
第10章 時系列解析
10.1 確率過程と時系列
10.2 定常性
10.3 定常から非定常へ
10.4 状態空間モデル
第11章 最適化
11.1 線形計画法
11.2 凸計画法
11.3 勾配法
11.4 離散最適化
第12章 実験計画
12.1 相関と因果
12.2 A/Bテスティング
12.3 直交表に基づく分析
第3部 データ分析を有効活用できる組織
第13章 データを活用する組織の形態
13.1 専門組織型
13.2 埋め込み型
13.3 専門組織型と埋め込み型の比較
13.4 ハイブリッド型
13.5 あなたの組織に適した分析組織形態
13.6 意思決定の体制
第14章 データサイエンティストの調達
14.1 組織内部での育成・転用
14.2 外部からの採用
14.3 外部サービスの利用
14.4 プロジェクトチームの編成と運用
14.5 継続的な研鑽とコミュニティの利用
第15章 データ活用プロセスの構築
15.1 4つのステップ
15.2 構想ステップ
15.3 検証ステップ
15.4 パイロット展開ステップ
15.5 本格展開準備・運用ステップ
15.6 スキルを加味したデータ活用プロセスの再整理
15.7 データ活用プロセスに基づく分析テーマの統治
第16章 分析基盤の整備とデータの管理
16.1 ビッグデータ時代の分析基盤
16.2 データ管理
第17章 意思決定のありかた
17.1 意思決定の方法論
17.2 予測と意思決定
第18章 データの分析・利用に関する権利と義務
18.1 データ分析における利害関係者 (ステークホルダ)
18.2 知的財産権に関わる法律
18.3 個人情報保護
18.4 契約と秘密の保護
18.5 オープンデータの動き
おわりに
索引