近代科学社

書籍検索
ジャンル選択

情報

データサイエンティスト・ハンドブック

著者 丸山 宏
著者 山田 敦
著者 神谷 直樹

著者紹介

目指す・育てる・活用する人 必携!!
「データサイエンティストほど素敵な仕事はない」(ビジネス誌Harvard Business Reviewの2012年10月号)と言われるほど、この職種は世界的に注目されている。しかし、実際にこの職種に就こう、育てよう、また組織としてこの職種を活用していこうと考えたときに、どのよう進めていけばよいのか、新しいがゆえに指標となるものが少ない。
 本書は、著者らの統計数理研究所・IBMコンサルタント部門で培った知見をもとに、この仕事を目指す人、育成する人に必要な情報、組織としていかに活用するかを、分かりやすい事例と整理された内容で理解しやすいよう解説する。
 まさにデータサイエンティストに係わるすべての読者必携である!

電子書籍¥2,750 小売希望価格(税込)

紙の書籍¥2,750定価(税込)

基本情報

発売日 2015年9月2日
本体価格 2,500円
ページ数 168 ページ ※印刷物
サイズ A5
ISBN 9784764904903
ジャンル 情報
タグ データサイエンス
電子書籍形式 固定型

主要目次

はじめに

第1部 データサイエンティスト
第1章 データサイエンティストとは
1.1 データ分析の仕事
1.2 データサイエンティストの人物像

第2章 データサイエンティストになるには
2.1 データサイエンティストに要求されるスキル
2.2 学習の方法
2.3 データ分析を理解するリテラシー
2.4 キャリアとしてのデータサイエンティスト
2.5 若いうちに何を学ぶべきか

第3章 データサイエンティストの育成
3.1 カリキュラム
3.2 実習・インターンシップ
3.3 実習用のデータ
3.4 ツールの利用

第2部 データ分析の手法
第4章 データ分析の局面
4.1 データ分析の目的
4.2 目的変数と説明変数

第5章 データの準備と可視化
5.1 データの概要を知る
5.2 データの可視化

第6章 アソシエーション分析
6.1 POS データからのパターン発見
6.2 信頼度と支持度
6.3 ルールを選ぶ指標

第7章 クラスタリング
7.1 レコード間の類似
7.2 階層的クラスタリング
7.3 k平均法

第8章 分類・回帰
8.1 分類
8.2 回帰
8.3 モデル選択
8.4 フィッティング (パラメタ適合)

第9章 統計的機械学習
9.1 特徴量の抽出
9.2 高次元データの扱い
9.3 訓練データによる学習結果の評価
9.4 機械学習を用いる際の考慮点

第10章 時系列解析
10.1 確率過程と時系列
10.2 定常性
10.3 定常から非定常へ
10.4 状態空間モデル

第11章 最適化

11.1 線形計画法
11.2 凸計画法
11.3 勾配法
11.4 離散最適化

第12章 実験計画

12.1 相関と因果
12.2 A/Bテスティング
12.3 直交表に基づく分析

第3部 データ分析を有効活用できる組織
第13章 データを活用する組織の形態
13.1 専門組織型
13.2 埋め込み型
13.3 専門組織型と埋め込み型の比較
13.4 ハイブリッド型
13.5 あなたの組織に適した分析組織形態
13.6 意思決定の体制

第14章 データサイエンティストの調達
14.1 組織内部での育成・転用
14.2 外部からの採用
14.3 外部サービスの利用
14.4 プロジェクトチームの編成と運用
14.5 継続的な研鑽とコミュニティの利用

第15章 データ活用プロセスの構築
15.1 4つのステップ
15.2 構想ステップ
15.3 検証ステップ
15.4 パイロット展開ステップ
15.5 本格展開準備・運用ステップ
15.6 スキルを加味したデータ活用プロセスの再整理
15.7 データ活用プロセスに基づく分析テーマの統治

第16章 分析基盤の整備とデータの管理
16.1 ビッグデータ時代の分析基盤
16.2 データ管理

第17章 意思決定のありかた
17.1 意思決定の方法論
17.2 予測と意思決定

第18章 データの分析・利用に関する権利と義務
18.1 データ分析における利害関係者 (ステークホルダ)
18.2 知的財産権に関わる法律
18.3 個人情報保護
18.4 契約と秘密の保護
18.5 オープンデータの動き

おわりに
索引

目次をさらに表示する

著者紹介

丸山 宏(まるやま ひろし)
1983 年 東京工業大学大学院理工学研究科情報科学専攻 修士課程修了
1983 年 日本アイ・ビー・エム株式会社入社
     同社ジャパン・サイエンス・インスティテュート(後の東京基礎研究所)に配属
1997 年~2000 年
     東京工業大学大学院情報理工学研究科、客員助教授を兼務
2006 年 日本アイ・ビー・エム株式会社 東京基礎研究所所長
2009 年 キヤノン株式会社デジタルプラとフォーム開発本部副本部長
2011 年 情報・システム研究機構 統計数理研究所 教授
現在に至る
主要著書
『XMLとJavaによるWebアプリケーション開発』(共著・訳、ピアソン・エデュケーション、1999 年)
『XMLとWebサービスのセキュリティ―XMLデジタル署名と暗号化』(共立出版。2004 年)
『企業の研究者を目指す皆さんへ―Research That Matters』(近代科学社、2009 年)

山田 敦(やまだ あつし)
1995 年 早稲田大学理工学研究科機械工学専攻 博士課程修了
1995 年 日本アイ・ビー・エム株式会社 東京基礎研究所入所
2007 年 日本アイ・ビー・エム株式会社 コンサルティング部門に異動
2009 年 コンサルティング部門で先進的なアナリティクスチームのリーダーを務める。
     併せて多数のデータ分析プロジェクトを実施し現在に至る。
主要著書
『IBMを強くした「アナリティクス」ビッグデータ31の実践例』(監訳、日経BP社、2014 年)

神谷 直樹(かみや なおき)
1996 年 早稲田大学第一文学部哲学科心理学専修卒業
1998 年 早稲田大学大学院文学研究科心理学専攻 修士課程修了
1998 年 日本障害者雇用促進協会 障害者職業総合センター研究部門
2003 年 立教大学大学院文学研究科心理学専攻 博士課程後期課程谷取得後退学
2011 年 独立法人 国立長寿医療研究センター 長寿医療工学研究部
2013 年 博士(文学)(早稲田大学)
2014 年 情報・システム研究機構 統計思考院、現在に至る。

著者紹介をさらに表示する