分類
書籍資訊
書號:FB030
作者:劉勇志
ISBN:9789864553778
初版日期:2017-03-01
最新出版日期:2024-08-28
出版商:台科大圖書
建議售價: NT$550
哪裡買特色
1.闡述大數據的重要觀念,包括正面的效用與負面的副作用,建立 讀者對大數據正確的認知。2.說明大數據時代的因應與挑戰,其中有思維的轉變、大數據分析技術、大數據的應用模式分類,也有大數據分析的流程。
3.介紹各行各業的大數據經典應用案例,讓讀者體會大數據分析的應用精髓,有機會發揮創造力,開創自己的大數據應用。
4.介紹大數據分析工具(Hadoop和Spark)的生態系統,期使讀者能充分掌握大數據的技術發展和工具的應用藍圖。
5.透過對大數據工具的實戰演練,包括安裝、設定、指令操作等,使讀者在具備大數據概念正確理解的同時,還能擁有動手實現的功力。
6.學習大數據程式語言Scala,熟悉函數式程式設計(functional programming)的特點,以及它對於大數據的操作與處理,提升讀者對大數據分析演算法的開發能力。
7.使用Spark的機器學習程式庫(MLlib),應用在既有資料集的分析上,讓讀者迅速獲得大數據的預測能力。
目錄
觀念篇第1 章 進入大數據時代
1-1 大數據時代來了
1-2 「大」數據有多「大」
1-3 大數據的「大」特徵
1-4 大數據的「大」作用
1-5 大數據的「大」問題
1-6 結語
第2 章 大數據挑戰與因應
2-1 大數據的思維轉變
2-2 大數據案例
2-3 大數據的應用模式分類
2-4 大數據計畫的啟動
2-5 結語
第3 章 大數據分析技術
3-1 資料科學
3-2 資料分析工具箱
3-3 大數據分析流程
3-4 結語
工具篇
第4 章 大數據工具與生態系統
4-1 Hadoop/HDFS:分散式檔案系統
4-2 Spark:平行運算框架
4-3 NoSQL 資料庫
4-4 結語
第5 章 大數據作業系統Ubuntu 的安裝
5-1 安裝虛擬化系統工具Oracle VirtualBox
5-2 新增和設定Ubuntu 虛擬機
5-3 安裝和設定Ubuntu 作業系統
第6 章 大數據平台Hadoop 和Spark 的安裝
6-1 建立和設定master 主機
6-2 建立slave1 虛擬機
6-3 繼續master 的設定
6-4 啟動Hadoop 主機集群
6-5 試玩HDFS
6-6 試玩Spark
6-7 結束Spark 和Hadoop
第7 章 HDFS 和Spark RDD 的操作
7-1 HDFS 的操作指令
7-2 Spark RDD 的操作
第8 章 Scala—大數據的程式語言
8-1 Scala 基礎
8-2 基本的資料型態
8-3 資料集Collections
8-4 邏輯流程控制
8-5 函數
8-6 常用資料集處理方法
8-7 模式匹配Pattern Matching
應用篇
第9 章 大數據分析應用基礎
9-1 字數計算(word count)
9-2 矩陣相乘
9-3 頻繁項(frequent items)分析
9-4 One-hot 編碼
9-5 相似性(similarity)計算
9-6 文件資料反向排序
第10 章 大數據分析範例—葡萄酒分析
10-1 葡萄酒品質資料集
10-2 讀入資料檔
10-3 基本統計資料
10-4 建立LabeledPoint 資料類別格式
10-5 資料標準化
10-6 切割資料集
10-7 預測模型訓練
10-8 預測與模式評估MSE
10-9 參數最佳組合與模型測試
10-10 結論
第11 章 大數據分析範例—書籍推薦
11-1 推薦技術
11-2 書籍資料集
11-3 讀入資料檔與資料前處理
11-4 建立Rating 資料格式
11-5 切割資料集
11-6 預測模型訓練
11-7 計算均方差MSE
11-8 參數最佳組合與最佳模型
11-9 使用最佳模型進行推薦
第12 章 大數據分析範例—鳶尾花分類
12-1 大數據分析流程
12-2 分類演算法
12-3 鳶尾花資料集
12-4 讀入資料檔與資料前處理
12-5 資料集隨機切割
12-6 模式設定與訓練
12-7 使用評價器(evaluator)計算準確度
12-8 交叉驗證
12-9 使用最佳模式來預測新值
附錄 參考文獻
本書題目為 實作、問答、填充 等題型,須由教師命題測驗,提供學生進行診斷
GTC中英文看打輸入學習系統
線上看打學習系統試用版
您尚未登錄書籍序號,請完成序號登錄,取得完整版線上學習功能!
注意:試用版僅提供【101】學習單元,練習時間1分鐘。
注意:試用版僅提供【101】學習單元,練習時間1分鐘。
※ 認識Typing
*每回輸入一篇文章。
*錯誤率5%(含)以上,以0分計算。
*僅練習時間10分鐘會顯示近期成果曲線圖。
*系統成績計算規則:
中文看打輸入-
1.輸入正確一字,得一分。每列錯字、漏字、多打的字,倒扣0.5分。
2.測驗結束後的總正確輸入字扣除倒扣分數後與測驗時間數(以分鐘為單位)的比值,即為成績。
3.錯誤率=錯誤字數除以總字數,錯誤率5%(含)以上,以0分計算。
英文看打輸入-
1.誤打、多打、重打、漏打或與試卷上之原稿有任何不符之處,概視為錯誤一次計算(一字最多只計一次錯誤),標點和空格均視為前一字的一部分。
2.罰則:每錯誤一次扣總擊數五十擊。
3.成績計算:(總擊數—錯字*50)∕ 5 ∕ 時間=每分鐘淨打字數。
未列舉者,悉以認證測驗軟體之處理方式為準。
學習信用考試碼使用規範
學習信用考試碼:{{creditCode}}
(所有小考與擬真測驗皆通過,才會顯示「學習信用考試碼」)很可惜,您未通過「學習信用考試」,請進行補測
恭喜!您已通過國際認證考試!欲查詢成績與下載證書,請至PSC專業認證平臺(https://psc.ipoe.cc/)。
學習信用考試碼使用規範
學習信用考試碼使用規範
很可惜,您未通過「學習信用考試」