国产精品久久久久久久久久东京,亚洲视频免费播放,少妇人妻精品一区二区三区视频,日韩一级品

好房網(wǎng)

網(wǎng)站首頁 科技 > 正文

大數(shù)據(jù)技術(shù)開始結(jié)合具體行業(yè)向行業(yè)應(yīng)用延伸

2022-01-10 09:22:19 科技 來源:搜狐網(wǎng)
導(dǎo)讀 2022年1月10整理發(fā)布:近年來,隨著大數(shù)據(jù)底層設(shè)施的逐漸成熟,大數(shù)據(jù)技術(shù)開始結(jié)合具體行業(yè),向行業(yè)應(yīng)用延伸。圍繞數(shù)據(jù)資源、基礎(chǔ)硬件、通

2022年1月10整理發(fā)布:近年來,隨著大數(shù)據(jù)底層設(shè)施的逐漸成熟,大數(shù)據(jù)技術(shù)開始結(jié)合具體行業(yè),向行業(yè)應(yīng)用延伸。圍繞數(shù)據(jù)資源、基礎(chǔ)硬件、通用軟件等方面的大數(shù)據(jù)產(chǎn)業(yè)正在逐漸形成。各行各業(yè)對(duì)大數(shù)據(jù)人才的需求也日益增強(qiáng)。 鑒于此,國內(nèi)外一些高校先后開設(shè)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)”專業(yè),旨在培養(yǎng)具備大數(shù)據(jù)技術(shù)的高級(jí)人才。

編寫目的

為滿足相關(guān)技術(shù)人員和高校師生學(xué)習(xí)大數(shù)據(jù)技術(shù)基礎(chǔ)知識(shí),我們?cè)诳偨Y(jié)近幾年大數(shù)據(jù)技術(shù)基礎(chǔ)知識(shí)和應(yīng)用案例的基礎(chǔ)上,以理論結(jié)合實(shí)踐的方式將大數(shù)據(jù)基本概念、大數(shù)據(jù)開發(fā)技術(shù)與實(shí)際應(yīng)用相結(jié)合,精心組織并完成了本書的編寫。

本書主要內(nèi)容

本書為一本夯實(shí)大數(shù)據(jù)基礎(chǔ)知識(shí),以實(shí)際應(yīng)用為導(dǎo)向的書籍,非常適合初、中級(jí)學(xué)習(xí)大數(shù)據(jù)技術(shù)的讀者。讀者可以在短時(shí)間內(nèi)學(xué)習(xí)本書中介紹的所有知識(shí),掌握大數(shù)據(jù)技術(shù)的開發(fā)方法。

作為一本關(guān)于大數(shù)據(jù)技術(shù)的入門書籍,本書共有14章。

第1章主要介紹了大數(shù)據(jù)的研究背景、大數(shù)據(jù)的定義及其技術(shù)特點(diǎn)以及大數(shù)據(jù)處理的主要技術(shù)特點(diǎn)與難點(diǎn),最后闡述了研究大數(shù)據(jù)的意義。

第2章主要介紹了Hadoop的起源、生態(tài)體系和集群架構(gòu),對(duì)Hadoop的安裝配置進(jìn)行了詳細(xì)的講解。

第3章主要介紹了Hadoop中非常重要的分布式存儲(chǔ)文件系統(tǒng)——HDFS,分析了HDFS的存儲(chǔ)架構(gòu)以及常用Shell命令和Java API,并且通過一個(gè)具體案例實(shí)現(xiàn)了HDFS的Java API的編程。

第4章主要介紹了Hadoop的分布式計(jì)算框架MapReduce,分析了MapReduce的核心思想、工作原理、運(yùn)行機(jī)制以及MapReduce的核心過程Shuffle,最后通過單詞計(jì)數(shù)和倒排索引兩個(gè)案例詳細(xì)分析MapReduce的編寫過程和思路。

第5章主要介紹了Hive的架構(gòu)、安裝和相關(guān)操作,重點(diǎn)介紹Hive的DDL、DML、DQL操作。

第6章首先介紹了HBase的架構(gòu)、尋址機(jī)制以及HBase的安裝,然后介紹了HBase的Shell操作,包括新建表、插入數(shù)據(jù)、刪除等操作,最后介紹了HBase常用的Java API,并且進(jìn)行了案例實(shí)現(xiàn)。

第7章主要介紹了Spark的基本概念和主要特點(diǎn)、Spark的安裝、運(yùn)行架構(gòu)和運(yùn)行基本流程,是為學(xué)習(xí)Spark RDD和 Spark SQL做基礎(chǔ)知識(shí)儲(chǔ)備。

第8章主要介紹了RDD的運(yùn)行原理和運(yùn)行流程,并對(duì)RDD的基本操作進(jìn)行了詳細(xì)的介紹,最后用一個(gè)Scala編程案例實(shí)現(xiàn)對(duì)RDD的操作。

第9章主要介紹了Spark SQL的原理和運(yùn)行流程,并對(duì)DataFrame的基本操作進(jìn)行了詳細(xì)的介紹,最后通過三個(gè)Scala編程案例實(shí)現(xiàn)了Spark SQL的DataFrame操作、Spark SQL 讀寫MySQL數(shù)據(jù)庫和Spark SQL讀寫Hive。

第10章主要介紹了Spark Streaming的一些基本概念和原理,介紹了DStream編程模型,最后通過三個(gè)Scala編程案例實(shí)現(xiàn)了DStream的有狀態(tài)狀態(tài)操作、無狀態(tài)狀態(tài)操作、輸出操作。

第11章主要介紹了Spark Streaming與Flume、Kafka的整合,介紹了Flume和Kafka的安裝過程,最后通過一個(gè)Scala編程案例實(shí)現(xiàn)Spark Streaming與Flume、Kafka的整合與開發(fā)。

第12章介紹了機(jī)器學(xué)習(xí)的定義和分類,重點(diǎn)介紹了Spark MLlib目前包含的算法和組件,通過四個(gè)具體實(shí)例TFIDF、線性回歸、邏輯回歸、協(xié)同過濾展示了利用Spark MLlib進(jìn)行機(jī)器學(xué)習(xí)的方法和步驟。

第13章介紹了分布式優(yōu)惠券后臺(tái)應(yīng)用系統(tǒng)的開發(fā)核心思路,優(yōu)惠券后臺(tái)應(yīng)用系統(tǒng)包括商戶投放子系統(tǒng)和用戶消費(fèi)子系統(tǒng),分別介紹了兩個(gè)子系統(tǒng)的核心代碼以及測(cè)試調(diào)用過程。

第14章介紹了新聞話題實(shí)時(shí)統(tǒng)計(jì)分析系統(tǒng)的開發(fā)核心思路和核心代碼以及啟動(dòng)調(diào)用過程。

本書特色

(1)以實(shí)戰(zhàn)開發(fā)為導(dǎo)向,對(duì)基礎(chǔ)理論知識(shí)點(diǎn)與開發(fā)過程進(jìn)行詳細(xì)講解。

(2)實(shí)戰(zhàn)案例豐富,涵蓋16 個(gè)完整項(xiàng)目案例和兩個(gè)綜合案例,綜合案例可以加深對(duì)本書所學(xué)的知識(shí)點(diǎn)的理解和掌握。

(3)代碼詳盡,避免對(duì) API 的形式展示,規(guī)避重復(fù)代碼。

(4)語言簡(jiǎn)明易懂,由淺入深帶領(lǐng)讀者學(xué)會(huì)以 Hadoop生態(tài)圈為核心的開發(fā)技術(shù)和大數(shù)據(jù)常見的機(jī)器學(xué)習(xí)算法。

配套資源

為便于教學(xué),本書配有源代碼、數(shù)據(jù)集、安裝程序、教學(xué)大綱。

編輯推薦

16個(gè)完整的項(xiàng)目案例和兩個(gè)綜合案例,配有教學(xué)大綱等資源

讀者對(duì)象

本書主要面向廣大從事大數(shù)據(jù)分析、應(yīng)用開發(fā)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘的專業(yè)人員以及從事高校信息技術(shù)專業(yè)的教師和高等院校的在讀學(xué)生及相關(guān)領(lǐng)域的廣大科研人員。


版權(quán)說明: 本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!


標(biāo)簽: