大數(shù)據(jù)的使用范圍很廣,學習范圍也同樣很廣,我們平時用到的淘寶、抖音、健康寶都需要用到大數(shù)據(jù),甚至有人說,大數(shù)據(jù)比你更了解你自己。從這一點來看,大數(shù)據(jù)是一種偉大的技術(shù)。想要轉(zhuǎn)行,大數(shù)據(jù)開發(fā)學習路線如何規(guī)劃?小編以千鋒的大數(shù)據(jù)培訓課程為例為大家介紹。
第一階段:離線數(shù)倉(7周)
1.掌握能力
掌握企業(yè)級基建環(huán)境部署、Hive和Spark數(shù)據(jù)開發(fā)、數(shù)據(jù)倉庫搭建、數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載、數(shù)據(jù)應用和京東離線ETL。
2.技術(shù)點
Java、MySQL、Maven、Git、OpenResty、Linux、Shell、HDFS、YARN、Zookeeper、MapReduce、Scala、Python、SparkCore、Hive、SparkSQL、Presto、Sqoop、DataX、Flume、CDH、數(shù)倉架構(gòu)、維度建模、SuperSet、Azkaban、Airflow等。掌握企業(yè)級基建環(huán)境部署、Hive和Spark數(shù)據(jù)開發(fā)、數(shù)據(jù)倉庫搭建、數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載、數(shù)據(jù)應用和京東離線ETL。
3.項目
數(shù)據(jù)服務、大數(shù)據(jù)可視化、企業(yè)級Hadoop基建項目部署、分布式網(wǎng)絡爬蟲、基于Spark的大數(shù)據(jù)分析項目、ETL項目之Hive和SparkSQL、BI商業(yè)分析等。
第二階段:實時倉庫(5周)
1.掌握能力
掌握流數(shù)據(jù)接入、基于Flink實時數(shù)據(jù)開發(fā)、流批一體數(shù)據(jù)倉庫開發(fā)、數(shù)據(jù)湖開發(fā)、實時ETL、實時監(jiān)控系統(tǒng)和京東實時數(shù)據(jù)開發(fā)。
2.技術(shù)點
Kafka、Structured Streaming、Hudi、Canal、Flink、ClickHouse、HBase、Phoenix、Elasticsearch、Redis。
3.項目
實時監(jiān)控系統(tǒng)、基于Flink的實時數(shù)據(jù)開發(fā)、實時數(shù)據(jù)湖、大數(shù)據(jù)搜索系統(tǒng)。
第三階段:實時倉庫(4周)
1.掌握能力
掌握企業(yè)項目開發(fā)流程、用戶畫像開發(fā)、企業(yè)級推薦系統(tǒng)開發(fā)、數(shù)據(jù)治理、基于生產(chǎn)環(huán)境項目部署和京東項目性能調(diào)優(yōu)。
2.技術(shù)點
數(shù)據(jù)采集與監(jiān)控平臺、準實時數(shù)據(jù)倉庫、用戶畫像、推薦系統(tǒng)、基于Flink的實時數(shù)據(jù)倉庫、元數(shù)據(jù)管理與數(shù)據(jù)治理。
3.勝任職位
數(shù)據(jù)服務工程師、離線數(shù)據(jù)倉庫開發(fā)工程師、BI商業(yè)分析師、實時數(shù)據(jù)倉庫工程師、實時監(jiān)控系統(tǒng)工程師、ETL工程師、數(shù)據(jù)可視化工程師、數(shù)據(jù)治理工程師、高級數(shù)據(jù)開發(fā)工程師、推薦工程、數(shù)據(jù)平臺工程師、數(shù)據(jù)架構(gòu)師。
以上就是大叔與開發(fā)學習路線,但大家不要盲目地學習,大數(shù)據(jù)雖然是一門當前很火熱的技術(shù),但通過上面的學習路線就能看出,學好大數(shù)據(jù)并不容易,我們最好先系統(tǒng)了解大數(shù)據(jù),去培訓機構(gòu)參加試聽課,如果能適應能接受,再決定學習也不晚。千鋒教育歡迎你隨時來咨詢大數(shù)據(jù)培訓課程!