【課程學習目標】
1.每個算法模塊按照“原理講解→分析數據→自己動手實現→特征與調參”的順序。
2.“Python數據清洗和特征提取”,提升學習深度、降低學習坡度。
3.增加網絡爬蟲的原理和編寫,從獲取數據開始,重視將實踐問題轉換成實際模型的能力,分享工作中的實際案例或Kaggle案例:廣告銷量分析、環境數據異常檢測和分析、數字圖像手寫體識別、Titanic乘客存活率預測、用戶-電影推薦、真實新聞組數據主題分析、中文分詞、股票數據特征分析等。
4.強化矩陣運算、概率論、數理統計的知識運用,掌握機器學習根本。
5.闡述機器學習原理,提供配套源碼和數據。
6.以直觀解釋,增強感性理解。
7.對比不同的特征選擇帶來的預測效果差異。
8.重視項目實踐,重視落地。思考不同算法之間的區別和聯系,提高在實際工作中選擇算法的能力。
9.涉及和講解的部分Python庫有:Numpy、Scipy、matplotlib、Pandas、scikit-learn、XGBoost、libSVM、LDA、Gensim、NLTK、HMMLearn。
【課程介紹】
本課程特點是從數學層面推導經典的機器學習算法,以及每種算法的示例和代碼實現(Python)、如何做算法的參數調試、以實際應用案例分析各種算法的選擇等。
【培訓對象】
大數據分析應用開發工程師、大數據分析項目的規劃咨詢管理人員、大數據分析項目的IT項目高管人員、大數據分析與挖掘處理算法應用工程師、大數據分析集群運維工程師、大數據分析項目的售前和售后技術支持服務人員
【詳細培訓內容介紹】
【師資介紹】
張老師:阿里大數據專家,國內的Spark、Hadoop技術專家、虛擬化專家,對HDFS、MapReduce、HBase、Hive、Mahout、Storm、spark和openTSDB等Hadoop生態系統中的技術進行了多年的深入的研究,更主要的是這些技術在大量的實際項目中得到廣泛的應用,因此在Hadoop開發和運維方面積累了豐富的項目實施經驗。近年主要典型的項目有:某電信集團網絡優化、中國移動某省移動公司請賬單系統和某省移動詳單實時查詢系統、中國銀聯大數據數據票據詳單平臺、某大型銀行大數據記錄系統、某大型通信運營商全國用戶上網記錄、某省交通部門違章系統、某區域醫療大數據應用項目、互聯網公共數據大云(DAAS)和構建游戲云(Web Game Daas)平臺項目等。
【頒發證書】
參加相關培訓并通過考試的學員,可以獲得:
工業和信息化部頒發的-《Python大數據工程師證書》。該證書可作為專業技術人員職業能力考核的證明,以及專業技術人員崗位聘用、任職、定級和晉升職務的重要依據。注:請學員帶一寸彩照2張(背面注明姓名)、身份證復印件一張。
【關于我們】
軟博教育自成立以來即定位于軟件技術專業人才培養實訓機構,專注致力于軟件技術人才的培養,是中國科學院計算技術研究所教育中心合作培訓機構,也是工信部人才交流中心指定的全國計算機專業技術人才培訓基地”,“人力資源和社會**部——全國信息化人才培養工程項目(即“653工程”)指定培養機構”。
【學員上課情景】