途索:Python3數據分析與挖掘建模實戰 影片教學 國語發音/無字幕 DVD版 --=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= 語系版本:國語發音/無字幕 光碟片數:單片裝 破解說明:MP4檔 系統支援:Windows7/8/8.1/10 軟體類型:教學 更新日期:2019.07.13 --=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= 視頻有水印;本課程的代碼在字幕區。 【適合人群】 適合有數學基礎,想從事數據分析,卻不知如何入門的同學,也適合剛入門數據分 析,想提升數據分析思路,解決工作中不同種類特徵的處理難題的初學者,完成本 課程的學習,不僅有助於數據分析與挖掘類的面試、考試(如CDA等),更會提升 你對數據分析內涵的認知,同時,對大規模數據怎麼處理,也會有新的思路 學前必備技術: 數學基礎知識 Python基礎知識 【課程章節】 第1章課程介紹【贈送相關電子書+隨堂代碼】 本章首先介紹本課程是什麼,有什麼特色,能學習到什麼,內容如何安排,需要什 麼基礎,是否適合學習這門課程等。然後對數據分析進行概述,讓大家對數據分析 的含義和作用有一個整體的認知,讓大家對自己接下來要做的事情,有一個基本的 概念與瞭解。... 1-1課程導學 1-2數據分析概述 第2章數據獲取 數據從哪裡來?怎麼來?這一章,我們會介紹數據獲取的一般手段。主要包括數據 倉庫、抓取、資料填寫、日誌、埋點、計算等手段。同時,我們也會介紹幾個常用 的數據網站,供大家參考與學習。 2-1數據倉庫 2-2監測與抓取 2-3填寫、埋點、日誌、計算 2-4數據學習網站 第3章單因子探索分析與數據可視化 有了數據,如何上手?這一章,我們會介紹探索分析的一部分---單因子探索分析 和可視化的內容。我們會以基礎的統計理論知識為切入點,學習異常值分析、對比 分析、結構分析、分佈分析。同時,引入接下來幾章都會用到的案例-HR人力資源 分析表,並用理論與可視化的方法,完成對此表的初步分析。... 3-1數據案例介紹 3-2集中趨勢離中趨勢 3-3數據分佈--偏態與峰度 3-4抽樣理論 3-5編碼實現(基於python2.7) 3-6數據分類 3-7異常值分析 3-8對比分析 3-9結構分析 3-10分佈分析 3-11SatisfactionLevel的分析 3-12LastEvaluation的分析 3-13NumberProject的分析 3-14AverageMonthlyHours的分析 3-15TimeSpendCompany的分析 3-16WorkAccident的分析 3-17Left的分析 3-18PromotionLast5Years的分析 3-19Salary的分析 3-20Department的分析 3-21簡單對比分析操作 3-22可視化-柱狀圖 3-23可視化-直方圖 3-24可視化-箱線圖 3-25可視化-折線圖 3-26可視化-餅圖 3-27本章小結 第4章多因子探索分析 上了手,然後呢?這一章,我們介紹探索分析的另一部分---多因子復合探索分析。 我們同樣以基礎的統計知識為切入點,學習多因子間互相影響與配合的分析方法, 如交叉分析、分組分析、相關分析、成分分析等。同時,以HR人力資源分析表為例 ,進行進一步的探索。... 4-1假設檢驗 4-2卡方檢驗 4-3方差檢驗 4-4相關係數 4-5線性回歸 4-6主成分分析 4-7編碼實現 4-8交叉分析方法與實現 4-9分組分析方法與實現 4-10相關分析與實現 4-11因子分析與實現 4-12本章小結 第5章預處理理論 數據已瞭解,用起來!不著急,先加工。這一章,我們會介紹特徵工程的主要內容 ,重點會介紹數據清洗和數據特徵預處理的主要內容,包括數據清洗、特徵獲取、 特徵處理(內含對指化、歸一化、標準化等)、特徵降維、特徵衍生。預處理的好 壞,直接影響著接下來模型的效果。... 5-1特徵工程概述 5-2數據樣本採集 5-3異常值處理 5-4標注 5-5特徵選擇 5-6特徵變換-對指化 5-7特徵變換-離散化 5-8特徵變換-歸一化與標準化 5-9特徵變換-數值化 5-10特徵變換-正規化 5-11特徵降維-LDA 5-12特徵衍生 5-13HR表的特徵預處理-1 5-14HR表的特徵預處理-2 5-15本章小結 第6章挖掘建模 把數據用起來!這一章,我們會介紹數據挖掘與建模的主要內容。主要包含五類模 型的建立與實踐,分別為:分類模型(KNN、樸素貝葉斯、決策樹、SVM、集成方法 、GBDT……),回歸模型與回歸思想分類(線性回歸、邏輯斯特回歸【也叫羅吉回 歸,邏輯回歸。音譯區別】、神經網絡、回歸樹),聚類模型(K-means、DBSCAN、 層次聚類、... 6-1機器學習與數據建模 6-2訓練集、驗證集、測試集 6-3分類-KNN 6-4分類-樸素貝葉斯 6-5分類-決策樹 6-6分類-支持向量機 6-7分類-集成-隨機森林 6-8分類-集成-Adaboost 6-9回歸-線性回歸 6-10回歸-分類-邏輯回歸 6-11回歸-分類-人工神經網絡-1 6-12回歸-分類-人工神經網絡-2 6-13回歸-回歸樹與提升樹 6-14聚類-Kmeans-1 6-15聚類-Kmeans-2 6-16聚類-DBSCAN 6-17聚類-層次聚類 6-18聚類-圖分裂 6-19關聯-關聯規則-1 6-20關聯-關聯規則-2 6-21半監督-標籤傳播算法 6-22本章小結 第7章模型評估 哪個模型好?上一章,我們學習了很多模型,一個數據集,可能用多種模型都可以 進行建模,那麼哪種模型好,就需要有些指標化的東西幫我們決策。這一章,我們 會介紹使用混淆矩陣和相應的指標、ROC曲線與AUC值來評估分類模型;用MAE、MSE 、R2來評估回歸模型;用RMS、輪廓係數來評估聚類模型。... 7-1分類評估-混淆矩陣 7-2分類評估-ROC、AUC、提升圖與KS圖 7-3回歸評估 7-4非監督評估 第8章總結與展望 這一章,我們將回顧本課程的全部內容,並從多個角度,重新看待我們的數據分析 工作。最後,我們會瞭解到,學習了這門課程以後,還可以在哪些方面進行發展。 8-1課程回顧與多角度看數據分析 8-2大數據與學習這門課後還能幹什麼_音頻.mp4 --=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=