2021西南財經大學數據挖掘綜合專業研究生考試大綱

發布時間:2020-11-10 編輯:考研派小莉 推薦訪問:
2021西南財經大學數據挖掘綜合專業研究生考試大綱

2021西南財經大學數據挖掘綜合專業研究生考試大綱內容如下,更多考研資訊請關注我們網站的更新!敬請收藏本站,或下載我們的考研派APP和考研派微信公眾號(里面有非常多的免費考研資源可以領取,有各種考研問題,也可直接加我們網站上的研究生學姐微信,全程免費答疑,助各位考研一臂之力,爭取早日考上理想中的研究生院校。)

2021西南財經大學數據挖掘綜合專業研究生考試大綱 正文

    適用專業:大數據管理
    考試科目:《數據挖掘綜合》
    第一部分:考試內容及要求
    一.數據挖掘概述
    考試內容
    數據挖掘的概念知識發現過程數據挖掘數據類型數據挖掘功能和模式數據挖掘可利用的技術數據挖掘應用數據挖掘的主要問題
    考試要求
    1.了解數據庫系統技術的演變過程;理解數據挖掘的概念;掌握知識發現過程的7個步驟。
    2.掌握數據挖掘的數據類型;掌握數據挖掘功能和模式;理解數據挖掘與統計學、機器學習的聯系和區別;了解數據挖掘的應用領域;了解數據挖掘的主要問題。
    二.數據預處理
    考試內容
    數據屬性數據基本描述統計數據預處理概述數據質量數據預處理的主要步驟數據清理數據集成數據變換數據規約數據離散化
    考試要求
    1.了解數據對象與屬性類型。
    2.理解數據的基本統計描述,掌握均值、中位數、眾數、極差、四分位數、方差、標準差和四分位數極差的概念和計算方法;了解數據基本統計描述的圖形顯示;了解度量數據的相似性和相異性。
    3.了解進行數據預處理的原因及其重要性;了解數據質量涉及的因素;掌握數據預處理的主要步驟。
    4.了解數據清理的概念;了解處理數據缺失值的方法;了解處理噪音數據的方法。
    5.理解數據集成的概念;掌握冗余和相關性分析的方法(檢驗,Pearson積矩系數)。
    6.了解數據變換的策略;掌握數據規范化的計算方法(最小-最大規范化、z分數規范化、按小數定標規范化)。
    7.理解數據歸約的概念;了解數據歸約的策略;了解線性回歸、對數線性模型、直方圖、聚類、抽樣等數據歸約方法。
    8.理解數據離散化和概念分層的概念;了解數據離散化的方法(分箱、直方圖分析、聚類分析、相關分析)。
    三.數據倉庫和聯機分析處理
    考試內容
    數據倉庫基本概念OLTP和OLAP數據立方體數據倉庫的數據模型概念分層典型的OLAP操作數據倉庫的設計數據倉庫的實現數據倉庫和數據挖掘
    考試要求
    1.理解數據倉庫的概念和關鍵特征;了解OLTP和OLAP的概念和主要區別。
    2.了解數據倉庫模型的種類;了解元數據庫的概念以及與其他數據的區別。
    3.理解數據立方體的概念;了解數據倉庫的數據模型(星型模式、雪花模式、事實星座模式);了解典型的OLAP操作方法。
    4.了解數據倉庫設計的四種視圖,了解數據倉庫的設計過程和步驟;了解OLAP查詢處理的步驟。
    5.了解三類數據倉庫應用;了解多維數據挖掘的重要性。
    四.挖掘頻繁模式、關聯和相關性
    考試內容
    頻繁項集概念頻繁項集挖掘方法Apriori算法FP-growth算法
    考試要求
    1.理解項集、閉項集、頻繁項集和關聯規則的概念;了解規則興趣度的兩種度量(支持度和置信度)。
    2.了解關聯規則挖掘的步驟。
    3.了解Apriori算法的步驟;了解FP-growth算法的步驟和優缺點;掌握相關性度量提升度(lift)的計算方法。
    五.分類和預測
    考試內容
    數據分類和預測的概念判定樹歸類算法信息增益樹剪枝回歸分析分類法的準確性組合分類器類不平衡問題
    考試要求
    1.理解數據分類的概念;了解分類的兩個過程;理解監督學習和非監督學習的區別;了解分類和預測的數據預處理方法;掌握評估分類和預測方法的標準。
    2.了解決策樹的概念和優缺點;了解決策樹歸分類的主要步驟;了解常用的屬性選擇度量,掌握信息增益度量的求法;理解兩種常用的樹剪枝方法。
    3.了解評估分類器性能的度量;了解評估分類和預測準確率的方法(混淆矩陣、靈敏度和特小型、F度量)。
    4.了解K-折交叉驗證和自助法的基本思想;了解ROC曲線的概念和特點。
    5.了解組合分類器的概念和常用的組合分類方法;了解裝袋和提升的基本思想以及兩者的區別;了解隨機森林的基本思想。
    6.了解類不平衡問題的概念;了解提高類不平衡數據分類準確率的一般方法。
    六.聚類分析
    考試內容
    聚類分析的概念聚類方法的分類算法方法的距離度量劃分方法層次方法基于密度的方法基于網格的方法聚類評估
    考試要求
    1.理解聚類分析的概念;了解聚類分析的應用領域;了解比較聚類方法的標準;了解數據挖掘對聚類的典型要求;了解比較聚類方法的各個方面。
    2.理解劃分方法的概念和一般特點,以及典型算法;理解層次方法的概念和一般特點,以及典型算法;理解基于密度的聚類方法的概念和一般特點,以及典型算法;理解基于網格的聚類方法的概念和一般特點,以及典型算法;
    3.理解K-均值算法的步驟和優缺點;
    4.了解算法方法的距離度量。
    5.了解聚類評估概念和主要任務;了解測定聚類質量的方法。
    第二部分:考試方法和考試時間
    數據挖掘綜合考試采用閉卷、筆試形式,考試時間為180分鐘。
    第三部分:試卷結構及參考書目
    (一)題分:試卷滿分為150分
    (二)題型比例:
    選擇題與判斷題約40%
    簡答題和計算題約60%
    (三)參考書目:
    《數據挖掘概念與技術》(原書第3版),作者:JiaweiHan(韓家煒),出版社:機械工業出版社。
西南財經大學

添加西南財經大學學姐微信,或微信搜索公眾號“考研派小站”,關注[考研派小站]微信公眾號,在考研派小站微信號輸入[西南財經大學考研分數線、西南財經大學報錄比、西南財經大學考研群、西南財經大學學姐微信、西南財經大學考研真題、西南財經大學專業目錄、西南財經大學排名、西南財經大學保研、西南財經大學公眾號、西南財經大學研究生招生)]即可在手機上查看相對應西南財經大學考研信息或資源

西南財經大學考研公眾號 考研派小站公眾號

本文來源:http://m.btfokj.cn/xinancaijing/cankaoshumu_370590.html

推薦閱讀