網(wǎng)絡系廖年冬博士給本科生作學術報告
發(fā)布時間: 2018-06-26 19:57:22 瀏覽量:
2018年6月26日下午2點,計算機與通信工程學院網(wǎng)絡系主任廖年冬博士在理科樓A102室給網(wǎng)絡工程專業(yè)的本科生做了題目為“數(shù)據(jù)挖掘知識簡介”的學術報告。
廖博士介紹了數(shù)據(jù)挖掘(Data mining)又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫知識發(fā)現(xiàn)(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。
數(shù)據(jù)挖掘通常與計算機科學有關,并通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)(依靠過去的經驗法則)和模式識別等諸多方法來實現(xiàn)上述目標。
數(shù)據(jù)挖掘利用了來自如下一些領域的思想:(1) 來自統(tǒng)計學的抽樣、估計和假設檢驗,(2)人工智能、模式識別和機器學習的搜索算法、建模技術和學習理論。數(shù)據(jù)挖掘也迅速地接納了來自其他領域的思想,這些領域包括最優(yōu)化、進化計算、信息論、信號處理、可視化和信息檢索。一些其他領域也起到重要的支撐作用。特別地,需要數(shù)據(jù)庫系統(tǒng)提供有效的存儲、索引和查詢處理支持。源于高性能(并行)計算的技術在處理海量數(shù)據(jù)集方面常常是重要的。分布式技術也能幫助處理海量數(shù)據(jù),并且當數(shù)據(jù)不能集中到一起處理時更是至關重要。
為了讓計算機與通信工程學院本科生了解數(shù)據(jù)挖掘技術的發(fā)展歷史、發(fā)展現(xiàn)狀和未來技術應用,尤其是對接現(xiàn)在十分熱門的人工智能技術,廖年冬博士全面介紹了以下幾種技術:
· 分類 (Classification)
· 估計(Estimation)
· 預測(Prediction)
· 相關性分組或關聯(lián)規(guī)則(Affinity grouping or association rules)
· 聚類(Clustering)
· 復雜數(shù)據(jù)類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
另外,也從現(xiàn)實生活出發(fā),介紹了數(shù)據(jù)挖掘在教育、醫(yī)療、大數(shù)據(jù)分析等方面的應用。