網(wǎng)絡(luò)系廖年冬博士給本科生作學(xué)術(shù)報(bào)告
發(fā)布時(shí)間: 2018-06-26 19:57:22 瀏覽量:
2018年6月26日下午2點(diǎn),計(jì)算機(jī)與通信工程學(xué)院網(wǎng)絡(luò)系主任廖年冬博士在理科樓A102室給網(wǎng)絡(luò)工程專業(yè)的本科生做了題目為“數(shù)據(jù)挖掘知識(shí)簡介”的學(xué)術(shù)報(bào)告。
廖博士介紹了數(shù)據(jù)挖掘(Data mining)又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個(gè)步驟。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。
數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)有關(guān),并通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來實(shí)現(xiàn)上述目標(biāo)。
數(shù)據(jù)挖掘利用了來自如下一些領(lǐng)域的思想:(1) 來自統(tǒng)計(jì)學(xué)的抽樣、估計(jì)和假設(shè)檢驗(yàn),(2)人工智能、模式識(shí)別和機(jī)器學(xué)習(xí)的搜索算法、建模技術(shù)和學(xué)習(xí)理論。數(shù)據(jù)挖掘也迅速地接納了來自其他領(lǐng)域的思想,這些領(lǐng)域包括最優(yōu)化、進(jìn)化計(jì)算、信息論、信號(hào)處理、可視化和信息檢索。一些其他領(lǐng)域也起到重要的支撐作用。特別地,需要數(shù)據(jù)庫系統(tǒng)提供有效的存儲(chǔ)、索引和查詢處理支持。源于高性能(并行)計(jì)算的技術(shù)在處理海量數(shù)據(jù)集方面常常是重要的。分布式技術(shù)也能幫助處理海量數(shù)據(jù),并且當(dāng)數(shù)據(jù)不能集中到一起處理時(shí)更是至關(guān)重要。
為了讓計(jì)算機(jī)與通信工程學(xué)院本科生了解數(shù)據(jù)挖掘技術(shù)的發(fā)展歷史、發(fā)展現(xiàn)狀和未來技術(shù)應(yīng)用,尤其是對(duì)接現(xiàn)在十分熱門的人工智能技術(shù),廖年冬博士全面介紹了以下幾種技術(shù):
· 分類 (Classification)
· 估計(jì)(Estimation)
· 預(yù)測(Prediction)
· 相關(guān)性分組或關(guān)聯(lián)規(guī)則(Affinity grouping or association rules)
· 聚類(Clustering)
· 復(fù)雜數(shù)據(jù)類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
另外,也從現(xiàn)實(shí)生活出發(fā),介紹了數(shù)據(jù)挖掘在教育、醫(yī)療、大數(shù)據(jù)分析等方面的應(yīng)用。