本站小編為你精心準備了信息挖掘應用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
2研究的主要方向
目前國內外信息挖掘的研究主要是以知識發現的任務描述、知識評價與知識呈現為主線,以基于各種理論的有效知識發現算法研究為中心,以及更加廣泛的應用研究為主要特點。
結構化數據挖掘技術的研究較為成熟,主要集中在算法的適應性、擴展性和魯棒性的研究上。圍繞統計學方法的數據挖掘算法的研究一直受到關注,用于在具有先驗知識的情況下的不確定知識發現。關聯規則知識發現算法是眾多的應用研究的基礎,研究工作集中在算法的改造以及可擴展性和普適性的研究上。序貫模式是R.Agrawal提出的重要的數據挖掘方法。包括單一的概念層次,多概念層次的序貫模式的研究。在不同的概念層次發現序貫模式是十分有價值的。
神經網絡是目前常用的數據挖掘技術,廣泛應用于分類、聚類、預測建模和混沌模式的知識發現。基于概念格理論的知識發現的理論研究和應用近年來受到重視。復雜類型數據的知識發現是目前國內外知識發現領域的研究熱點??臻g數據是指同占有一定空間的對象的相關聯的數據??臻g數據挖掘方法主要包括空間分類和空間趨勢分析。
文本挖掘用于基于文本信息的知識發現。文本挖掘是利用智能算法,并結合文字處理技術,分析大量的非結構化文本源,抽取或標記關鍵字概念,文字間的關系,獲取有用的知識和信息。其關鍵在于文本內容的量化表征。多媒體數據的知識發現的研究主要是特征的抽取。在音頻數據挖掘中Fourie變換等用于抽取不變性特征。相應的知識發現方法包括學習矢量量化和多層感知器等神經網絡方法。
信息挖掘的理論研究表現出多學科的交叉和多種技術方法的融合及信息挖掘的泛化和統一的特征。知識發現技術逐漸滲透到復雜非線性系統,如社會科學、生物信息科學、商業與金融領域、地震和氣象學等領域的信息處理之中。復雜性系統的信息過程表現出顯著的非線性動力學特征。
3信息挖掘是商業信息處理技術的關鍵
商業領域中的海量歷史數據與實時數據和廣泛的應用需求為信息挖掘的應用和發展提供了一個廣闊的空間。信息挖掘與已有信息系統和人工智能技術相結合,為商業與金融數據的分析處理提供了重要的工具和理論方法。這些理論和工具已經被用于解決金融與商業領域的以下各類問題:信用等級的評估;金融和經濟預測;證券價格變動的預測;破產和銀行倒閉預測;惡性透支和商業欺詐甄別;證券的投資選擇和分類;商業行為分析以及銷售與客戶關系分析等。
在金融與商業領域中,信息挖掘技術的應用表現為范圍上的延拓和層次上的深化以及多種技術方法的整合。利用文本挖掘,可以從Internet上的成千上萬的與金融相關的Web網頁中獲取全球金融市場的實時數據、與金融市場相關的市場、宏觀經濟環境、政策和法規等消息、進行金融分析報告等。利用數據挖掘技術對分布于全球的市場消息和信息的處理來預測全球市場的主要股票指數,并對全球主要外匯交易市場貨幣交易率的未來走勢進行預測和決策分析。
從細微和難懂的數據中識別、發現和抽取各類知識和規律。這樣的商業分析每天都在發生:營銷管理人員需要為某種產品進行目標市場分析;同時他們要求知道購買競爭對手產品的客戶規模、潛在客戶對優惠券的相對接受能力、競爭對手的產品在零售商店中陳設的位置、下一個商業周期中對自己的及競爭對手的產品需求預測,等等。基于信息挖掘的商業與金融信息處理技術的價值在于能夠為使用者提供從數據集合中發現新關系的能力。極大地加強戰術和戰略決策以及決策過程的精確性。
信息挖掘這一概念起源于知識發現(KDD)領域,廣泛地應用到科學研究、金融、保險、醫療保健、司法和制造等各個行業。各個學科領域都從不同的角度利用相應的理論和分析方法進行著信息挖掘的研究工作,涉及到機器學習、統計分析、數據庫技術、模式識別、人工智能、神經網絡、可視化方法、不確定性推理、人工生命、模糊邏輯和粗糙集理論等領域。
信息挖掘的應用對象從結構化數據發展到半結構化及非結構化的復雜數據類型,包括關系數據庫、面向對象數據庫、空間數據庫、推理數據庫、多媒體數據庫、時態數據庫、文本數據、Web日志文件、圖形圖像數據及音頻和視頻數據等。信息挖掘所涉及到的知識類型,根據應用特點可分為預測型、描述型、發現型、驗證型等類型知識,根據知識的性質特點可分為關聯規則、分類規則、聚類規則、時序模式、相似模式、混沌模式、回歸模式、趨勢分析、偏差分析、模式分析等。