<sup id="83vmb"></sup>

  • <span id="83vmb"></span><bdo id="83vmb"><meter id="83vmb"></meter></bdo>
    <sup id="83vmb"><table id="83vmb"><em id="83vmb"></em></table></sup>
    <bdo id="83vmb"><del id="83vmb"></del></bdo>
  • 国产香蕉97碰碰久久人人,久久精品无码一区二区小草,在线看片免费人成视频久网 ,日本黄页网站免费大全,强被迫伦姧高潮无码bd电影,日韩精品一区二区三区无,久久国产国内精品国语对白,好吊视频在线一区二区三区
    優勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯盟(新鄉市博翰文化傳媒有限公司)
    0373-5939925
    2851259250@qq.com
    我要檢測 我要投稿 合法期刊查詢
    您的位置:網站首頁 > 優秀論文 > 科技論文 > 正文

    面向大數據的高維數據挖掘技術研究

    作者:雷宇來源:《企業科技與發展》日期:2019-08-29人氣:2254

    1  大數據的發展挑戰

    1.1  在技術架構形式上

    現階段,數據庫正在全球化,立足于該發展模式,分布式模式需要得以創建,除了需要龐大機器之外,還需要有效處理龐大的數據信息。但是面對大數據時代,針對飛速激增的數據量,傳統數據分析已經不能滿足需求,在以下3個方面得到體現:

    1.1.1  數據處理的時效性

    面對大數據不斷推行,為了符合現階段數據處理實際需求,數據實現在線處理。在此基礎上,無論是數據處理選擇,還是數據處理模式,都不斷改變,處理具有實時性,除了能夠實現流處理之外,批處理也成功實現。立足于大數據實時性處理,無論是業務需求,還是根據應用,都逐步發生改變。

    1.1.2  實現了動態變化環境中的索引形式

    在索引形式的基礎上,關系數據庫查詢速度將不斷提升,可是使用傳統數據管理模式,索引形式并不可以產生變化,在此基礎上,無論是更新效率,還是創建方式,都不斷形成。針對大數據信息的變化特點,除了需要具備設計簡潔的特點,創建索引方式還需要具有高效的特點,由此針對大數據變化,無論是數據信息的需求調整,還是數據信息的處理,都可以良好使用。所以說,針對大數據變化,全新的索引形式需要成功設計,在此基礎上確保查詢工作順利實施。

    1.1.3  先驗知識的缺失

    立足于傳統數據分析結構,在關系型保存模式基礎上,無論是出現先驗知識,還是隱藏內部關系,都早已出現。比如說,對信息屬性進行分析過程中,可能存在的取值范圍需要確定,并且在實際分析之前,數據的了解就已經形成。針對大數據分析,無論是非結構化數據,還是半結構化數據,都需要創建類似數據,并且正式關系式需要實現。但是數據流的產生是不間斷進行的,所以說針對實時發生的數據,先驗知識并不會創建完善,在此情況下,對無先驗知識,需要及時發現并及時處置。

    2  高維數據挖掘中的問題

    2.1  高維數據簡介

    在大數據庫飛速增加的基礎上,維數同樣在急劇擴大,一旦增長到瓶頸出,數據處理將難以進行,人們將該數據就叫做高維數據。相對于傳統數據挖掘而言,除了具有復雜性的特點之外,高維數據還具有多信息量性,由此成為數據挖掘的核心所在。

    2.2  高維數據的特點

    (1)稀疏性:實質就是數據庫相對龐大時,即便高維數據非常多,但是能夠符合使用要求的,相對較少。

    (2)維度災難:挖掘高維數據的過程中,往往存在較多的屬性變化,在此情況下,索引結構性能將不斷降低,特別是無論最近鄰,還是最遠鄰,和查詢點的距離往往都一樣,由此最近鄰往往是沒有意義的,為此數據挖掘難度將急劇增加。

    2.3  高維數據對于數據挖掘產生的影響

    結合大數據特征,實際挖掘數據過程中,使用最近鄰法,在龐大數據中查詢效率將急劇提升,最近鄰法往往依賴索引結構進行的,可是針對高維數據存在維度災難的特點,最近鄰查詢往往被索引結構支持度將不斷降低,甚至是使得最近鄰查詢無法有效進行。

    無論是進行高維數據的分類聚類分析,還是進行高維數據的異常檢測,受制于索引結構的制約,效果將大打折扣,甚至是失去效果,由此無論是異常檢測算法還是聚類分析性能將不斷降低;除此之外,針對同樣的數據點距離,使得分類聚類概念意義不斷消失,針對高危空間數據具備的稀疏性,任何數據點都能夠視為異常點,此時針對高維數據異常檢測將變得困難重重。

    2.4  高維數據挖掘的研究方向

    (1)距離函數或相似性度量函數:無論是重新定義距離函數,還是重新定義相似性度量函數,都能夠成功避免“維度災難”的制約。

    (2)選維和降維:在不斷降低高維數據維度的基礎上,使得其成功形成低維數據,由此進行低維數據的數據挖掘。同時該方法最為人們所接受。

    (3)高效的聚類算法和異常檢測算法:為成功解決算法效率不高的難題,存在三個方面的措施:第一,設計性能更好的索引結構;第二,增量算法;第三,并行算法。

    3  大數據的高維數據挖掘技術

    3.1  大數據儲存的三維矩陣模型

    針對不一樣來源的數據,往往可以選取不一樣的數據處理方式。比如說,通常情況下,在分解數據種類的基礎上,能夠將調研數據分為三類:第一,單選;第二,多選;第三,排序。無論是傳統數據記錄,還是傳統數據分析過程中,都是立足于同樣數據庫開展的,由此增加維度的不一樣,無論是數據分析,還是數據處理,都將受到制約。

    所以說,針對大數據時代,數據模型的創建除了需要具有內容多的特征,還需要存在極強的通用性。同樣以上文例子為例,在數據調研過程中,無論是單選,還是多選,都能夠依據向量來有效表達,對應的題目排序可以利用矩陣來表現,在社會網絡數據的基礎上進行,并且結合關鍵性類別來實際代表選題方式,最后模型轉換則是建立在三維矩陣和傳統數據庫基礎之上的(如圖1),處理關鍵數據,由此不一樣的空間形式將存在空間維度之上,此時三維矩陣將有全部數據來源構成,進行有效組合之后,形成立體式模型,如圖2。

    3.2  關聯規則的三維矩陣挖掘

    實際進行大數據挖掘過程中,關聯規則挖掘是最受人們青睞的。無論是不一樣的屬性,還是項目關系,都是沒有辦法隱藏,同時也是沒有辦法預知的,只有在統計方法和數據庫的基礎上加以實現。現階段,關聯規則挖掘技術憑借其良好的性能,成為了使用廣泛的技術之一,在關聯規則挖掘過程中存在以下核心要素:

    (1)置信度:主要用于度量衡量強度以及準確性;

    (2)支持度:主要用于衡量度量重要性。

    在日常生活和工作中,在關聯規則挖掘過程中,只有上訴核心因素數值最小的時候,支持度同樣也對應最小值,由此才得以成功處于關聯規則內。假如需要使得關聯規則可靠性最低,此時置信度需要確保為最低。

    想要使得多維數據成功在空間中表現,立足于空間特種,能夠在多維儲存模型的基礎上成功表現,由此無論是數據層次還是數據語言,都能夠有效表達。比如說:在檢測海洋數據過程中,氣象環境除了風力之外,還有降水等等;海底環境處理重力之外,還有水深等等;水體環境除了有水溫計鹽度之外,還有潮流和水聲,因素眾多且相互交織,由此多維數據得以形成。在模型建立的基礎上,使得多維數據能夠在空間成功表達,使得海洋多樣化的數據結構得以呈現。

    3.3  基于超圖的聚類算法

    在原始數據相互關系的基礎上,結合超圖數據集,使得圖形劃分方法不斷得到優化,此為超圖聚類算法。在三維矩陣之中,利用分割算法進行圖像劃分,使用最為廣泛的即為HMETIS算法,存在如下步驟:

    (1)首先是粗化階段,在最小超圖的基礎上,結合推進超圖,進行不斷壓縮。

    (2)其次是初始劃分階段,在二次劃分超圖的基礎上,利用二次方法,來不斷強化超圖質量,使得工作效率有效提升。

    (3)最后遷移優化階段,分解超圖之后,在投影基礎上,使得分解質量不斷提升。

    3.4  高維數據挖掘的工具

    現階段,存在三種使用廣泛的高維數據挖掘工具:第一,SPSS;第二,Exterprise Miner;第三,SAS。存在如下特征:

    (1)SAS:是建立在統計理論之上的,存在諸多功能,高維數據挖掘功能相對齊全,但是需要專業人士進行操作,并且存在極高的運用成本。

    (2)Exterprise Miner:具有操作簡便的優勢,高維數據的處理能力相對適中,但是不能進行數據搜索。

    (3)SPSS:和SAS具有類似功能,但是相對而言具有較高性價比,高維數據挖掘功能較為出眾,除此之外,立足于集成以及發布功能,工作人員能夠較好的掌握挖掘結果,并且理解挖掘結果。


    本文來源:《企業科技與發展》:http://www.007hgw.com/w/kj/21223.html

    網絡客服QQ: 沈編輯

    投訴建議:0373-5939925????投訴建議QQ:

    招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

    地址:河南省新鄉市金穗大道東段266號中州期刊聯盟 ICP備案號:豫ICP備2020036848

    【免責聲明】:中州期刊聯盟所提供的信息資源如有侵權、違規,請及時告知。

    版權所有:中州期刊聯盟(新鄉市博翰文化傳媒有限公司)

    關注”中州期刊聯盟”公眾號
    了解論文寫作全系列課程

    核心期刊為何難發?

    論文發表總嫌貴?

    職院單位發核心?

    掃描關注公眾號

    論文發表不再有疑惑

    論文寫作全系列課程

    掃碼了解更多

    輕松寫核心期刊論文

    在線留言
    主站蜘蛛池模板: 依依成人精品无v国产| 亚洲欧洲日产国码久在线| 久久久久亚洲AV成人网人人软件| 日韩成人一区二区二十六区| 黄色国产视频| 亚洲精品二区在线播放| 日韩亚洲欧美在线com| 亚洲欧洲日产国码AV天堂偷窥| 性色av一区二区三区夜夜嗨| 精品嫩模福利一区二区蜜臀| 国产精品内射视频免费| 亚洲国产日韩一区三区| 亚洲精品动漫在线观看| 小12箩利洗澡无码视频网站| 风流老熟女一区二区三区| 亚洲欧美日韩在线码| 欧洲熟妇熟女久久精品综合| 中文字幕日韩精品有码视频| 人人妻人人澡人人爽曰本| 精品午夜福利无人区乱码| 午夜福利看片在线观看| 亚洲成aⅴ人在线观看| 婷婷六月综合| 国产精品青草视频免费播放| 日韩成人午夜| 18禁无遮挡啪啪无码网站破解版| 欧美激情视频一区| 白丝尤物jk自慰制服喷水| 国产av一区二区久久蜜臀| 不卡免费一区二区日韩av| 国产乱子伦视频一区二区三区 | 国产精品中文第一字幕| 99ri国产在线| 国产一级在线观看www色| 虎白女粉嫩尤物福利视频| 精品无码国产一区二区三区av| 美女国产毛片a区内射| 亚洲精品一区二区三区综合 | 国产乱码日韩精品一区二区| 最新日韩精品中文字幕| 国产成人无码A区在线观|