IDC預測,到2020年大數(shù)據(jù)和分析技術市場,將從2015年的1301億美元增加至2030億美元。而縱觀國內外,大數(shù)據(jù)已經形成產業(yè)規(guī)模,并上升到國家戰(zhàn)略層面,大數(shù)據(jù)技術和應用呈現(xiàn)縱深發(fā)展趨勢。
小編整理了大數(shù)據(jù)行業(yè)常見的9個關鍵詞,可以管窺這個行業(yè)的特點和發(fā)展趨勢。
1、物聯(lián)網(IoT)
物聯(lián)網和大數(shù)據(jù)是同一枚硬幣的兩面;數(shù)十億與互聯(lián)網連接的“物件”將生產大量數(shù)據(jù)。然而,這本身不會引發(fā)另一場工業(yè)革命,不會改變日常的數(shù)字化生活,也不會提供拯救地球的預警系統(tǒng)。來自設備外部的數(shù)據(jù)才是企業(yè)讓自己與眾不同的方面。結合上下文來捕獲和分析這種類型的數(shù)據(jù)為公司帶來了新的發(fā)展前途。
2、數(shù)據(jù)庫(Database):一個以某種特定的技術來存儲數(shù)據(jù)集合的倉庫,它包含了表格,圖等。數(shù)據(jù)庫也可被并入數(shù)據(jù)庫管理系統(tǒng)[Database Management System],軟件用于數(shù)據(jù)分析。
3、數(shù)據(jù)挖掘(Data mining):從數(shù)據(jù)集中發(fā)掘特定模式或信息的過程。數(shù)據(jù)挖掘著重利用大數(shù)據(jù)作分析,過程也利用了人工智能,機器學習或統(tǒng)計學等知識。
4、算法與分析法
算法(Algorithms) -可以完成某種數(shù)據(jù)分析的數(shù)學公式。算法被用于軟件處理與分析輸入的數(shù)據(jù)。
分析法(Analytics) –用于發(fā)現(xiàn)數(shù)據(jù)的內在涵義。通過分析,無用雜亂的數(shù)據(jù)可以轉化成有益的結論。這里的重點是數(shù)據(jù)的影響力,而不是復雜的軟件系統(tǒng)。這可能就是為何大家使用數(shù)據(jù)來完成自己的論述。
5、云計算與數(shù)據(jù)云計算(Cloud computing)云計算可用于任何時間與地點。它是構建在網絡上的分布式計算系統(tǒng),數(shù)據(jù)文件是存儲于網絡(即云端)而非硬盤。
6、黑暗數(shù)據(jù)(Dark Data):黑暗數(shù)據(jù)是被收集以及處理的商業(yè)信息,但從未被投入真正的用處。黑暗數(shù)據(jù)可以被理解為在黑暗中等待被分析的信息。很多公司甚至沒有意識到他們所有的潛在數(shù)據(jù)。
數(shù)據(jù)庫即服務(Database-as-a-Service) –部署在云端的數(shù)據(jù)庫,即用即付,例如亞馬遜云服務(AWS: Amazon Web Services)。DaaS為公司們提供了高效快捷的獲取數(shù)據(jù)的方法,也自2015年來在市場中占有著舉足輕重的作用。
7、數(shù)據(jù)科學家(Data scientist)數(shù)據(jù)科學家能夠通過統(tǒng)計變成涉及、開發(fā)和調用算法而支持業(yè)務決策;管理海量數(shù)據(jù);可視化數(shù)據(jù)以輔助理解。其需要具備三項基本技能:數(shù)學/統(tǒng)計、計算機能力、在特定業(yè)務領域的知識,被《哈佛商業(yè)評論》評委二十一世紀最性感的職業(yè)。
8、可信ID:一般指由第三方提供的,開源或商用的ID服務,其中商用ID服務由于能夠提供穩(wěn)定的,大承載量的系統(tǒng)支持,被比較多的采用。移動互聯(lián)網時代,設備成為標配,當APP被激活的前提條件為真實設備第一次打開的時候,才判斷為該設備是有效的。
9、深度學習
深度學習是一套基于神經網絡的機器學習技術,在解決業(yè)務問題方面顯示出極大潛力。它讓計算機能夠從大量非結構化數(shù)據(jù)和二進制數(shù)據(jù)中找出感興趣的內容,并且推導出關系,而不需要特定的模型或編程指令。
總的來說,大數(shù)據(jù)是對大量、動態(tài)、能持續(xù)的數(shù)據(jù),通過運用新系統(tǒng)、新工具、新模型進行挖掘,從而獲得具有洞察力和新價值的東西。以前,面對龐大的數(shù)據(jù),我們可能會一葉障目,因此不能了解到事物的真正本質,但隨著大數(shù)據(jù)時代的來臨,一切真相將會展現(xiàn)在人們面前。
