NEWS

新聞資訊

移動端采用H5等主流語言...

2019年(nián)07月(yuè)17日 14:43:51
導讀(dú)

在數字經濟時代,互聯網、智能(néng)設備和其他形式的信息技(jì)術(shù)的爆炸性增長(cháng)使得數據以同樣令人印象深刻的速度增長(cháng),企業(yè)經營的各個(gè)階段都可以被記錄下(xià)來,産品銷售的各個(gè)環節也被記錄下(xià)來,客戶的消費(fèi)行為(wèi)網上(shàng)行為(wèi)都被采集下(xià)來。數據已成為(wèi)一(yī)種重要的生(shēng)産要素,通(tōng)過對數據的收集、存儲、再組織和分析建模,隐藏在數據中的重要價值及規律逐漸展現出來,正成為(wèi)企業(yè)轉型升級及可持續發展的重要推動力量。大數據分析建模是大數據應用的核心和重要基礎,已成為(wèi)科技(jì)界和企業(yè)界關注的熱點話題。

 随著(zhe)企業(yè)信息化的逐步深入,大量信息系統在企業(yè)中廣泛應用,物(wù)聯網、雲計算(suàn)、工(gōng)業(yè)互聯網等技(jì)術(shù)與企業(yè)經營生(shēng)産緊密結合,設備運行、生(shēng)産加工(gōng)、測試試驗等數據采集過程更加自(zì)動化,企業(yè)積累了大量的數據,包括産品銷售數據、客戶消費(fèi)數據、客戶行為(wèi)數據、企業(yè)運營數據等,企業(yè)經營生(shēng)産的各個(gè)階段都可以被記錄下(xià)來,産品銷售的各個(gè)環節也被記錄下(xià)來,客戶的消費(fèi)行為(wèi)和網上(shàng)行為(wèi)都被采集下(xià)來,這些數據隐藏著(zhe)大量的有價值的規律和信息,是企業(yè)的重要資産。
                               
另一(yī)方面,傳統的數據報(bào)表、即席查詢等簡單分析手段已無法滿足企業(yè)對于深層次信息的挖掘需求,大數據融合、大數據分析、大數據挖掘等技(jì)術(shù)不斷發展,漏鬥分析、事(shì)件(jiàn)分析、行為(wèi)分析、留存分析、屬性分析等模型不斷完善,神經網絡、決策樹、關聯規則等挖掘算(suàn)法不斷成熟,基于Hadoop、HDFS的分布式存儲技(jì)術(shù)以及基于Storm、Spark、MapReduce等分布式計算(suàn)技(jì)術(shù)迅猛發展,為(wèi)大數據分析處理及分析建模提供了堅實的技(jì)術(shù)支撐。

                               


1 選擇分析模型 基于收集到(dào)的業(yè)務需求、數據需求等信息,研究決定選擇具體的模型,如行為(wèi)事(shì)件(jiàn)分析、漏鬥分析、留存分析、分布分析、點擊分析、用戶行為(wèi)分析、分群分析、屬性分析等模型,以便更好地切合具體的應用場景和分析需求。
                               
2 訓練分析模型 每個(gè)數據分析模型模式基本是固定的,但其中存在一(yī)些不确定的參數變量或要素在裡(lǐ)面,通(tōng)過其中的變量或要素适應變化多(duō)端的應用需求,這樣模型才會(huì)有通(tōng)用性。企業(yè)需要通(tōng)過訓練模型找到(dào)最合适的參數或變量要素,并基于真實的業(yè)務數據來确定最合适的模型參數。
                               
3 評估分析模型 需要将具體的數據分析模型放(fàng)在其特定的業(yè)務應用場景下(xià)(如物(wù)資采購、産品銷售、生(shēng)産制造等)對數據分析模型進行評估,評價模型質量的常用指标包括平均誤差率、判定系數,評估分類預測模型質量的常用指标包括正确率、查全率、查準率、ROC曲線和AUC值等。