自從幾年前大數據成為公司董事會的流行詞以來(得益於 麥肯錫的報告《大數據:創新、競爭和生產力的下一個前沿》),許多組織已經啟動了 大數據計劃,希望能夠實現其目標。隨著時間的推移,許多公司已經啟動了試點計畫來解決一些最重要的業務問題。
通常由於多種原因
這些最初的步驟並沒有立即顯示出結果,這些原因已在 網路上大量發布。根據我的經驗,大數據專案 失敗的主要原因之一 是資料存取和 資料品質。
數據驅動 圖 1:從數據消耗到數據驅動
對於「非數位原生」公司來說尤其如此,並且源於這樣一個事實:此類組織從未考慮過其係統 印度電子郵件地址 產生的數據可能具有戰略價值。
換句話說
數據被認為是「廢氣」:業務運營的副作用或副產品。雖然有些事情是利用其中一些數據完成的,例如描述性商業智慧(即發生了什麼),但數據從未被視為策略資產。通常,組織會精心照顧其策略資產,並明確管理它們,並始終密切注意它們。
加特納資訊圖 圖 2:關於執行長將數據作
為資產的 Gartner 資訊圖
當公司開始數據之 旅時
他們通常不會意識到他們的數據沒有得到仔細的處理或收集。它可能 回波數據 不完整、重複、隱藏、
不正確甚至遺失
當資料科學家第一次接觸到資料時,他們會有很多疑問,並且會發現從商業角度來看沒有意義的見解,甚至可能導致錯誤的結論。 大數據分析和 機器學習也不例外:「垃圾輸入,垃圾輸出」。
基於所有這些原因
組織在開始資料之旅時擁有正確的期 芬蘭 電話庫列表 望非常重要。我們並不是說資料資產管理需要大量的前期投資,
而是組織必須意識到其 大數據試
點中的潛在陷阱。理想情況下,企業領導者需要並行推進:開始透過試點創造價值,同時也從資料管理開始,以便當您準備好擴展 資料科學專案時,您的資料處於良好狀態並且是一流的資產。