關於本站

網路科技的發達,加上熱血前輩們的教學貢獻,讓筆者終於有機會將自己過去講過的話、做過的事以及生活體驗訴諸於文字、影音呈現。

學習沒有捷徑,每一天都能吸取新知」。

2015年5月27日 星期三

產品經理如何搞懂Big Data?


根據維基百科(Wiki)的解釋,所謂的Big Data,或稱巨量資料、海量資料、大數據,指的是所涉及的資料量規模巨大到無法透過人工,在合理時間內達到擷取、管理、處理、並整理成為人類所能解讀的資訊。Gartner的說法則是,Big Data是高容量(Volume)、高成長量(Velocity)、高變化性(Variety)的資訊資產,能提高資訊用途,以協助我們進行決策(Big data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making.),現今多數的文章大多採用Gartner定義。

Big Data之所以盛行是因為:在總資料量相同的情況下,與個別分析獨立的小型資料集(data set)相比,將各個小型資料集合併後進行分析可得出許多額外的資訊和資料關聯性,這些數據可用來察覺商業趨勢、判定研究品質、避免疾病擴散、打擊犯罪或測定即時交通路況…等。

如前所述,Big Data的意涵,其實不算是嶄新的技術發展,就如同大家談「雲端」一樣,其實不論是企業或個人早已經在使用(如:Gmail),宏碁在十年前面臨後PC時代,就提出了「巨架構、微服務」的雲端服務機制,只是當時並未冠上「雲端」兩字。回到Big Data,其實過去在企業上就有類似商業智慧(Business Intelligence)的商用軟體(如:IBM Cognos)來協助高層主管進行決策輔助(Decision Support System)使用,集團跨國企業也都會設立「戰情室」(如:鴻海、宏碁)作為資料分析判讀之用。


筆者以為,兩者不同之處在於:近十年來網路發展快速,社群媒體發展迅速,數位影音拜寬頻速度提升已大量取代傳統文字訊息,截至2012年,單一資料集的大小從數兆位元組(TB)至數十兆億位元組(PB)不等,因此過去純文字搜尋分析已經不敷使用,必須再加上圖片、影音等更細微的運算分析機制。

分析是Big Data處理的重要關鍵。簡易的分析是包括找出所定義範疇不同物件的關係,例如一個著名的範例是Wal-Mart透過帳單分析,找出啤酒、紙尿布與星期五銷售之關連性,透過將啤酒與紙尿布放在一起販賣,提升了啤酒的銷售量。在此案例中,範疇是清楚的(啤酒、紙尿布、星期五與帳單金額)。另一個較為複雜的則是不易定義範疇的分析,其分析模式與工具也尚在開發中。畢竟,要”知道”哪些”自己不知道”的,原本就是非常困難。

對於產品經理來說,要從網路上或是企業內部獲取資料,相信不會是大問題,真正的關鍵是在於:如何正確擷取分析所需要的資料並能夠真正解讀背後所代表的情報與暗示才是重點。當然,擁有一套能夠分析解讀Big Data的資訊化系統,更是企業及公司高層不可或缺的致勝武器。

沒有留言:

張貼留言