隨著云時代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關(guān)注。大數(shù)據(jù)(Big data)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。不是隨機樣本,而是全體數(shù)據(jù):在大數(shù)據(jù)時代,我們可以分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機采樣。不是精確性,而是混雜性:研究數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度;之前需要分析的數(shù)據(jù)很少,所以我們必須盡可能精確地量化我們的記錄,隨著規(guī)模的擴大,對精確度的癡迷將減弱;擁有了大數(shù)據(jù),我們不再需要對一個現(xiàn)象刨根問底,只要掌握了大體的發(fā)展方向即可,適當忽略微觀層面上的精確度,會讓我們在宏觀層面擁有更好的洞察力;不是因果關(guān)系,而是相關(guān)關(guān)系:我們不再熱衷于找因果關(guān)系,尋找因果關(guān)系是人類長久以來的習慣,在大數(shù)據(jù)時代,我們無須再緊盯事物之間的因果關(guān)系,而應該尋找事物之間的相關(guān)關(guān)系;相關(guān)關(guān)系也許不能準確地告訴我們某件事情為何會發(fā)生,但是它會提醒我們這件事情正在發(fā)生。
如因作品內(nèi)容,版權(quán)和其它問題請與本播主聯(lián)系的,請在30日內(nèi)進行。
免責聲明:本書院為非營利性機構(gòu)。以方便網(wǎng)友為主,僅供學習研究。
內(nèi)容由熱心網(wǎng)友提供和網(wǎng)上收集,不保留版權(quán)。若侵犯了您的權(quán)益,來信即刪。srn2188@sina.com
尬小子The_Joker
很多時候,我們的感覺并不真是我們自己的,而是外界加于我們的。有個詞叫“信息繭房”,當你以為你可以看得到全世界的消息時,殊不知那些信息都是經(jīng)過大數(shù)據(jù)篩選后推給你的,所以,別活在小圈子里,時常跳出去看看。