大數(shù)據(jù)時(shí)代的心得體會(huì)(實(shí)用17篇)

字號(hào):

    通過總結(jié)心得體會(huì),在日后面對(duì)相似的情況時(shí),我們可以更加從容和自信地應(yīng)對(duì)挑戰(zhàn)。寫心得體會(huì)時(shí),我們可以適當(dāng)運(yùn)用一些修辭手法,如比喻、排比、對(duì)偶等,以增加文章的表現(xiàn)力。以下是一些獲獎(jiǎng)的心得體會(huì)范文,希望能給大家提供一些寫作參考。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇一
    隨著信息化技術(shù)的發(fā)展,我們進(jìn)入了一個(gè)大數(shù)據(jù)信息化時(shí)代,而這個(gè)時(shí)代帶給我們的是前所未有的變化:賦能人們更為廣泛的渠道與更全面的數(shù)據(jù)來實(shí)現(xiàn)商業(yè)領(lǐng)域的化整為零——從延長用戶生命周期到制定個(gè)人定制服務(wù),或通過分析個(gè)人行為來推動(dòng)業(yè)務(wù)增長。對(duì)于企業(yè)來說,大數(shù)據(jù)分析的普及已經(jīng)成為一個(gè)必要的戰(zhàn)略選項(xiàng),這讓大數(shù)據(jù)技術(shù)也成為企業(yè)信息管理的核心。
    大數(shù)據(jù)信息化時(shí)代的到來意味著我們更能夠清晰地觀察到客戶行為、需求和心理,并制定基于數(shù)據(jù)的執(zhí)行策略。企業(yè)利用大數(shù)據(jù)技術(shù)能夠更加了解市場(chǎng)需求,更好地掌握市場(chǎng)動(dòng)態(tài),及時(shí)并靈活地調(diào)整戰(zhàn)略??梢姡髷?shù)據(jù)信息化時(shí)代的橫空出世,對(duì)于企業(yè)發(fā)展而言是一種難得的機(jī)遇,它為企業(yè)帶來了新的發(fā)展前景。
    第三段:大數(shù)據(jù)分析的特點(diǎn)。
    大數(shù)據(jù)分析是通過技術(shù)與應(yīng)用的結(jié)合,對(duì)海量的、異構(gòu)的以及快速變化的數(shù)據(jù)進(jìn)行分析,解決現(xiàn)實(shí)問題的一種方法和工具。與傳統(tǒng)的數(shù)據(jù)分析相比,大數(shù)據(jù)分析具有以下特點(diǎn):
    1.數(shù)據(jù)量更大:從數(shù)十億到數(shù)萬億。
    2.數(shù)據(jù)來源更廣:包含多種數(shù)據(jù)集,它們通常被分布在不同的數(shù)據(jù)倉庫中。
    3.數(shù)據(jù)類型更多樣化:包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。
    4.處理方式更靈活:通過分發(fā)、并行和共享的技術(shù)來完成任務(wù)。
    第四段:分析大數(shù)據(jù)的方法。
    大數(shù)據(jù)分析是通過各種方法和技術(shù),從海量的數(shù)據(jù)中獲取有關(guān)事物的知識(shí),效果好與受過控制的經(jīng)驗(yàn)分析不太相同。對(duì)于而言,對(duì)于成功地分析大數(shù)據(jù):合理的數(shù)據(jù)收集是絕對(duì)必要的。而且,大規(guī)模數(shù)據(jù)分析需要采用預(yù)處理、清洗和建模等多種算法,才能從海量的數(shù)據(jù)中提取出有用的信息。深入了解每個(gè)算法的優(yōu)缺點(diǎn),是成功分析大數(shù)據(jù)的關(guān)鍵。
    第五段:總結(jié)。
    在大數(shù)據(jù)信息化時(shí)代,我們必須提高對(duì)數(shù)據(jù)的重視和處理能力。企業(yè)要在數(shù)據(jù)的基礎(chǔ)上開發(fā)創(chuàng)新業(yè)務(wù)模式,以更好地滿足客戶的需求,取得商業(yè)優(yōu)勢(shì)。隨著時(shí)間的推移,更多的數(shù)據(jù)將生成,并且更多的方法將被開發(fā),以處理數(shù)據(jù)并從數(shù)據(jù)中提取有價(jià)值的信息。對(duì)于企業(yè)而言,大數(shù)據(jù)分析將會(huì)繼續(xù)發(fā)揮重要的作用,將在未來成為企業(yè)信息化轉(zhuǎn)型和管理策略中的核心,從而幫助企業(yè)實(shí)現(xiàn)長期成功。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇二
    作為一名中學(xué)物理教師,在新課改的形勢(shì)下,教師如何做才能打造高效課堂,進(jìn)行有效教學(xué),本人有以下幾點(diǎn)心得:
    興趣是學(xué)生積極探索知識(shí),獲取能力的一種傾向,是學(xué)習(xí)的原動(dòng)力,是認(rèn)識(shí)過程中最活躍的因素,是發(fā)明創(chuàng)造的精神源泉。心理研究表明,當(dāng)學(xué)生對(duì)學(xué)習(xí)對(duì)象有興趣時(shí),大腦中有關(guān)學(xué)習(xí)神經(jīng)的細(xì)胞就處于高度興奮狀態(tài),而無關(guān)的則處于抑制狀態(tài)。思維能力的.獲得和提高,必須通過自己的思維活動(dòng),這是不能代替的。因此在教學(xué)中,首先要調(diào)動(dòng)學(xué)生的興趣和求知欲??鬃诱f:“知之者不如好知者,好知者不如樂知者?!笨梢妼W(xué)習(xí)興趣的重要性。在化學(xué)課堂教學(xué)中,如果能創(chuàng)造一個(gè)使學(xué)生產(chǎn)生濃厚興趣和愛好的情景,才能調(diào)動(dòng)起學(xué)生的參與意識(shí)和學(xué)習(xí)積極性,教學(xué)內(nèi)容就能有效貫徹,也能幫助學(xué)生以科學(xué)的態(tài)度,堅(jiān)強(qiáng)的毅力克服學(xué)習(xí)中的重重困難,使學(xué)生在獲得知識(shí)的同時(shí),能力、智力均得到培養(yǎng)和發(fā)展。
    教學(xué)情境的特點(diǎn)和功能不僅在于可以激發(fā)和促進(jìn)學(xué)生的情感活動(dòng),還在于可以激發(fā)和促進(jìn)學(xué)生的認(rèn)知活動(dòng)和實(shí)踐活動(dòng),能夠提供豐富的學(xué)習(xí)素材,有效地改善教與學(xué)。為明確認(rèn)識(shí)、防止誤解,可以考慮把教學(xué)情境改稱為“教學(xué)場(chǎng)境”。
    教學(xué)情境的設(shè)計(jì)方法:
    (一)從學(xué)科與生活的結(jié)合點(diǎn)入手,創(chuàng)設(shè)情境。
    (二)從學(xué)科與社會(huì)的結(jié)合點(diǎn)入手,創(chuàng)設(shè)情境。
    (三)利用問題探究創(chuàng)設(shè)情境。
    作為解決科學(xué)問題的重要手段,實(shí)驗(yàn)是一種特殊的人工真實(shí),它能在實(shí)驗(yàn)室中再現(xiàn)、強(qiáng)化、突出物質(zhì)的各種變化,富有真實(shí)性、認(rèn)知性、應(yīng)用性,便于人們觀察、學(xué)習(xí)和研究。
    (四)利用認(rèn)知矛盾創(chuàng)設(shè)情境。
    新、舊知識(shí)的矛盾,日常概念與科學(xué)概念的矛盾,直覺、常識(shí)與客觀事實(shí)的矛盾等,都可以引起學(xué)生的探究興趣和學(xué)習(xí)愿望,形成積極的認(rèn)知氛圍和情感氛圍,因而都是用于設(shè)置教學(xué)情境的好素材。
    我們可以通過引導(dǎo)學(xué)生分析錯(cuò)誤原因,積極地進(jìn)行思維、探究、討論,不但可以使他們達(dá)到新的認(rèn)知水平,而且可以促進(jìn)他們?cè)谇楦小⑿袨榈确矫娴陌l(fā)展。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇三
    4月13日下午,在湖南大學(xué)東樓205參加了關(guān)于《大數(shù)據(jù)時(shí)代》的讀書交流活動(dòng)。通過相互交流學(xué)習(xí),使我更深層次的理解了大數(shù)據(jù)時(shí)代的利與弊,機(jī)遇和挑戰(zhàn)。在寫心得體會(huì)前,我想再重新審視一下關(guān)于大數(shù)據(jù)的歷史沿革和現(xiàn)實(shí)意義。
    首先,最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來。”“大數(shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時(shí)日,卻因?yàn)榻陙砘ヂ?lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計(jì)算、物聯(lián)網(wǎng)之后又it行業(yè)又一大顛覆性的技術(shù)革命。云計(jì)算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場(chǎng)所和渠道,而數(shù)據(jù)才是真正有價(jià)值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)it架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實(shí)時(shí)性要求也將大大超越現(xiàn)有的計(jì)算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國家治理、企業(yè)決策乃至個(gè)人生活服務(wù),是大數(shù)據(jù)的核心議題,也是云計(jì)算內(nèi)在的靈魂和必然的升級(jí)方向。
    其次,進(jìn)入20xx年,大數(shù)據(jù)(bigdata)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時(shí)報(bào)》《華爾街日?qǐng)?bào)》的專欄封面,進(jìn)入美國白宮官網(wǎng)的新聞,現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進(jìn)了投資推薦報(bào)告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識(shí)到數(shù)據(jù)爆炸性增長帶來問題的隱患,但是隨著時(shí)間的推移,人們將越來越多的意識(shí)到數(shù)據(jù)對(duì)企業(yè)的重要性。正如《紐約時(shí)報(bào)》20xx年2月的一篇專欄中所稱,“大數(shù)據(jù)”時(shí)代已經(jīng)降臨,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺。哈佛大學(xué)社會(huì)學(xué)教授加里·金說:“這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程?!?BR>    最后,隨著云時(shí)代的來臨,大數(shù)據(jù)(bigdata)也吸引了越來越多的關(guān)注。著云臺(tái)的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(bigdata)通常用來形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時(shí)會(huì)花費(fèi)過多時(shí)間和金錢。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像mapreduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作?!按髷?shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運(yùn)營中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用g或t來衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張dvd;發(fā)出的郵件有2940億封之多(相當(dāng)于美國兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量);賣出的手機(jī)為37.8萬臺(tái),高于全球每天出生的嬰兒數(shù)量37.1萬……,截止到20xx年,數(shù)據(jù)量已經(jīng)從tb(1024gb=1tb)級(jí)別躍升到pb(1024tb=1pb)、eb(1024pb=1eb)乃至zb(1024eb=1zb)級(jí)別。國際數(shù)據(jù)公司(idc)的研究結(jié)果表明,20xx年全球產(chǎn)生的數(shù)據(jù)量為0.49zb,20xx年的數(shù)據(jù)量為0.8zb,20xx年增長為1.2zb,20xx年的數(shù)量更是高達(dá)1.82zb,相當(dāng)于全球每人產(chǎn)生200gb以上的數(shù)據(jù)。而到20xx年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200pb,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5eb。ibm的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了20xx年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
    首先,談?wù)劥髷?shù)據(jù)帶給生活的轉(zhuǎn)變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢(shì),可以說,大數(shù)據(jù)現(xiàn)在已經(jīng)開始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來優(yōu)化規(guī)模和實(shí)現(xiàn)利益最大化。而我們很多人對(duì)大數(shù)據(jù)還很陌生,只是被動(dòng)的適應(yīng)著大數(shù)據(jù)給生活帶來的改變。大數(shù)據(jù)時(shí)代是以云計(jì)算為基礎(chǔ)的,所以,要實(shí)現(xiàn)大數(shù)據(jù),相關(guān)的很多的硬件設(shè)備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關(guān)產(chǎn)業(yè)都要重新調(diào)整產(chǎn)業(yè)結(jié)構(gòu),在那時(shí),可以夸張的說,信息就是黃金,信息就是石油。大數(shù)據(jù)時(shí)代的到來會(huì)解放更多的勞動(dòng)生產(chǎn)力,勢(shì)必將會(huì)更加加劇生產(chǎn)力過剩的現(xiàn)狀,社會(huì)兩極分化現(xiàn)象會(huì)更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數(shù)據(jù)時(shí)代的到來會(huì)使人們的生活節(jié)奏急速加快,信息的時(shí)效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會(huì)越來越忙,到那時(shí),就像現(xiàn)在的日本,可能想找個(gè)人聽你說說話,真的是一件很難的事。
    第二,關(guān)于數(shù)據(jù)管理的看法。大數(shù)據(jù)時(shí)代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識(shí),不主動(dòng)泄露信息,要管理好自己身邊的信息設(shè)備;技防,就是要運(yùn)用軟件來管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫,定時(shí)查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應(yīng)當(dāng)做到備份與原始文件是物理隔離,無關(guān)的信息應(yīng)當(dāng)及時(shí)刪除,減輕硬盤的壓力。
    三、怎么保護(hù)自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時(shí)代,更要管理好自己的隱私,以免對(duì)自己和家人造成麻煩和損失。越是隱私的信息,越要遠(yuǎn)離網(wǎng)絡(luò),不要再公開的社交網(wǎng)絡(luò)儲(chǔ)存和展示個(gè)人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質(zhì)的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機(jī)碼來保護(hù)自己真實(shí)ip地址,提高網(wǎng)絡(luò)安全的可靠性,加強(qiáng)對(duì)聯(lián)網(wǎng)信息的管理和保護(hù)。
    不論我們情不情愿,大數(shù)據(jù)時(shí)代都會(huì)到來,現(xiàn)實(shí)社會(huì)是我們高喊著走向大數(shù)據(jù)時(shí)代,其實(shí)大數(shù)據(jù)時(shí)代已經(jīng)向我們走來,所以與其被動(dòng)接受,不如主動(dòng)學(xué)習(xí),從中找到自己的出路,成為大數(shù)據(jù)時(shí)代的建設(shè)者和受益者。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇四
    “大數(shù)據(jù)”概念早在1980年就有國外的學(xué)者提出,可是最近幾年才廣泛受到大家的關(guān)注。當(dāng)“大數(shù)據(jù)”這個(gè)概念傳到中國的時(shí)候,瞬間引起了轟動(dòng)。隨即,各種有關(guān)“大數(shù)據(jù)”的資料和書籍充斥的我們的視野。隨意打開某個(gè)電子商務(wù)平臺(tái)圖書類頁面,在搜索框中搜索“大數(shù)據(jù)”三個(gè)字,就會(huì)出現(xiàn)好多本有關(guān)“大數(shù)據(jù)”的書籍??墒?,有一個(gè)很有趣的現(xiàn)象就是:幾乎所有的平臺(tái)上,出現(xiàn)的第一本關(guān)于“大數(shù)據(jù)”的書籍一定是《大數(shù)據(jù)時(shí)代》。一點(diǎn)進(jìn)去,這本書推薦欄里的第一句話就是:迄今為止全世界最好的一本大數(shù)據(jù)專著。同時(shí),為這本書做推薦的都是各行業(yè)的精英領(lǐng)袖。所有“大數(shù)據(jù)”方面的書籍也是這本書銷量最高,評(píng)價(jià)最好。
    我從來不會(huì)因?yàn)槟谋緯鴷充N和很多人推薦就盲目跟風(fēng)的去看一本書。因?yàn)槲抑劳ǔT谶@種情況下選擇一本書,整個(gè)閱讀的體會(huì)和感受是無法遵從自己的內(nèi)心的,整個(gè)過程都很容易夾雜著別人對(duì)這本書的感受。所以通常我讀書的節(jié)奏大多都是跟不上“潮流”的,但往往經(jīng)過風(fēng)雨洗禮之后沉淀下來的都是精華。坦白講,閱讀這本書的初衷并不是因?yàn)槲蚁霃臅蝎@取到多少大數(shù)據(jù)方面的精華,只是很想知道對(duì)于這么一個(gè)很直白的名詞,作者是怎么寫出這么厚的一本書的。這種初衷或許很無知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書中的精華。
    在看《大數(shù)據(jù)時(shí)代》這本書之前,我的所有讀后感都是集中在書籍給了我什么思考。對(duì)于這本書的讀后感,除了觀點(diǎn)碰撞之外,我還會(huì)加上大部分個(gè)人看這本書的體會(huì)。因?yàn)檫@本書,已經(jīng)完全讓我模糊了大多數(shù)人口中的“全世界最好的書”是一種什么標(biāo)準(zhǔn)。也許《大數(shù)據(jù)時(shí)代》真的無法承載那么高的贊美!
    大數(shù)據(jù)時(shí)代的入門書。
    看完這本書,我隨意調(diào)查了一些閱讀過這本書并且給這本書絕對(duì)好評(píng)的朋友。詢問他們這本書好在哪里?大多數(shù)的回答是說《大數(shù)據(jù)時(shí)代》這本書讓對(duì)大數(shù)據(jù)一無所知的他們了解了大數(shù)據(jù)這個(gè)概念,同時(shí)通過很多案例說明原來大數(shù)據(jù)能有這么大的用處,影響會(huì)有這么大!僅此而已。我看完這本書最大的感受是這本書分為上、下兩部分。前120多頁為上部分,后120多頁為下部分。之所以說《大數(shù)據(jù)時(shí)代》是一本關(guān)于大數(shù)據(jù)的入門書,是因?yàn)檫@本書用了前面120多頁的篇幅反復(fù)的強(qiáng)調(diào)大數(shù)據(jù)的出現(xiàn)對(duì)社會(huì)發(fā)展影響很大,并且要人們轉(zhuǎn)變小數(shù)據(jù)時(shí)代慣有的思想。所以整本書的前半部分就強(qiáng)調(diào)大數(shù)據(jù)時(shí)代的三個(gè)轉(zhuǎn)變:1、大數(shù)據(jù)利用所有的數(shù)據(jù),而不再僅僅依靠一小部分?jǐn)?shù)據(jù),不再依賴于隨機(jī)采樣。2、大數(shù)據(jù)數(shù)據(jù)多,不再熱衷于追求精確性,也不再期待精確性。3、大數(shù)據(jù)時(shí)代不再熱衷于尋找因果關(guān)系,而是追求相關(guān)關(guān)系。所以整個(gè)上半部分沒什么可詳說的。我們重點(diǎn)聊聊本書的后半部分。
    既然一直都在強(qiáng)調(diào)大數(shù)據(jù)對(duì)我們的意義,總要有具體體現(xiàn)。整本書中,我感觸最大的一個(gè)案例就是某公司通過分析大數(shù)據(jù)發(fā)現(xiàn):新品發(fā)布的時(shí)候,舊一代的產(chǎn)品可能會(huì)出現(xiàn)短暫的價(jià)格上漲。因?yàn)槿藗冊(cè)谛睦砩暇驼J(rèn)為新產(chǎn)品的推出,舊產(chǎn)品就會(huì)便宜,從而就會(huì)提高購買量。這個(gè)發(fā)現(xiàn)和我們平常的心理是完全違背的,而且如果不用數(shù)據(jù)來證明,直接講道理給大家可能還是無法相信。這就是大數(shù)據(jù)對(duì)我們很多傳統(tǒng)思維的顛覆。一旦涉及到思維的改變,往往就會(huì)引起整個(gè)社會(huì)的大變動(dòng)。
    大數(shù)據(jù)這個(gè)概念的出現(xiàn),讓大數(shù)據(jù)逐漸發(fā)展形成一條價(jià)值鏈。在這條價(jià)值鏈上,數(shù)據(jù)本身、技能和思維是最重要的環(huán)節(jié)。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,越來越多的公司都能收集到大量的數(shù)據(jù),這些數(shù)據(jù)也會(huì)越來越公開??墒窃谶@些公司中,不是所有的公司都有從數(shù)據(jù)中提取價(jià)值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。于是就會(huì)出現(xiàn)以下兩種公司,一種是掌握了專業(yè)技能但不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數(shù)據(jù)的新價(jià)值的創(chuàng)新公司。短時(shí)間內(nèi),我們可能會(huì)感覺擁有創(chuàng)新思維,懂得挖掘出數(shù)據(jù)新價(jià)值的大數(shù)據(jù)思維是最重要的。可是等到產(chǎn)業(yè)成熟之后,所有人都知曉了大數(shù)據(jù)的意義,所有人便開始挖掘自己的大數(shù)據(jù)思維。同時(shí),隨著科技的進(jìn)步,掌握大數(shù)據(jù)技術(shù)的也將成為常態(tài)。所以到后來,整個(gè)價(jià)值鏈的核心環(huán)節(jié)還是回到了數(shù)據(jù)本身。而到那時(shí)候,大數(shù)據(jù)的公開性也就越來越小。
    在大談完大數(shù)據(jù)對(duì)人類發(fā)展的積極意義之后,作者也考慮到大數(shù)據(jù)時(shí)代的風(fēng)險(xiǎn)。這一部分是作者腦洞大開的精彩之處,同時(shí)也是最荒謬的一部分。書中說大數(shù)據(jù)時(shí)代將要懲罰未來犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行為給防止。這樣的社會(huì),大數(shù)據(jù)儼然已經(jīng)延伸到了我們每個(gè)人生活的點(diǎn)滴。幾乎我們?cè)谏钪兴龅囊磺卸荚诖髷?shù)據(jù)的“監(jiān)控”之下,我想到那時(shí)候,別說我們每個(gè)人的隱私已經(jīng)沒有的了,嚴(yán)重一點(diǎn)可以說是我們可能連人都不算了。在我們?nèi)说纳鐣?huì)屬性中,自由權(quán)利是一項(xiàng)很重要的指標(biāo)。通過大數(shù)據(jù)懲罰人的未來犯罪已經(jīng)否定了人的自由選擇能力和人的行為責(zé)任自負(fù)。同時(shí),由于數(shù)據(jù)是永久保存,大數(shù)據(jù)預(yù)測(cè)也是通過每個(gè)人之前的數(shù)據(jù)來判斷,所以大數(shù)據(jù)同樣也否定了人的求善心理。還有,從現(xiàn)在各種大數(shù)據(jù)預(yù)測(cè)的結(jié)果來看,很多發(fā)言人都說大數(shù)據(jù)不是百分百的準(zhǔn)確。所以利用大數(shù)據(jù)來判斷人的行為發(fā)展已經(jīng)違背了大數(shù)據(jù)不追求精確性的特征,這也是書中自相矛盾的地方。
    對(duì)于一個(gè)新事物,如果能讓大家了解這個(gè)事物并且對(duì)此產(chǎn)生興趣,這已經(jīng)算是一本不錯(cuò)的入門書了。
    從小到大,雞湯對(duì)于我們來說一直都挺珍貴的。身體虛弱了,喝點(diǎn)雞湯能夠補(bǔ)充營養(yǎng)。心靈受傷了,看點(diǎn)心靈雞湯可以鼓舞人心。可是近幾年,人們生活水平提高了,營養(yǎng)富余,雞湯已經(jīng)不是人們補(bǔ)營養(yǎng)的期待了。同樣,心靈雞湯也是如此。
    心靈雞湯其實(shí)是一個(gè)很虛偽的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來,心靈雞湯很大的一個(gè)特征就是:立人的志,但是就不告訴你實(shí)現(xiàn)志的方法。很多人每次在失意的時(shí)候就喜歡看心靈雞湯,希望能得到慰藉??赐旰笠灿X得醍醐灌頂,感覺整個(gè)世界都亮了。但又有幾個(gè)人想過喝完這些雞湯之后你除了看似重拾夢(mèng)想,你還獲得了什么?你知道怎么去做嗎?《大數(shù)據(jù)時(shí)代》就是這樣一本書。整本書從頭到尾都在向讀者講述大數(shù)據(jù)的意義,當(dāng)然期間也會(huì)用相應(yīng)的案例來證明大數(shù)據(jù)確實(shí)有這樣的能力。但是,整本書從沒有涉及到技術(shù)層面的問題?;蛟S對(duì)于大數(shù)據(jù)這種依靠互聯(lián)網(wǎng)技術(shù)的新事物,即使向讀者講技術(shù),也沒有幾個(gè)人看得懂,可是整本書沒有一點(diǎn)關(guān)于大數(shù)據(jù)思維的技能引導(dǎo)。給出的案例中只有少數(shù)案例向讀者講述了這個(gè)公司為什么要利用大數(shù)據(jù)來解決這種問題,大多數(shù)都只是告訴讀者國外某家公司運(yùn)用大數(shù)據(jù)得出了某種結(jié)論。同時(shí),在本書中文譯作者寫的序里,強(qiáng)調(diào)自己翻譯這本著作的一大優(yōu)點(diǎn)是可以結(jié)合國內(nèi)的案例來分析書中的理論,結(jié)果,看到最后一頁都沒有看到一個(gè)國內(nèi)企業(yè)關(guān)于大數(shù)據(jù)運(yùn)用的案例。
    之所以我稱之為“心靈雞湯”,還有一個(gè)原因就是作者在書中大講特講的大數(shù)據(jù)的作用,事實(shí)上按照現(xiàn)在的經(jīng)濟(jì)發(fā)展水平和社會(huì)文明發(fā)展程度是很難實(shí)現(xiàn)的。書中很多時(shí)候的理論都是要建立在社會(huì)各項(xiàng)文明都發(fā)展健全的基礎(chǔ)上才能實(shí)現(xiàn)。
    大數(shù)據(jù)的“傳銷手冊(cè)”
    看到這個(gè)標(biāo)題,大家可能會(huì)覺得我夸大其詞,受到如此多人好評(píng)的書怎么是“傳銷手冊(cè)”呢?對(duì)于這個(gè)表達(dá),我只想說兩點(diǎn):1、此說法僅代表我個(gè)人觀點(diǎn),是否認(rèn)同是個(gè)人問題。2、此說法主要針對(duì)本書的上部分。
    我們都知道傳銷組織在發(fā)展下線的前期是要花大力氣去培訓(xùn)的,也就是洗腦。而對(duì)于一個(gè)陌生又很難以理解的事物,最好的“洗腦”方式就是重復(fù)?!洞髷?shù)據(jù)時(shí)代》這本書就是運(yùn)用這種方式,前半部分為了讓讀者能夠接受“大數(shù)據(jù)”這個(gè)概念,作者反反復(fù)復(fù)提醒讀者大數(shù)據(jù)不是隨機(jī)采樣、不追求精確和不尋找因果關(guān)系。同時(shí)用很多看似很通俗易懂其實(shí)看完后還是不知道說了什么的案例來讓人信服大數(shù)據(jù)的作用。書中的后半部分雖然也是用這種方式來感染讀者,可后半部分中作者的暢想和對(duì)大數(shù)據(jù)的威脅分析還是對(duì)讀者有一些實(shí)質(zhì)意義的,所以后半部分的“傳銷”影響就不是很重要。
    大數(shù)據(jù)時(shí)代是未來的趨勢(shì),這誰都不會(huì)否認(rèn)。大數(shù)據(jù)改造了我們的生活,改變著我們的世界。不管它是以一種什么樣的姿態(tài)面向世界,它都沒有錯(cuò),因?yàn)榇髷?shù)據(jù)只是一種工具。但當(dāng)人類開始質(zhì)疑甚至恐懼大數(shù)據(jù)的時(shí)候,人類就該思考自己是否利用好這個(gè)好工具了。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇五
    如今,大數(shù)據(jù)時(shí)代成為炙手可熱的話題。你知道讀大數(shù)據(jù)時(shí)代。
    在《大數(shù)據(jù)時(shí)代》一書中,大數(shù)據(jù)時(shí)代與小數(shù)據(jù)時(shí)代的區(qū)別:1、思維慣例。大數(shù)據(jù)時(shí)代區(qū)別與轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對(duì),卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動(dòng)過去來預(yù)測(cè)未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測(cè)未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗(yàn)證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時(shí)代也即是信息時(shí)代,是大數(shù)據(jù)時(shí)代的前提,大數(shù)據(jù)時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
    數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機(jī)遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時(shí)代,從數(shù)據(jù)中攫取價(jià)值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
    這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對(duì)現(xiàn)代商業(yè)運(yùn)作的影響。
    《大數(shù)據(jù)時(shí)代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對(duì)現(xiàn)象的解剖提出對(duì)這一現(xiàn)象的解釋。然后在通過解釋在對(duì)未來進(jìn)行預(yù)測(cè),并對(duì)未來可能出現(xiàn)的問題提出自己看法與對(duì)策。
    下面來重點(diǎn)介紹《大數(shù)據(jù)時(shí)代》這本書的主要內(nèi)容。
    《大數(shù)據(jù)時(shí)代》開篇就講了google通過人們?cè)谒阉饕嫔纤阉麝P(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測(cè)了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預(yù)測(cè)比政府提前將近一個(gè)月,相比之下政府只能夠在流感爆發(fā)一兩個(gè)周之后才可以弄到相關(guān)的數(shù)據(jù)。同時(shí)google的預(yù)測(cè)與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著google預(yù)測(cè)數(shù)據(jù)的置信區(qū)間為3%,這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計(jì)學(xué)上的常規(guī)置信區(qū)間5%!而這個(gè)數(shù)字就是大數(shù)據(jù)時(shí)代預(yù)測(cè)結(jié)果的相對(duì)準(zhǔn)確性與事件的可預(yù)測(cè)性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時(shí)代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時(shí)候,通過計(jì)算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r(shí)代數(shù)據(jù)的獲取與存儲(chǔ)處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測(cè)量事物。而互聯(lián)網(wǎng)終端與計(jì)算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲(chǔ)與處理難度大大降低,因而相對(duì)準(zhǔn)確性更高的“樣本=總體”的測(cè)算方式將成為大數(shù)據(jù)時(shí)代的主流,同時(shí)大數(shù)據(jù)時(shí)代本身也是建立在大批量數(shù)據(jù)的存儲(chǔ)與處理的基礎(chǔ)之上的。
    接下來,維克多又通過了ibm追求高精確性的電腦翻譯計(jì)劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲(chǔ)存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會(huì)出現(xiàn)翻譯,雖然有的時(shí)候的翻譯很無厘頭,但是大多數(shù)時(shí)候還是正確的,所以google的電腦翻譯的計(jì)劃的成功,表明大數(shù)據(jù)時(shí)代對(duì)準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時(shí)代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時(shí)代追求的是全方位覆蓋的數(shù)字測(cè)度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會(huì)湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時(shí)大量的數(shù)據(jù)也會(huì)無限的逼近事物的原貌。
    之后,維克托又預(yù)測(cè)了一個(gè)在大數(shù)據(jù)時(shí)代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計(jì)學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會(huì)在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個(gè)人隱私在大數(shù)據(jù)時(shí)代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個(gè)人隱私。
    無論如何,大數(shù)據(jù)時(shí)代將會(huì)到來,不管我們接受還是不接受!
    我覺得《大數(shù)據(jù)時(shí)代》這本書寫的很好,很值得一讀。因?yàn)闀?huì)給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實(shí)就是我們將會(huì)成為被預(yù)測(cè)被引誘的對(duì)象。所以說,小心你在網(wǎng)上留下的痕跡。
    我喜歡這本書是因?yàn)樗o我展現(xiàn)了一個(gè)新的世界。
    讀了《大數(shù)據(jù)時(shí)代》后,感覺到一個(gè)大變革的時(shí)代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
    “在小數(shù)據(jù)時(shí)代,我們會(huì)假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想。”“隨著由假想時(shí)代到數(shù)據(jù)時(shí)代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對(duì)此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
    近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì)被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會(huì)它們。
    當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
    《大數(shù)據(jù)時(shí)代》第16頁“大數(shù)據(jù)的核心就是預(yù)測(cè)”。邏輯是——描述時(shí)空信息“類”與“類”之間長時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對(duì)立的。在同一件事上兩種方法對(duì)立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
    可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲?。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個(gè)更可怕的事情。
    其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對(duì)論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职郑瑑鹤泳褪莾鹤?。那么大?shù)據(jù)會(huì)不會(huì)通過正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有?!洞髷?shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
    還好我知道自己對(duì)什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。
    所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書繼續(xù)寫下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇六
    文中清晰的闡述了大數(shù)據(jù)的基本概念和特點(diǎn),并列出明確的觀點(diǎn)。不管對(duì)于產(chǎn)業(yè)實(shí)踐者,還是對(duì)于政府和公眾機(jī)構(gòu),都非常具有價(jià)值。作者將本書分為3個(gè)部分。第一部分提出了大數(shù)據(jù)時(shí)代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:抽樣等于全體;要效率不要絕對(duì)精確;要相關(guān)不要因果;第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價(jià)值兩個(gè)方面,講述驅(qū)動(dòng)大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動(dòng)的最根本動(dòng)力;最后一部分,作者描繪了大數(shù)據(jù)帝國前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開等問題。
    本書觀點(diǎn)擲地有聲,作者觀念高屋建瓴,從很多實(shí)例和經(jīng)驗(yàn)中萃取普適性觀念。例子詳實(shí)豐富,囊括了進(jìn)百個(gè)學(xué)術(shù)和商業(yè)實(shí)例。
    引言提出了大數(shù)據(jù)將給生活、工作于思維帶來重大的變革。一個(gè)例子是20__年h1n1流行病毒背景下谷歌通過檢測(cè)檢索詞條,處理了4.5億個(gè)不同的數(shù)據(jù)模型,通過預(yù)測(cè)并與20__年、20__年美國疾控中心記錄的實(shí)際流感病例進(jìn)行對(duì)比后,確定了45條檢索詞條組合,并將其用于一個(gè)特定的數(shù)學(xué)模型后,預(yù)測(cè)的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達(dá)97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對(duì)于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運(yùn)用大數(shù)據(jù)技術(shù),以前所未有的方式,通過海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預(yù)測(cè)流感提供了一種更快捷的預(yù)測(cè)工具。此外,我聯(lián)想到原淘寶董事長馬云通過大量數(shù)據(jù)分析得出20__年經(jīng)濟(jì)疲弱,為其商家提前做好迎接經(jīng)濟(jì)危機(jī)提供了時(shí)間緩沖。(補(bǔ)充并清晰描述詳細(xì))關(guān)于大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用,farecast公司是一個(gè)成功的典型范例。該公司由奧倫·埃齊奧尼創(chuàng)辦,利用機(jī)票的銷售數(shù)據(jù)來預(yù)測(cè)未來的機(jī)票價(jià)格,旨在幫助用戶在購買機(jī)票方面做出預(yù)測(cè),并對(duì)機(jī)票價(jià)格走勢(shì)預(yù)測(cè)的可信度標(biāo)示出來供消費(fèi)者查考。farecast系統(tǒng)利用近十萬億條價(jià)格記錄預(yù)測(cè)的準(zhǔn)確度達(dá)75%,使得使用farecast票價(jià)預(yù)測(cè)工具購買機(jī)票的旅客,平均每張機(jī)票節(jié)約50美元。而處理如此多的數(shù)據(jù)離開了大數(shù)據(jù)技術(shù)將無法進(jìn)行。
    也正是由于我們進(jìn)入了一個(gè)前所未有的信息化時(shí)代,人們擁有了如此多的數(shù)據(jù),才提供給我們利用大數(shù)據(jù)的分析處理手段,創(chuàng)造新的價(jià)值。也許有人以為我們大數(shù)據(jù)時(shí)代的還未來臨。其實(shí)大數(shù)據(jù)技術(shù)早已滲透到我們中間,它被應(yīng)用在垃圾郵件的過濾,新浪微博技術(shù)平臺(tái),谷歌翻譯以及輸入文字的自動(dòng)糾錯(cuò)等。
    文中提出的一個(gè)觀點(diǎn)是,預(yù)測(cè)是大數(shù)據(jù)的核心。其實(shí)從過去的時(shí)代人們就利用掌握的數(shù)據(jù)進(jìn)行各種分析,從而對(duì)經(jīng)濟(jì)等各方面進(jìn)行預(yù)測(cè)、矯正。只是進(jìn)入了大數(shù)據(jù)時(shí)代人們掌握的數(shù)據(jù)爆炸性的速度在增長,從而數(shù)據(jù)的存儲(chǔ)和分析數(shù)據(jù)分方法成了釋放大數(shù)據(jù)能量的關(guān)鍵。
    關(guān)于不是隨機(jī)樣本而是整體數(shù)據(jù)中。作者指出了隨機(jī)取樣是小數(shù)據(jù)時(shí)代用最少的數(shù)據(jù)獲取最大價(jià)值的做法。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義。喬布斯成為世界上第一個(gè)對(duì)自身所有dna和腫瘤dna進(jìn)行排序的人。喬布斯曾開玩笑說“我要么是第一個(gè)通過這種方式戰(zhàn)勝癌癥的人,要么就是最后一個(gè)因?yàn)檫@種方式死于癌癥的人”。雖然最后難免死于癌癥但這種獲得所有數(shù)據(jù)而不是僅樣本的方法將他的生命延長了幾年。同樣,從事跨境匯款業(yè)務(wù)的xoom公司偵破一起犯罪集團(tuán)的詐騙也是由于使用了整體數(shù)據(jù)。初此之外,他還列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。
    作者同時(shí)也指出隨著數(shù)據(jù)使用的越來越多,其得出的結(jié)果并一定能越來越精確,畢竟數(shù)據(jù)不能保證百分之百的正確,特別是大數(shù)據(jù)時(shí)代各種結(jié)構(gòu)化與非結(jié)構(gòu)化類型的數(shù)據(jù)聚集在一起難免導(dǎo)致結(jié)果的不太精確。大數(shù)據(jù)時(shí)代要求我們重新審視精確性的優(yōu)劣。作者特別舉了谷歌翻譯成功的例子。谷歌翻譯之所以優(yōu)于ibm的candide系統(tǒng)并不是因?yàn)樗鼡碛懈玫乃惴C(jī)制。和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯(cuò)誤的數(shù)據(jù)。(其語庫來自于未經(jīng)過濾的網(wǎng)頁內(nèi)容,會(huì)包含一些不完整的句子、拼寫錯(cuò)誤、語法錯(cuò)誤以及其他各種錯(cuò)誤)。
    在不是因果關(guān)系,而是相關(guān)關(guān)系的篇章中。作者指出在大數(shù)據(jù)時(shí)代往往知道是什么要比知道為什么來的更實(shí)在。作者列舉了林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢(shì)以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的先鋒和代表,從以前廣為人事的啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣的案例,都說明了掌握了相關(guān)關(guān)系對(duì)于其策略的幫助。建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的核心。aviva保險(xiǎn)公司利用幾百種生活方式的數(shù)據(jù),如愛好、長瀏覽網(wǎng)頁等間接的預(yù)測(cè)出哪些人更可能患高血壓、糖尿病和抑郁癥。ups國家快遞公司通過使用預(yù)測(cè)性分析檢測(cè)其全美6萬輛車隊(duì)。進(jìn)行防御性的修理,節(jié)約巨大得的成本。這些都充分顯示了大數(shù)據(jù)在預(yù)測(cè)方面的優(yōu)勢(shì)。
    本書第二部分講的是大數(shù)據(jù)時(shí)代的商業(yè)變革。
    作者用莫里繪制導(dǎo)航圖的例子告訴我們,遠(yuǎn)在信息數(shù)字化之前,對(duì)數(shù)據(jù)的運(yùn)用就已經(jīng)開始了。莫里利用大量的人力去分析多年保存的航海記錄,他從這些大量的數(shù)據(jù)中獲取到新的利用價(jià)值。繪制的圖表幫助商人節(jié)約一大筆錢,使年輕的海員們間接獲取了成千上萬名經(jīng)驗(yàn)豐富的航海家的指導(dǎo)。日本先進(jìn)工業(yè)技術(shù)研究所越水重臣教授通過安裝壓力傳感器將人屁股特征數(shù)據(jù)化,進(jìn)而形成對(duì)乘客身份的特征識(shí)別。這項(xiàng)技術(shù)為汽車防盜系統(tǒng)提供了方案。公司,致力于為顧客預(yù)測(cè)商品的價(jià)格,通過收集處理海量的價(jià)格信息,預(yù)測(cè)準(zhǔn)確率高達(dá)77%,幫助顧客在購買一個(gè)產(chǎn)品時(shí)節(jié)約了大約100美元。r部門通過分析來自210個(gè)國家的15億信用卡用戶的650億條交易記錄,分析得出商業(yè)發(fā)展和客戶消費(fèi)趨勢(shì),如通過分析發(fā)現(xiàn)如果一個(gè)人下午四點(diǎn)左右給汽車加油的話,他很可能在接下來的一個(gè)小時(shí)內(nèi)去購物或者去餐館吃飯,且在這一小時(shí)里大約花費(fèi)35到40美元。商家正可以利用這個(gè)分析結(jié)果,在加油的小票背面附加上附近商店的優(yōu)惠券。
    這些例子都證明了大數(shù)據(jù)蘊(yùn)藏著巨大的商業(yè)價(jià)值。根據(jù)提供價(jià)值的不同來源,大數(shù)據(jù)價(jià)值鏈包括三大構(gòu)成部分。包括第一種是基于數(shù)據(jù)本身的公司。這些公司擁有大量數(shù)據(jù)或者至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價(jià)值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。第二種是基于技能的公司。它們通常是咨詢公司、技術(shù)供應(yīng)商或者分析公司。它們掌握了專業(yè)技能但并不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)性用途的才能。比如說,沃爾瑪和pop-tarts這兩個(gè)零售商就是借助天睿公司的分析來獲得營銷點(diǎn)子,天睿就是一家大數(shù)據(jù)分析公司。第三種是基于思維的公司。皮特.華登,jetpac的聯(lián)合創(chuàng)始人,就是通過想法獲得價(jià)值的一個(gè)例子,他通過用戶分享到網(wǎng)上的旅行照片來為人們推薦下一次旅行目的地。對(duì)于某些公司來說,數(shù)據(jù)和技能并不是成功的關(guān)鍵。挖掘數(shù)據(jù)的新價(jià)值的創(chuàng)新思維才是這些公司脫穎而出的優(yōu)勢(shì)所在。
    大數(shù)據(jù)成為許多公司競(jìng)爭(zhēng)力的來源,未來可能整個(gè)行業(yè)的結(jié)構(gòu)會(huì)發(fā)生改變,大公司和小公司最有可能成為贏家。如今的核心競(jìng)爭(zhēng)力在于快速而廉價(jià)地進(jìn)行大量的數(shù)據(jù)存儲(chǔ)和處理。當(dāng)然公司要根據(jù)自己的情況進(jìn)行調(diào)整。大數(shù)據(jù)向小數(shù)據(jù)時(shí)代的贏家以及那些線下大公司(如沃爾瑪、聯(lián)邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰(zhàn)。同時(shí),大數(shù)據(jù)也為小公司帶來了機(jī)遇。大數(shù)據(jù)也將會(huì)影響國家競(jìng)爭(zhēng)力。當(dāng)制造業(yè)已經(jīng)大幅轉(zhuǎn)向發(fā)展中國家,而大家都爭(zhēng)相發(fā)展創(chuàng)新行業(yè)的時(shí)候,工業(yè)化國家因?yàn)檎莆樟藬?shù)據(jù)以及大數(shù)據(jù)技術(shù),所以仍然在全球競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì),但這個(gè)優(yōu)勢(shì)很難持續(xù)。隨著技術(shù)的發(fā)展,西方世界在大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)將會(huì)慢慢消失。對(duì)于大公司而言,好消息是大數(shù)據(jù)技術(shù)可以加劇優(yōu)勝劣汰。一旦公司掌握了大數(shù)據(jù),它不但可能超過對(duì)手還可能遙遙領(lǐng)先。
    文章第三部分講了大數(shù)據(jù)帶來無數(shù)好處的同時(shí)帶來的不良影響以及如何面對(duì)這些影響。包括如數(shù)據(jù)的收益的處理問題以及數(shù)據(jù)中用戶資料的隱私和決策過程帶來的影響。作者在保護(hù)個(gè)人隱私方面提出了幾種想法。一種是使用數(shù)據(jù)時(shí)征詢數(shù)據(jù)所有個(gè)人的知曉和授權(quán)。第二個(gè)技術(shù)途徑就是匿名化。作者同時(shí)也指出了這兩種方式的難度。一方面收集到的數(shù)據(jù)可能會(huì)被后續(xù)的多次利用。另一方面,匿名化會(huì)在數(shù)據(jù)收集越來越多和數(shù)據(jù)的相互結(jié)合關(guān)聯(lián)使用時(shí)變得無效。作者列列舉電影《少數(shù)派報(bào)告》的情節(jié)說明越來越依賴數(shù)據(jù)時(shí),大數(shù)據(jù)可能將我們禁錮在可能性之中。當(dāng)然通過分析犯罪的常發(fā)地與常發(fā)時(shí)間,合理安排警力會(huì)對(duì)治安防范提供不小的幫助。作者還指出不能盡信數(shù)據(jù)的分析結(jié)果,因?yàn)椴荒鼙WC獲取分析結(jié)果來源的數(shù)據(jù)準(zhǔn)確性。大數(shù)據(jù)在給我們生活提供便利的同時(shí),也讓隱私保護(hù)的法律手段失去了作用。我們必須杜絕對(duì)數(shù)據(jù)的過分依賴。
    在高速邁進(jìn)大數(shù)據(jù)時(shí)代的同時(shí),人類信息管理準(zhǔn)則需要重新定位,這將帶動(dòng)社會(huì)核心價(jià)值觀的轉(zhuǎn)變。大數(shù)據(jù)時(shí)代,對(duì)原有規(guī)范的修修補(bǔ)補(bǔ)已經(jīng)不足以抑制大數(shù)據(jù)帶來的風(fēng)險(xiǎn)。保護(hù)個(gè)人隱私就需要對(duì)個(gè)人數(shù)據(jù)處理器對(duì)其政策和行為承擔(dān)更多責(zé)任。同時(shí)必須重新定義公正的概念,以確保人類行為的自由。作者提出了解決這些問題的方向。如個(gè)人隱私保護(hù)方面,可以讓使用者承擔(dān)更多的社會(huì)責(zé)任。將責(zé)任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者有很多意義,也有充分的理由。因?yàn)樗麄兏宄⑷绾问褂脭?shù)據(jù)且是數(shù)據(jù)應(yīng)用最大的受益者。關(guān)于公正方面簡(jiǎn)單的講就是個(gè)人可以并應(yīng)為他們的行為而非傾向負(fù)責(zé)。就像公司有內(nèi)部會(huì)計(jì)和外部審計(jì)人員一樣,大數(shù)據(jù)時(shí)代,公司將設(shè)置專門的人員--內(nèi)部和外部算法師對(duì)大數(shù)據(jù)活動(dòng)進(jìn)行監(jiān)督。還有可能出現(xiàn)第三方的機(jī)構(gòu)對(duì)大數(shù)據(jù)行為進(jìn)行監(jiān)督和衡量。作者甚至考慮到對(duì)大數(shù)據(jù)存在的壟斷情況進(jìn)行分析并在反壟斷反面給了建議。最后結(jié)語中作者提出大數(shù)據(jù)提供給人們的只是參考答案,提醒我們?cè)诶眠@個(gè)工具時(shí)要銘記人類的作用是無法完全替代的。
    大數(shù)據(jù)時(shí)代是信息化社會(huì)發(fā)展必然趨勢(shì),我們只有緊緊跟隨時(shí)代發(fā)展的潮流,在技術(shù)上、制度上、價(jià)值觀念上做出迅速調(diào)整并牢牢跟進(jìn),才能在接下來新一輪的國際競(jìng)爭(zhēng)中擺脫受制于人的弱勢(shì)境地,才能把握發(fā)展的方向,沖破與西方國家的差距。對(duì)于一個(gè)國家如此,對(duì)于一個(gè)企業(yè)亦是如此。在如此快速的到來的大數(shù)據(jù)時(shí)代,我們還有很多知識(shí)需要學(xué)習(xí),許多思維需要轉(zhuǎn)變,許多技術(shù)需要研究。公司的規(guī)劃中,也需充分考慮到大數(shù)據(jù)對(duì)于公司的未來發(fā)展所帶來的機(jī)遇和挑戰(zhàn)。對(duì)于掌握大量數(shù)據(jù)的公司,需要考慮有多少數(shù)字化的數(shù)據(jù),又有哪些可以通過大數(shù)據(jù)的分析處理而帶來有價(jià)值的用途?比如國內(nèi)目前的社交網(wǎng)站,購物網(wǎng)站等都掌握了用戶的大量的數(shù)據(jù)信息。在大數(shù)據(jù)時(shí)代制勝的良藥也許是創(chuàng)新的點(diǎn)子,也許可以利用外部的數(shù)據(jù),通過多維化、多層面的分析給其他企業(yè)或個(gè)人帶來價(jià)值。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇七
    《大數(shù)據(jù)時(shí)代》這本書寫的很好,很值得一讀,因?yàn)闀?huì)給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。下面是本站小編為大家收集整理的大數(shù)據(jù)時(shí)代。
    總結(jié),歡迎大家閱讀。
    利用周末,一口氣讀完了涂子沛的大作《大數(shù)據(jù)》。這本書很好看,行文如流水,引人入勝。書中,你讀到的不是大數(shù)據(jù)技術(shù),更多是與大數(shù)據(jù)相關(guān)的美國政治、經(jīng)濟(jì)、社會(huì)和文化的演進(jìn)。作為一名信息化從業(yè)者,讀完全書,我深刻感受到了在信息化方面中國與美國的各自特色,也看到了我們與美國的差距。有幾個(gè)方面的體會(huì),但窺一斑基本能見全貌。
    一是政府業(yè)務(wù)數(shù)據(jù)庫公開的廣度和深度。近年來,隨著我國信息公開工作的推進(jìn),各級(jí)政府都在通過政府門戶網(wǎng)站建設(shè)積極推進(jìn)網(wǎng)上政務(wù)信息公開,但我們的信息公開,現(xiàn)階段還主要是政府的政策、法律法規(guī)、標(biāo)準(zhǔn)、公文通告、工作職責(zé)、辦事指南、工作動(dòng)態(tài)、人事任免等行政事務(wù)性信息的公開。當(dāng)然,實(shí)時(shí)的政府業(yè)務(wù)數(shù)據(jù)庫公開也已經(jīng)取得很大進(jìn)步。在中國政府門戶網(wǎng),可以查詢一些公益數(shù)據(jù)庫,如國家統(tǒng)計(jì)局的經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)、環(huán)保部數(shù)據(jù)中心提供的全國空氣、水文等數(shù)據(jù),氣象總局提供的全國氣象數(shù)據(jù),民航總局提供的全國航班信息等;訪問各個(gè)部委的網(wǎng)站,也能查到很多業(yè)務(wù)數(shù)據(jù),如發(fā)改委的項(xiàng)目立項(xiàng)庫、工商局的企業(yè)信用庫、國土資源部的土地證庫、國家安監(jiān)總局的煤礦安全預(yù)警信息庫、各類工程招標(biāo)信息庫等等。這是一個(gè)非常大的進(jìn)步,也是這么多年電子政務(wù)建設(shè)所取得的成效和價(jià)值!但是,政務(wù)業(yè)務(wù)數(shù)據(jù)庫中的很多數(shù)據(jù)目前還沒有實(shí)現(xiàn)公開,很多數(shù)據(jù)因?yàn)椴块T利益和“保密”等因素,還僅限于部門內(nèi)部人員使用,沒有公開給公眾;已經(jīng)公開的數(shù)據(jù)也僅限于一部分基本信息和統(tǒng)計(jì)信息,更多數(shù)據(jù)還沒有被公開。從《大數(shù)據(jù)》一書中記錄的美國數(shù)據(jù)公開的實(shí)踐來看,美國在數(shù)據(jù)公開的廣度和深度都比較大。美國人認(rèn)為“用納稅人的錢收集的數(shù)據(jù)應(yīng)該免費(fèi)提供給納稅人使用”,盡管美國政府事實(shí)上對(duì)數(shù)據(jù)的公開也有抵觸,但民愿不可違,美國政府的業(yè)務(wù)數(shù)據(jù)越來越公開,尤其是在奧巴馬政府簽署《透明和開放的政府》文件后,開放力度更加大。是美國聯(lián)盟政府新建設(shè)的統(tǒng)一的數(shù)據(jù)開放門戶網(wǎng)站,網(wǎng)站按照原始數(shù)據(jù)、地理數(shù)據(jù)和數(shù)據(jù)應(yīng)用工具來組織開放的各類數(shù)據(jù),累積開放378529個(gè)原始和地理數(shù)據(jù)集。在中國尚沒有這樣的數(shù)據(jù)開放的網(wǎng)站。另外,由于制度的不同,美國業(yè)務(wù)信息公開的深度也很大,例如,網(wǎng)上公布的美國總統(tǒng)“白宮訪客記錄”公布的甚至是造訪白宮的各類人員的相關(guān)信息;美國的網(wǎng)站,能夠逐條跟蹤、記錄、分析聯(lián)邦政府每一筆財(cái)政支出。這在中國,目前應(yīng)該還沒有實(shí)現(xiàn)。
    二是對(duì)政府對(duì)業(yè)務(wù)數(shù)據(jù)的分析。目前,中國各級(jí)政府網(wǎng)站所提供的業(yè)務(wù)數(shù)據(jù)基本上還是數(shù)據(jù)表,部分網(wǎng)站能提供一些統(tǒng)計(jì)圖,但很少能實(shí)現(xiàn)數(shù)據(jù)的跨部門聯(lián)機(jī)分析、數(shù)據(jù)關(guān)聯(lián)分析。這主要是由于以往中國政務(wù)信息化的建設(shè)還處于部門建設(shè)階段。美國在這方面的步伐要快一些,美國的網(wǎng)站,不僅提供原始數(shù)據(jù)和地理數(shù)據(jù),還提供很多數(shù)據(jù)工具,這些工具很多都是公眾、公益組織和一些商業(yè)機(jī)構(gòu)提供的,這些應(yīng)用為數(shù)據(jù)處理、聯(lián)機(jī)分析、基于社交網(wǎng)絡(luò)的關(guān)聯(lián)分析等方面提供手段。如上提供的白宮訪客搜索工具,可以搜尋到訪客信息,并將白宮訪客與其他微博、社交網(wǎng)站等進(jìn)行關(guān)聯(lián),提高訪客的透明度。
    三是關(guān)于個(gè)人數(shù)據(jù)的隱私。在美國,公民的隱私和自有不可侵犯,美國沒有個(gè)人身份證,也不能建立基于個(gè)人身份證號(hào)碼的個(gè)人信息的關(guān)聯(lián),建立“中央數(shù)據(jù)銀行”的提案也一再被否決。這一點(diǎn),在中國不是問題,每個(gè)公民有唯一的身份信息,通過身份證信息,可以獲取公民的基本信息。今后,隨著國家人口基礎(chǔ)數(shù)據(jù)庫等基礎(chǔ)資源庫的建設(shè),公民的社保、醫(yī)療等其他相關(guān)信息也能方便獲取,當(dāng)然信息還是限于政府部門使用,但很難完全保證整合起來的這些個(gè)人信息不被泄露或者利用。
    數(shù)據(jù)是信息化建設(shè)的基礎(chǔ),兩個(gè)大國在大數(shù)據(jù)領(lǐng)域的互相學(xué)習(xí)和借鑒,取長補(bǔ)短,將推進(jìn)世界進(jìn)入信息時(shí)代。我欣喜地看到,美國政府20xx年啟動(dòng)了“大數(shù)據(jù)研發(fā)計(jì)劃”,投資2億美元,推動(dòng)大數(shù)據(jù)提取、存儲(chǔ)、分析、共享、可視化等領(lǐng)域的研究,并將其與超級(jí)計(jì)算和互聯(lián)網(wǎng)投資相提并論。同年,中國政府20xx年也批復(fù)了“國家政務(wù)信息化建設(shè)工程規(guī)劃”,總投資額估計(jì)在幾百億,專門有人口、法人、空間、宏觀經(jīng)濟(jì)和文化等五大資源庫的五大建設(shè)工程。開放、共享和智能的大數(shù)據(jù)的時(shí)代已經(jīng)來臨!
    讀了《大數(shù)據(jù)時(shí)代》后,感覺到一個(gè)大變革的時(shí)代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
    “在小數(shù)據(jù)時(shí)代,我們會(huì)假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想。”“隨著由假想時(shí)代到數(shù)據(jù)時(shí)代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對(duì)此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
    近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì)被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會(huì)它們。
    當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
    《大數(shù)據(jù)時(shí)代》第16頁“大數(shù)據(jù)的核心就是預(yù)測(cè)”。邏輯是——描述時(shí)空信息“類”與“類”之間長時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對(duì)立的。在同一件事上兩種方法對(duì)立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
    可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲?。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個(gè)更可怕的事情。
    其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對(duì)論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职郑瑑鹤泳褪莾鹤?。那么大?shù)據(jù)會(huì)不會(huì)通過正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有?!洞髷?shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
    還好我知道自己對(duì)什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。
    所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書繼續(xù)寫下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。
    在《大數(shù)據(jù)時(shí)代》一書中,大數(shù)據(jù)時(shí)代與小數(shù)據(jù)時(shí)代的區(qū)別:1、思維慣例。大數(shù)據(jù)時(shí)代區(qū)別與轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對(duì),卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動(dòng)過去來預(yù)測(cè)未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測(cè)未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗(yàn)證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時(shí)代也即是信息時(shí)代,是大數(shù)據(jù)時(shí)代的前提,大數(shù)據(jù)時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
    數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機(jī)遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時(shí)代,從數(shù)據(jù)中攫取價(jià)值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇八
    如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就out了。而且人云亦云的居多,不少談?wù)撜呱踔吝€沒有認(rèn)真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時(shí)代》。維克托·邁爾——舍恩伯格何許人也?他現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人。他的咨詢客戶包括微軟、惠普和ibm等全球頂級(jí)企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔(dān)任多國政府高層的智囊。這位被譽(yù)為:大數(shù)據(jù)時(shí)代的預(yù)言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應(yīng)的理論功底,就能與之進(jìn)行一場(chǎng)思想上的對(duì)話。
    一讀。
    舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。在第一部分“大數(shù)據(jù)時(shí)代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個(gè)觀點(diǎn):一、更多:不是隨機(jī)樣本,而是全體數(shù)據(jù);二、更雜:不是精確性,而是混雜性;三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對(duì)于第一個(gè)觀點(diǎn),我不敢茍同。一方面是對(duì)全體數(shù)據(jù)進(jìn)行處理,在技術(shù)和設(shè)備上有相當(dāng)高的難度。另一方面是不是都有此必要,對(duì)于簡(jiǎn)單事實(shí)進(jìn)行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?我曾與香港城市大學(xué)的祝建華教授討論過。祝教授是傳播學(xué)研究方法和數(shù)據(jù)分析的專家,他認(rèn)為一定可以找到一種數(shù)理統(tǒng)計(jì)方法來進(jìn)行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個(gè)觀點(diǎn)中所說的相關(guān)關(guān)系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機(jī)樣本不限于目標(biāo)數(shù)據(jù),還包括目標(biāo)以外的所有數(shù)據(jù)。我認(rèn)為大數(shù)據(jù)分析不能排除隨機(jī)抽樣,只是抽樣的方法和范圍要加以拓展。
    我同意舍恩伯格的第二觀點(diǎn),我認(rèn)為這是對(duì)他第一個(gè)觀點(diǎn)很好的補(bǔ)充,這也是對(duì)精準(zhǔn)傳播和精準(zhǔn)營銷的一種反思?!按髷?shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效?!备哂泻暧^視野和東方哲學(xué)思維。對(duì)于舍恩伯格的第三個(gè)觀點(diǎn),我也不能完全贊同?!安皇且蚬P(guān)系,而是相關(guān)關(guān)系?!辈恍枰馈盀槭裁础?,只需要知道“是什么”。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時(shí)代人們只關(guān)心因果關(guān)系,對(duì)相關(guān)關(guān)系認(rèn)識(shí)不足,大數(shù)據(jù)時(shí)代相關(guān)關(guān)系舉足輕重,如何強(qiáng)調(diào)都不為過,但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價(jià)值。如今不少學(xué)者為了闡述和傳播其觀點(diǎn)往往語出驚人,對(duì)舊有觀念進(jìn)行徹底的否定。
    世間萬物的復(fù)雜性多樣化并非非此即彼那么簡(jiǎn)單,舍恩伯格也是這種二元對(duì)立的幼稚思維嗎?其實(shí)不然,讀者在閱讀時(shí)一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出“不是因果關(guān)系,而是相關(guān)關(guān)系。”這一論斷時(shí),他在書中還說道:“在大多數(shù)情況下,一旦我們完成了對(duì)大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時(shí),我們就會(huì)繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’?!盵i]由此可見,他說的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語境下的,是在數(shù)據(jù)挖掘中的選項(xiàng)。
    大數(shù)據(jù)研究的一大驅(qū)動(dòng)力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時(shí)代的商業(yè)變革。舍恩伯格認(rèn)為數(shù)據(jù)化就是一切皆可“量化”,大數(shù)據(jù)的定量分析有力地回答“是什么”這一問題,但仍然無法完全回答“為什么”。因此,我認(rèn)為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價(jià)值,這是毫無疑問的。舍恩伯格在討論大數(shù)據(jù)的角色定位時(shí)仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒有把它置于整個(gè)社會(huì)系統(tǒng)里,但他在第二部分大數(shù)據(jù)時(shí)代的管理變革中討論了這個(gè)問題。在風(fēng)險(xiǎn)社會(huì)中信息安全問題日趨凸顯,數(shù)據(jù)獨(dú)裁與隱私保護(hù)成為一對(duì)矛盾。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)“掌控”中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個(gè)問題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語中所道:“大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來?!敝x謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學(xué)回到人文社科。由此推斷,《大數(shù)據(jù)時(shí)代》不是最終答案,也不是標(biāo)準(zhǔn)答案,只是參考答案。
    此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識(shí)和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。
    再讀。
    概念是研究的邏輯起點(diǎn),“大數(shù)據(jù)”到底是什么?在百度上搜索到的解釋是,“大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。”大數(shù)據(jù)的4v特點(diǎn):數(shù)量(volume)、速度(velocity)、品種(variety)和真實(shí)性(veracity)。但舍恩伯格認(rèn)為大數(shù)據(jù)并非一個(gè)確切的概念。他在書中的一段詮釋更具人文色彩和社會(huì)意義:“大數(shù)據(jù)是人們獲得新的認(rèn)知、創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場(chǎng)、組織機(jī)構(gòu),以及政府與公民關(guān)系的方法。”[ii]其實(shí),概念的界定要看研究者從哪個(gè)角度來研究它而定。
    科學(xué)家的治學(xué)態(tài)度是嚴(yán)謹(jǐn)?shù)?,而人文學(xué)家更具有想象力。一些對(duì)大數(shù)據(jù)不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格認(rèn)為大數(shù)據(jù)的核心是預(yù)測(cè)?!按髷?shù)據(jù)不是要教機(jī)器像人一樣思考。相反,把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來預(yù)期事情發(fā)生的可能性?!盵iii]舍恩伯格甚至不回避大數(shù)據(jù)所產(chǎn)生的負(fù)面影響,他在第七章里談到讓數(shù)據(jù)主宰一切的隱憂。我覺得這是實(shí)事求是的科學(xué)態(tài)度。在量子力學(xué)里有一個(gè)測(cè)不準(zhǔn)原理:一個(gè)微觀粒子的某些物理量(如位置和動(dòng)量,或方位角與動(dòng)量矩,還有時(shí)間和能量等),不可能同時(shí)具有確定的數(shù)值,其中一個(gè)量越確定,另一個(gè)量的不確定程度就越大。它是解釋微觀世界的物理現(xiàn)象,信息社會(huì)中的大數(shù)據(jù)會(huì)不會(huì)也有類似情況呢?如果我們?cè)侔褎P文·凱利的《失控》對(duì)比來讀的話就更有意思了,這樣我們對(duì)整個(gè)物質(zhì)世界及至人類社會(huì)就有了更全面更深刻的洞察,從物理王國到生物世界,再到信息社會(huì)。從公共衛(wèi)生到商業(yè)應(yīng)用,從個(gè)人隱私到政府管理,大數(shù)據(jù)無處不在。與此同時(shí),從哪個(gè)角度探討用什么方法研究,舍恩伯格都不會(huì)忘記大數(shù)據(jù)服務(wù)人類造福人類的終極目的和價(jià)值所在?!按髷?shù)據(jù)并不是一個(gè)充斥著運(yùn)算法則和機(jī)器的冰冷世界,其中仍需要人類扮演重要角色。人類獨(dú)有的弱點(diǎn)、錯(cuò)覺、錯(cuò)誤都是十分必要的,因?yàn)檫@些特性的另一頭牽著的是人類的創(chuàng)造力、直覺和天賦。偶爾也會(huì)帶來屈辱或固執(zhí)的同樣混亂的大腦運(yùn)作,也能帶來成功,或在偶然間促成我們的偉大。這提示我們應(yīng)該樂于接受類似的不準(zhǔn)確,因?yàn)椴粶?zhǔn)確正是我們之所以為人的特征之一?!盵iv]用中國話來說就是“人無完人”,人類在收獲大數(shù)據(jù)帶來的紅利的同時(shí)也要承受它帶來的危害。這不是對(duì)立統(tǒng)一的辯證唯物主義?我把它看作帶著歐洲批判學(xué)派色彩的科學(xué)發(fā)展觀。
    問題是研究的價(jià)值基點(diǎn),“大數(shù)據(jù)”不是舍恩伯格研究的問題,而是研究對(duì)象,他研究的是數(shù)據(jù)處理和信息管理問題,同時(shí)也討論信息安全和網(wǎng)絡(luò)倫理問題,還引發(fā)哲學(xué)上的思考,哲學(xué)史上爭(zhēng)論不休的世界可知論和不可知論轉(zhuǎn)變?yōu)閷?shí)證科學(xué)中的具體問題??芍允墙^對(duì)的,不可知性是相對(duì)的?!按髷?shù)據(jù)”之所以為大是因它引發(fā)人類生活、工作和思維的大變革,從這個(gè)意義上來看,《大數(shù)據(jù)時(shí)代》的意義不僅在于它討論了若干重大問題,而且對(duì)研究者開出了一個(gè)問題清單,從而引發(fā)更多人來探討這些有趣的問題。
    《大數(shù)據(jù)時(shí)代》實(shí)際上主要是一本討論數(shù)據(jù)挖掘的書,數(shù)據(jù)挖掘與數(shù)據(jù)分析是不同的概念,數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動(dòng)搜索隱藏于其中的有著特殊關(guān)系性的信息的過程。數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)有關(guān),并通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來實(shí)現(xiàn)上述目標(biāo)。而數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對(duì)象的內(nèi)在規(guī)律。數(shù)據(jù)挖掘主要運(yùn)用計(jì)算機(jī)來進(jìn)行處理,而數(shù)據(jù)分析既要用計(jì)算機(jī)也要人工分析,是計(jì)算機(jī)科學(xué)與人文價(jià)值判斷的統(tǒng)一結(jié)合。換言之,《大數(shù)據(jù)時(shí)代》并不是一本討論大數(shù)據(jù)所有問題的書。
    《大數(shù)據(jù)時(shí)代》也是一本討論互聯(lián)網(wǎng)發(fā)展的書,從數(shù)字化到數(shù)據(jù)化,同時(shí)有濃厚的未來學(xué)色彩。當(dāng)文字變成數(shù)據(jù),我們進(jìn)入了互聯(lián)網(wǎng);當(dāng)方位變成數(shù)據(jù),我們進(jìn)入了物聯(lián)網(wǎng);當(dāng)溝通變成數(shù)據(jù),我們進(jìn)入了下一代互聯(lián)網(wǎng)。一切可量化,萬物皆數(shù)據(jù),正是當(dāng)今互聯(lián)網(wǎng)世界的真實(shí)寫照。面對(duì)于這樣的世界及世界的未來,在《大數(shù)據(jù)時(shí)代》出現(xiàn)最多的詞是“思維”和“方法”,因此也可以把這本書視為思維科學(xué)應(yīng)用研究的書。
    此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識(shí)和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。
    三讀。
    今年國慶節(jié)前一天,中共中央政治局們來到中關(guān)村搞集體學(xué)習(xí),調(diào)研、講解、討論創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略。包括、在內(nèi)的七位全部出動(dòng)來到中關(guān)村,這是歷史上沒有過的,百度、聯(lián)想和小米的負(fù)責(zé)人,有了一次直面最高層匯報(bào)工作的機(jī)會(huì)。雷軍和柳傳志,講解的都是本公司的各種情況,李彥宏則沒有講百度的廣告業(yè)務(wù)發(fā)展得如何好,而是講起了大數(shù)據(jù)。在講解中,李彥宏認(rèn)為大數(shù)據(jù)有兩個(gè)重要價(jià)值,一是促進(jìn)信息消費(fèi),加快經(jīng)濟(jì)轉(zhuǎn)型升級(jí);二是關(guān)注社會(huì)民生,帶動(dòng)社會(huì)管理創(chuàng)新。這些價(jià)值也是目前黨和國家領(lǐng)導(dǎo)人最為重視的,可見《大數(shù)據(jù)時(shí)代》既有理論價(jià)值也有現(xiàn)實(shí)意義。
    當(dāng)今大數(shù)據(jù)正在影響著新聞傳媒業(yè),大數(shù)據(jù)新聞、大數(shù)據(jù)營銷、輿情分析、受眾(用戶)研究……數(shù)據(jù)分析師變身新聞編輯,大數(shù)據(jù)正改變新聞生產(chǎn)流程、大數(shù)據(jù)在創(chuàng)造傳媒新業(yè)態(tài)?!安环料胂笠幌拢S著數(shù)據(jù)的進(jìn)一步增加,坐擁用戶資源的新媒體們完全有能力通過數(shù)據(jù)挖掘,分析用戶癖好,向電視臺(tái)定制一部電視劇甚至向好萊塢定制一部電影。到那個(gè)時(shí)候,電視臺(tái)一如那些家電廠商們,曾經(jīng)產(chǎn)業(yè)鏈的上游‘王者’,將徹底成為一個(gè)產(chǎn)業(yè)鏈最低端的內(nèi)容代工廠。”[v]然而,情形也遠(yuǎn)沒有人們想象的那么樂觀,李彥宏指出目前多數(shù)所謂的大數(shù)據(jù)公司其實(shí)還是空殼子,因?yàn)閿?shù)據(jù)還沒有完全開放。他認(rèn)為必須在政府層面上推動(dòng)才能真正實(shí)現(xiàn)大數(shù)據(jù)的開發(fā)與利用。我在討論大數(shù)據(jù)時(shí)代的輿情監(jiān)測(cè)與預(yù)警時(shí)說道:“經(jīng)典自由主義傳播學(xué)說對(duì)媒體的定位:秉持公正、客觀立場(chǎng)的媒體被稱為代表公眾監(jiān)督政府行為的‘看門狗’。其實(shí),媒體既是公眾利益也是國家利益的‘看門狗’。要看好門就要瞭望、洞察社情民意,傳統(tǒng)媒體信息反饋渠道單一,視野、人力十分有限。而開放互動(dòng)的新媒體平臺(tái)卻大有可為。作為公共信息發(fā)布平臺(tái)的微博可以成為政府及時(shí)了解社情民意,從而選擇正確治理路徑的‘導(dǎo)盲犬’?!盵vi]遺憾的是目前我國的數(shù)據(jù)平臺(tái)還沒有完全開放,真正的大數(shù)據(jù)時(shí)代還沒有到來。
    與國內(nèi)不少教科書寫法的專著相比,國外的書寫得更有趣,尤其是大學(xué)者寫的,不僅視野開闊,而且能夠深入淺出?!洞髷?shù)據(jù)時(shí)代》不到22萬字,卻有上百個(gè)學(xué)術(shù)和商業(yè)的實(shí)例,豐富翔實(shí)的例子讓讀者感到通俗易懂,深?yuàn)W的理論看起來也不費(fèi)勁。這恐怕與舍恩伯格既是學(xué)者也是專家,既有理論又有實(shí)踐有關(guān)。反觀我們些學(xué)者故弄玄虛而示高明,實(shí)際上是把讀者拒之門外。我覺得優(yōu)秀的科學(xué)家也應(yīng)該是一個(gè)科普作家,優(yōu)秀的學(xué)者也應(yīng)該是一個(gè)不錯(cuò)的傳播者。當(dāng)然國外學(xué)術(shù)著作也有一個(gè)翻譯問題,這本書譯得還不錯(cuò)。此外,《大數(shù)據(jù)時(shí)代》還附有不少it界名流的推薦意見,雖是出版商的發(fā)行所為,對(duì)解讀此書也不無益處。
    除了《大數(shù)據(jù)時(shí)代》,舍恩伯格還有一本《刪除》也值得一讀。要研究大數(shù)據(jù)不能只讀一本書,該書譯者周濤教授還推薦了三部國內(nèi)出版的大數(shù)據(jù)方面的專著:《證析》、《大數(shù)據(jù)》、《個(gè)性化:商業(yè)的未來》。相比《大數(shù)據(jù)時(shí)代》的宏大視野,這些書就大數(shù)據(jù)某一局部問題給出深刻的介紹和洞見。我也推薦讀一讀中國工程院李國杰院士和中科院計(jì)算所副總工程學(xué)旗合寫的文章《大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考》。
    雖說開卷有益,但是由于每個(gè)人的時(shí)間精力有限,對(duì)于一個(gè)研究者來說,不讀什么書甚至比讀什么書更重要。我認(rèn)為書有三種:有用的書,主要是應(yīng)用類的專業(yè)書;無用的書,主要是形而上的思想類;無字的書,人間百態(tài),社會(huì)現(xiàn)實(shí)??善氐粦?yīng)偏廢。對(duì)于學(xué)生來講這三類“書”都該讀一些,對(duì)于研究者則要讀哪些解決關(guān)鍵問題的書,《大數(shù)據(jù)時(shí)代》就是這樣一部書。當(dāng)然,并非第一個(gè)讀者都是研究大數(shù)據(jù)的,但進(jìn)入大數(shù)據(jù)時(shí)代,還有什么東西與數(shù)據(jù)完全沒有關(guān)系呢?麥肯錫全球研究機(jī)構(gòu)認(rèn)為,未來十年里有12項(xiàng)對(duì)經(jīng)濟(jì)發(fā)展產(chǎn)生重大影響的技術(shù),其中包括三項(xiàng)新媒體技術(shù):移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計(jì)算。這三項(xiàng)新媒體技術(shù)都與大數(shù)據(jù)密切相關(guān),而這些新媒體新技術(shù)的發(fā)展都影響著當(dāng)今的新聞傳播業(yè)。閱讀此書至少給我們研究新聞傳播學(xué)帶來一些啟迪。我覺得一本書的價(jià)值不在于讓你頂禮膜拜,而是引發(fā)廣泛而深入的討論。
    “凡是過去,皆為序曲。”讀完此書,我們對(duì)大數(shù)據(jù)的認(rèn)識(shí)才剛剛開始。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇九
    大數(shù)據(jù)時(shí)代已經(jīng)悄然到來,如何應(yīng)對(duì)大數(shù)據(jù)時(shí)代帶來的挑戰(zhàn)與機(jī)遇,是我們當(dāng)代大學(xué)生特別是我們計(jì)算機(jī)類專業(yè)的大學(xué)生的一個(gè)必須面對(duì)的嚴(yán)峻課題。大數(shù)據(jù)時(shí)代是我們的一個(gè)黃金時(shí)代,對(duì)我們的意義可以說就像是另一個(gè)“80年代”。在講座中秦永彬博士由一個(gè)電視劇《大太監(jiān)》中情節(jié)來深入淺出的簡(jiǎn)單介紹了“大數(shù)據(jù)”的基本概念,并由“塔吉特”與“犯罪預(yù)測(cè)”兩個(gè)案例讓我們深切的體會(huì)到了“大數(shù)據(jù)”的對(duì)現(xiàn)今這樣一個(gè)信息時(shí)代的不可替代的巨大作用。
    在前幾年本世紀(jì)初的時(shí)候,世界都稱本世紀(jì)為“信息世紀(jì)”。確實(shí)在計(jì)算機(jī)技術(shù)與互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展過后,我們面臨了一個(gè)每天都可以“信息爆炸”的時(shí)代。打開電視,打開電腦,甚至是在街上打開手機(jī)、pda、平板電腦等等,你都可以接收到來自互聯(lián)網(wǎng)從世界各地上傳的各類信息:數(shù)據(jù)、視頻、圖片、音頻……這樣各類大量的數(shù)據(jù)累積之后達(dá)到了引起量變的臨界值,數(shù)據(jù)本身有潛在的價(jià)值,但價(jià)值比較分散;數(shù)據(jù)高速產(chǎn)生,需高速處理。大數(shù)據(jù)意味著包括交易和交互數(shù)據(jù)集在內(nèi)的所有數(shù)據(jù)集,其規(guī)?;驈?fù)雜程度超出了常用技術(shù)按照合理的成本和時(shí)限捕捉、管理及處理這些數(shù)據(jù)集的能力。遂有了“大數(shù)據(jù)”技術(shù)的應(yīng)運(yùn)而生。
    現(xiàn)在,當(dāng)數(shù)據(jù)的積累量足夠大的時(shí)候到來時(shí),量變引起了質(zhì)變?!按髷?shù)據(jù)”通過對(duì)海量數(shù)據(jù)有針對(duì)性的分析,賦予了互聯(lián)網(wǎng)“智商”,這使得互聯(lián)網(wǎng)的作用,從簡(jiǎn)單的數(shù)據(jù)交流和信息傳遞,上升到基于海量數(shù)據(jù)的分析,一句話“他開始思考了”。簡(jiǎn)言之,大數(shù)據(jù)就是將碎片化的海量數(shù)據(jù)在一定的時(shí)間內(nèi)完成篩選、分析,并整理成為有用的資訊,幫助用戶完成決策。借助大數(shù)據(jù)企業(yè)的決策者可以迅速感知市場(chǎng)需求變化,從而促使他們作出對(duì)企業(yè)更有利的決策,使得這些企業(yè)擁有更強(qiáng)的創(chuàng)新力和競(jìng)爭(zhēng)力。這是繼云計(jì)算、物聯(lián)網(wǎng)之后it產(chǎn)業(yè)又一次顛覆性的技術(shù)變革,對(duì)國家治理模式、對(duì)企業(yè)的決策、組織和業(yè)務(wù)流程、對(duì)個(gè)人生活方式都將產(chǎn)生巨大的影響。后工業(yè)社會(huì)時(shí)代,隨著新興技術(shù)的發(fā)展與互聯(lián)網(wǎng)底層技術(shù)的革新,數(shù)據(jù)正在呈指數(shù)級(jí)增長,所有數(shù)據(jù)的產(chǎn)生形式,都是數(shù)字化。如何收集、管理和分析海量數(shù)據(jù)對(duì)于企業(yè)從事的一切商業(yè)活動(dòng)都顯得尤為重要。大數(shù)據(jù)時(shí)代是信息化社會(huì)發(fā)展必然趨勢(shì),我們只有緊緊跟隨時(shí)代發(fā)展的潮流,在技術(shù)上、制度上、價(jià)值觀念上做出迅速調(diào)整并牢牢跟進(jìn),才能在接下來新一輪的競(jìng)爭(zhēng)中擺脫受制于人的弱勢(shì)境地,才能把握發(fā)展的方向。
    首先,“大數(shù)據(jù)”究竟是什么?它有什么用?這是當(dāng)下每個(gè)人初接觸“大數(shù)據(jù)”都會(huì)有的疑問,而這些疑問在秦博士的講座中我們都了解到了?!按髷?shù)據(jù)”的“大”不僅是單單純純指數(shù)量上的“大”,而是在諸多方面上闡釋了“大”的含義,是體現(xiàn)在數(shù)據(jù)信息是海量信息,且在動(dòng)態(tài)變化和不斷增長之上。同時(shí)“大數(shù)據(jù)”在:速度(velocity)、多樣性(variety)、價(jià)值密度(value)、體量(volume)這四方面(4v)都有體現(xiàn)。其實(shí)“大數(shù)據(jù)”歸根結(jié)底還是數(shù)據(jù),其是一種泛化的數(shù)據(jù)描述形式,有別于以往對(duì)于數(shù)據(jù)信息的表達(dá),大數(shù)據(jù)更多地傾向于表達(dá)網(wǎng)絡(luò)用戶信息、新聞信息、銀行數(shù)據(jù)信息、社交媒體上的數(shù)據(jù)信息、購物網(wǎng)站上的用戶數(shù)據(jù)信息、規(guī)模超過tb級(jí)的數(shù)據(jù)信息等。
    一、學(xué)習(xí)總結(jié)。
    采用某些技術(shù),從技術(shù)中獲得洞察力,也就是bi或者分析,通過分析和優(yōu)化實(shí)現(xiàn)。
    對(duì)企業(yè)未來運(yùn)營的預(yù)測(cè)。
    在如此快速的到來的大數(shù)據(jù)革命時(shí)代,我們還有很多知識(shí)需要學(xué)習(xí),許多思維需要轉(zhuǎn)變,許多技術(shù)需要研究。職業(yè)規(guī)劃中,也需充分考慮到大數(shù)據(jù)對(duì)于自身職業(yè)的未來發(fā)展所帶來的機(jī)遇和挑戰(zhàn)。當(dāng)我們掌握大量數(shù)據(jù),需要考慮有多少數(shù)字化的數(shù)據(jù),又有哪些可以通過大數(shù)據(jù)的分析處理而帶來有價(jià)值的用途?在大數(shù)據(jù)時(shí)代制勝的良藥也許是創(chuàng)新的點(diǎn)子,也許可以利用外部的數(shù)據(jù),通過多維化、多層面的分析給我們?nèi)蘸髣?chuàng)業(yè)帶來價(jià)值。借力,順勢(shì),合作共贏。
    百度百科中是這么解釋的:大數(shù)據(jù)(bigdata),指無法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。我最開始了解大數(shù)據(jù)是從《大數(shù)據(jù)時(shí)代》了解到的。
    大數(shù)據(jù)在幾年特別火爆,不知道是不是以前沒關(guān)注的原因,從各種渠道了解了大數(shù)據(jù)以后,就決定開始學(xué)習(xí)了。
    二、開始學(xué)習(xí)之旅。
    在科多大數(shù)據(jù)學(xué)習(xí)這段時(shí)間,覺得時(shí)間過的很快,講課的老師,是國家大數(shù)據(jù)標(biāo)準(zhǔn)制定專家組成員,也是一家企業(yè)的大數(shù)據(jù)架構(gòu)師,老師上課忒耐心,上課方式也很好,經(jīng)常給我們講一些項(xiàng)目中的感受和經(jīng)驗(yàn),果然面對(duì)面上課效果好!
    如果有問題,老師會(huì)一直講到你懂,這點(diǎn)必須贊。上課時(shí)間有限,我在休息時(shí)間也利用他們的仿真實(shí)操系統(tǒng)不斷的練習(xí),剛開始確實(shí)有些迷糊,覺得很難學(xué),到后來慢慢就入門了,學(xué)習(xí)起來就容易多了,堅(jiān)持練習(xí),最重要的就是堅(jiān)持。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇十
    在《大數(shù)據(jù)時(shí)代》一書中,大數(shù)據(jù)時(shí)代與小數(shù)據(jù)時(shí)代的區(qū)別:1、思維慣例。大數(shù)據(jù)時(shí)代區(qū)別與轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對(duì),卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動(dòng)過去來預(yù)測(cè)未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測(cè)未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗(yàn)證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時(shí)代也即是信息時(shí)代,是大數(shù)據(jù)時(shí)代的前提,大數(shù)據(jù)時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
    數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機(jī)遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時(shí)代,從數(shù)據(jù)中攫取價(jià)值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇十一
    讀了《大數(shù)據(jù)時(shí)代》后,感覺到一個(gè)大變革的時(shí)代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
    “在小數(shù)據(jù)時(shí)代,我們會(huì)假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想?!薄半S著由假想時(shí)代到數(shù)據(jù)時(shí)代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對(duì)此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
    近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì)被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會(huì)它們。
    當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
    《大數(shù)據(jù)時(shí)代》第16頁“大數(shù)據(jù)的核心就是預(yù)測(cè)”。邏輯是——描述時(shí)空信息“類”與“類”之間長時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對(duì)立的。在同一件事上兩種方法對(duì)立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
    可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲小栴}不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個(gè)更可怕的事情。
    其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對(duì)論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會(huì)不會(huì)通過正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有?!洞髷?shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
    還好我知道自己對(duì)什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。
    所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書繼續(xù)寫下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇十二
    大數(shù)據(jù)時(shí)代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關(guān)系和不同,也試圖說明,為什么信息時(shí)代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時(shí)代?大數(shù)據(jù)時(shí)代帶給了我們什么?下面是本站小編為大家收集整理的大數(shù)據(jù)時(shí)代。
    歡迎大家閱讀。
    這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對(duì)現(xiàn)代商業(yè)運(yùn)作的影響。
    《大數(shù)據(jù)時(shí)代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對(duì)現(xiàn)象的解剖提出對(duì)這一現(xiàn)象的解釋。然后在通過解釋在對(duì)未來進(jìn)行預(yù)測(cè),并對(duì)未來可能出現(xiàn)的問題提出自己看法與對(duì)策。
    下面來重點(diǎn)介紹《大數(shù)據(jù)時(shí)代》這本書的主要內(nèi)容。
    《大數(shù)據(jù)時(shí)代》開篇就講了google通過人們?cè)谒阉饕嫔纤阉麝P(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測(cè)了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預(yù)測(cè)比政府提前將近一個(gè)月,相比之下政府只能夠在流感爆發(fā)一兩個(gè)周之后才可以弄到相關(guān)的數(shù)據(jù)。同時(shí)google的預(yù)測(cè)與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著google預(yù)測(cè)數(shù)據(jù)的置信區(qū)間為3%,這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計(jì)學(xué)上的常規(guī)置信區(qū)間5%!而這個(gè)數(shù)字就是大數(shù)據(jù)時(shí)代預(yù)測(cè)結(jié)果的相對(duì)準(zhǔn)確性與事件的可預(yù)測(cè)性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時(shí)代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時(shí)候,通過計(jì)算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r(shí)代數(shù)據(jù)的獲取與存儲(chǔ)處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測(cè)量事物。而互聯(lián)網(wǎng)終端與計(jì)算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲(chǔ)與處理難度大大降低,因而相對(duì)準(zhǔn)確性更高的“樣本=總體”的測(cè)算方式將成為大數(shù)據(jù)時(shí)代的主流,同時(shí)大數(shù)據(jù)時(shí)代本身也是建立在大批量數(shù)據(jù)的存儲(chǔ)與處理的基礎(chǔ)之上的。
    接下來,維克多又通過了ibm追求高精確性的電腦翻譯計(jì)劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲(chǔ)存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會(huì)出現(xiàn)翻譯,雖然有的時(shí)候的翻譯很無厘頭,但是大多數(shù)時(shí)候還是正確的,所以google的電腦翻譯的計(jì)劃的成功,表明大數(shù)據(jù)時(shí)代對(duì)準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時(shí)代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時(shí)代追求的是全方位覆蓋的數(shù)字測(cè)度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會(huì)湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時(shí)大量的數(shù)據(jù)也會(huì)無限的逼近事物的原貌。
    之后,維克托又預(yù)測(cè)了一個(gè)在大數(shù)據(jù)時(shí)代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計(jì)學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會(huì)在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個(gè)人隱私在大數(shù)據(jù)時(shí)代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個(gè)人隱私。
    無論如何,大數(shù)據(jù)時(shí)代將會(huì)到來,不管我們接受還是不接受!
    我覺得《大數(shù)據(jù)時(shí)代》這本書寫的很好,很值得一讀。因?yàn)闀?huì)給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實(shí)就是我們將會(huì)成為被預(yù)測(cè)被引誘的對(duì)象。所以說,小心你在網(wǎng)上留下的痕跡。
    我喜歡這本書是因?yàn)樗o我展現(xiàn)了一個(gè)新的世界。
    讀了《大數(shù)據(jù)時(shí)代》后,感覺到一個(gè)大變革的時(shí)代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
    “在小數(shù)據(jù)時(shí)代,我們會(huì)假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想?!薄半S著由假想時(shí)代到數(shù)據(jù)時(shí)代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對(duì)此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
    近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì)被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會(huì)它們。
    當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
    《大數(shù)據(jù)時(shí)代》第16頁“大數(shù)據(jù)的核心就是預(yù)測(cè)”。邏輯是——描述時(shí)空信息“類”與“類”之間長時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對(duì)立的。在同一件事上兩種方法對(duì)立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
    可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲?。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個(gè)更可怕的事情。
    其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對(duì)論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會(huì)不會(huì)通過正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有?!洞髷?shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
    還好我知道自己對(duì)什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。
    所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書繼續(xù)寫下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。
    在《大數(shù)據(jù)時(shí)代》一書中,大數(shù)據(jù)時(shí)代與小數(shù)據(jù)時(shí)代的區(qū)別:1、思維慣例。大數(shù)據(jù)時(shí)代區(qū)別與轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對(duì),卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動(dòng)過去來預(yù)測(cè)未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測(cè)未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗(yàn)證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時(shí)代也即是信息時(shí)代,是大數(shù)據(jù)時(shí)代的前提,大數(shù)據(jù)時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
    數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機(jī)遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時(shí)代,從數(shù)據(jù)中攫取價(jià)值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇十三
    描述小組在完成平臺(tái)安裝時(shí)候遇到的問題以及如何解決這些問題的,要求截圖加文字描述。
    問題一:在決定選擇網(wǎng)站綁定時(shí),當(dāng)時(shí)未找到網(wǎng)站綁定的地方。解決辦法:之后小組討論后,最終找到網(wǎng)站綁定的地方,點(diǎn)擊后解決了這個(gè)問題。
    問題二:當(dāng)時(shí)未找到tcp/ip屬性這一欄。
    解決辦法:當(dāng)時(shí)未找到tcp/ip屬性這一欄,通過老師的幫助和指導(dǎo),順利的點(diǎn)擊找到了該屬性途徑,啟用了這一屬性,完成了這一步的安裝步驟。
    問題三:在數(shù)據(jù)庫這一欄中,當(dāng)時(shí)未找到“foodmartsaledw”這個(gè)文件。
    問題四:在此處的sqlserver的導(dǎo)入和導(dǎo)出向?qū)?,這個(gè)過程非常的長。
    解決辦法:在此處的sqlserver的導(dǎo)入和導(dǎo)出向?qū)?,這個(gè)過程非常的長,當(dāng)時(shí)一直延遲到了下課的時(shí)間,小組成員經(jīng)討論,懷疑是否是電腦不兼容或其他問題,后來經(jīng)問老師,老師說此處的加載這樣長的時(shí)間是正常的,直到下課后,我們將電腦一直開著到寢室直到軟件安裝完為止。
    問題五:?jiǎn)栴}二:.不知道維度等概念,不知道怎么設(shè)置表間關(guān)系的數(shù)據(jù)源。關(guān)系方向不對(duì)。
    解決辦法:百度維度概念,設(shè)置好維度表和事實(shí)表之間的關(guān)系,關(guān)系有時(shí)候是反的——點(diǎn)擊反向,最后成功得到設(shè)置好表間關(guān)系后的數(shù)據(jù)源視圖。(如圖所示)。
    這個(gè)大圖當(dāng)時(shí)完全不知道怎么做,后來問的老師,老師邊講邊幫我們操作完成的。
    問題六:由于發(fā)生以下連接問題,無法將項(xiàng)目部署到“l(fā)ocalhost”服務(wù)器:無法建立連接。請(qǐng)確保該服務(wù)器正在運(yùn)行。若要驗(yàn)證或更新目標(biāo)服務(wù)器的名稱,請(qǐng)?jiān)诮鉀Q方案資源管理器中右鍵單擊相應(yīng)的項(xiàng)目、選擇“項(xiàng)目屬性”、單擊“部署”選項(xiàng)卡,然后輸入服務(wù)器的名稱?!币?yàn)槲以谂渲脭?shù)據(jù)源的時(shí)候就無法識(shí)別“l(fā)ocalhost”,所以我就打開數(shù)據(jù)庫屬性頁面:圖1-圖2圖一:
    圖二:
    解決辦法:解決辦法:圖2步驟1:從圖1到圖2后,將目標(biāo)下的“服務(wù)器”成自己的sqlserver服務(wù)器名稱行sqlservermanagementstudio可以)步驟2:點(diǎn)確定后,選擇“處理”,就可以成功部署了。
    問題七:無法登陸界面如圖:
    解決方法:嘗試了其他用戶登陸,就好了。
    (1)在幾周的學(xué)習(xí)中,通過老師課堂上耐心細(xì)致的講解,耐心的指導(dǎo)我們?nèi)绾我徊揭徊降陌惭b軟件,以及老師那些簡(jiǎn)單清晰明了的課件,是我了解了sql的基礎(chǔ)知識(shí),學(xué)會(huì)了如何創(chuàng)建數(shù)據(jù)庫,以及一些基本的數(shù)據(jù)應(yīng)用。陌生到熟悉的過程,從中經(jīng)歷了也體會(huì)到了很多感受,面臨不同的知識(shí)組織,我們也遇到不同困難。
    理大數(shù)據(jù)的規(guī)模。大數(shù)據(jù)進(jìn)修學(xué)習(xí)內(nèi)容模板:
    linux安裝,文件系統(tǒng),系統(tǒng)性能分析hadoop學(xué)習(xí)原理。
    大數(shù)據(jù)飛速發(fā)展時(shí)代,做一個(gè)合格的大數(shù)據(jù)開發(fā)工程師,只有不斷完善自己,不斷提高自己技術(shù)水平,這是一門神奇的課程。
    2、在學(xué)習(xí)sql的過程中,讓我們明白了原來自己的電腦可以成為一個(gè)數(shù)據(jù)庫,也可以做很多意想不到的事。以及在學(xué)習(xí)的過程中讓我的動(dòng)手能力增強(qiáng)了,也讓我更加懂得了原來電腦的世界是如此的博大精深,如此的神秘。通過這次的學(xué)習(xí)鍛煉了我們的動(dòng)手能力,上網(wǎng)查閱的能力。改善了我只會(huì)用電腦上網(wǎng)的尷尬處境,是電腦的用處更大。讓我們的小組更加的團(tuán)結(jié),每個(gè)人對(duì)自己的分工更加的明確,也鍛煉了我們的團(tuán)結(jié)協(xié)作,互幫互助的能力。
    3、如果再有機(jī)會(huì)進(jìn)行平臺(tái)搭建,會(huì)比這一次的安裝更加順手。而在導(dǎo)入數(shù)據(jù)庫和報(bào)表等方面也可以避免再犯相同的錯(cuò)誤,在安裝lls時(shí)可以做的更好。相信報(bào)表分析也會(huì)做的更加簡(jiǎn)單明了有條理。
    總結(jié)。
    大數(shù)據(jù)時(shí)代是信息化社會(huì)發(fā)展必然趨勢(shì)在大學(xué)的最后一學(xué)期里學(xué)習(xí)了這門課程是我們受益匪淺。讓我們知道了大數(shù)據(jù)大量的存在于現(xiàn)代社會(huì)生活中隨著新興技術(shù)的發(fā)展與互聯(lián)網(wǎng)底層技術(shù)的革新數(shù)據(jù)正在呈指數(shù)級(jí)增長所有數(shù)據(jù)的產(chǎn)生形式都是數(shù)字化。如何收集、管理和分析海量數(shù)據(jù)對(duì)于企業(yè)從事的一切商業(yè)活動(dòng)都顯得尤為重要。
    大數(shù)據(jù)時(shí)代是信息化社會(huì)發(fā)展必然趨勢(shì),我們只有緊緊跟隨時(shí)代的發(fā)展才能在以后的工作生活中中獲得更多的知識(shí)和經(jīng)驗(yàn)。
    三、
    結(jié)語。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇十四
    這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對(duì)現(xiàn)代商業(yè)運(yùn)作的影響。
    《大數(shù)據(jù)時(shí)代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對(duì)現(xiàn)象的解剖提出對(duì)這一現(xiàn)象的解釋。然后在通過解釋在對(duì)未來進(jìn)行預(yù)測(cè),并對(duì)未來可能出現(xiàn)的問題提出自己看法與對(duì)策。
    下面來重點(diǎn)介紹《大數(shù)據(jù)時(shí)代》這本書的主要內(nèi)容。
    《大數(shù)據(jù)時(shí)代》開篇就講了google通過人們?cè)谒阉饕嫔纤阉麝P(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測(cè)了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預(yù)測(cè)比政府提前將近一個(gè)月,相比之下政府只能夠在流感爆發(fā)一兩個(gè)周之后才可以弄到相關(guān)的數(shù)據(jù)。同時(shí)google的預(yù)測(cè)與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著google預(yù)測(cè)數(shù)據(jù)的置信區(qū)間為3%,這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計(jì)學(xué)上的常規(guī)置信區(qū)間5%!而這個(gè)數(shù)字就是大數(shù)據(jù)時(shí)代預(yù)測(cè)結(jié)果的相對(duì)準(zhǔn)確性與事件的可預(yù)測(cè)性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時(shí)代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時(shí)候,通過計(jì)算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r(shí)代數(shù)據(jù)的獲取與存儲(chǔ)處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測(cè)量事物。而互聯(lián)網(wǎng)終端與計(jì)算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲(chǔ)與處理難度大大降低,因而相對(duì)準(zhǔn)確性更高的“樣本=總體”的測(cè)算方式將成為大數(shù)據(jù)時(shí)代的主流,同時(shí)大數(shù)據(jù)時(shí)代本身也是建立在大批量數(shù)據(jù)的存儲(chǔ)與處理的基礎(chǔ)之上的。
    接下來,維克多又通過了ibm追求高精確性的電腦翻譯計(jì)劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲(chǔ)存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會(huì)出現(xiàn)翻譯,雖然有的時(shí)候的翻譯很無厘頭,但是大多數(shù)時(shí)候還是正確的,所以google的電腦翻譯的計(jì)劃的成功,表明大數(shù)據(jù)時(shí)代對(duì)準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時(shí)代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時(shí)代追求的是全方位覆蓋的數(shù)字測(cè)度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會(huì)湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時(shí)大量的數(shù)據(jù)也會(huì)無限的逼近事物的原貌。
    之后,維克托又預(yù)測(cè)了一個(gè)在大數(shù)據(jù)時(shí)代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計(jì)學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會(huì)在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個(gè)人隱私在大數(shù)據(jù)時(shí)代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個(gè)人隱私。
    無論如何,大數(shù)據(jù)時(shí)代將會(huì)到來,不管我們接受還是不接受!
    我覺得《大數(shù)據(jù)時(shí)代》這本書寫的很好,很值得一讀。因?yàn)闀?huì)給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實(shí)就是我們將會(huì)成為被預(yù)測(cè)被引誘的對(duì)象。所以說,小心你在網(wǎng)上留下的痕跡。
    我喜歡這本書是因?yàn)樗o我展現(xiàn)了一個(gè)新的世界。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇十五
    讀了《大數(shù)據(jù)時(shí)代》后,感覺到一個(gè)大變革的時(shí)代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
    本書從思維、商業(yè)、管理三個(gè)方面闡述了在大數(shù)據(jù)時(shí)代在下的變革,這些變革涉及到我們生活的方方面面,幾乎其影響程度可以與兩次工業(yè)革命相媲美。作者在第一部分提出了三個(gè)比較令人震驚的觀點(diǎn),也就是大數(shù)據(jù)的精髓在于我們分析信息時(shí)的三個(gè)轉(zhuǎn)變,這三個(gè)轉(zhuǎn)變將改變我們的理解和組建社會(huì)的方法。并且作者將生活,工作思維的大變革和這幾個(gè)方面緊緊聯(lián)系在一起。
    第三個(gè)改變是不是因果關(guān)系而是相關(guān)關(guān)系,在大數(shù)據(jù)時(shí)代,我們更需要了解一個(gè)東西是什么,而不是為什么,要找到關(guān)聯(lián)無,通過一個(gè)良好的關(guān)聯(lián)物的相關(guān)關(guān)系可以幫助我們捕捉預(yù)測(cè)未來。
    這三個(gè)方面是大數(shù)據(jù)時(shí)代所給我們帶來的思維上的改變,所謂思路決定出路,思路有了創(chuàng)新,有了拓展,相應(yīng)的社會(huì)也就會(huì)有很大的變化。緊接著第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價(jià)值兩個(gè)方面,講述驅(qū)動(dòng)大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動(dòng)的最根本動(dòng)力。第三部分則是闡述了大數(shù)據(jù)時(shí)代下的弊端以及在管理上的措施。個(gè)人認(rèn)為本書的精髓部分是第一部分,第一部分的三個(gè)觀點(diǎn)涉及的面很廣,包括統(tǒng)計(jì)學(xué)、邏輯學(xué)、哲學(xué)等。后兩個(gè)部分都是以第一部分這三個(gè)觀點(diǎn)為基礎(chǔ)展開闡述的。
    這本書給我感觸最深的.就是這三個(gè)轉(zhuǎn)變,或者說是三個(gè)觀點(diǎn),可以說是哲學(xué)上說的世界觀,因?yàn)槭澜缬^決定方法論,所以這三個(gè)觀點(diǎn)對(duì)傳統(tǒng)看法的顛覆,就會(huì)導(dǎo)致各種變革的發(fā)生。
    首先是第一個(gè),作者認(rèn)為在抽樣研究時(shí)期,由于研究條件的欠缺,只能以少量的數(shù)據(jù)獲取最大的信息,而在大數(shù)據(jù)時(shí)代,我們可以獲得海量的數(shù)據(jù),抽樣自然就失去它的意義了。放棄了隨機(jī)分析法這種捷徑,采用所有的數(shù)據(jù)。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義,列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。
    這個(gè)觀點(diǎn)足以引起統(tǒng)計(jì)學(xué)乃至社會(huì)文明的變革,因?yàn)榻y(tǒng)計(jì)抽樣和幾何學(xué)定理、萬有引力一樣被看做文明得以建立牢固的基石。我對(duì)這個(gè)觀點(diǎn)還是比較認(rèn)同的,如果真能收集到整體的數(shù)據(jù)而且分析數(shù)據(jù)的工具也足夠先進(jìn),自然是全體數(shù)據(jù)研究得出的結(jié)果更令人信服。但是這個(gè)觀點(diǎn)也過于絕對(duì),就算是在大數(shù)據(jù)時(shí)代要想收集到全體數(shù)據(jù)還是不太可能實(shí)現(xiàn)的,因?yàn)槭占w數(shù)據(jù)要付出的代價(jià)有時(shí)會(huì)很大。比如說,你要檢測(cè)食品中致癌物質(zhì)是否超標(biāo),你不可能每一件食品你都檢測(cè)一遍吧。
    第二,要效率不要絕對(duì)的精確。作者說,執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無法被利用。作者是基于數(shù)據(jù)不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數(shù)據(jù)一個(gè)數(shù)據(jù)的錯(cuò)誤就會(huì)導(dǎo)致結(jié)果的誤差很大,但是如果數(shù)據(jù)足夠多、數(shù)據(jù)足夠雜那得出的結(jié)果就越靠近正確答案。大數(shù)據(jù)時(shí)代要求我們重新審視精確性的優(yōu)劣,甚至還說到大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無法實(shí)現(xiàn)精確性。谷歌翻譯的成功很好地證明了這一點(diǎn),谷歌的翻譯系統(tǒng)不像candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優(yōu)于ibm的candide系統(tǒng)并不是因?yàn)樗鼡碛懈玫乃惴C(jī)制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯(cuò)誤的數(shù)據(jù)。
    而在閱讀這本書時(shí),發(fā)現(xiàn)這本書中爭(zhēng)議最大的一個(gè)觀點(diǎn),不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認(rèn)同“相關(guān)關(guān)系比因果關(guān)系更重要”的觀點(diǎn)。作者覺得相關(guān)關(guān)系對(duì)于預(yù)測(cè)一些事情已經(jīng)足夠了,不用花大力氣去研究他們的因果關(guān)系。作者用林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢(shì)以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的代表,從啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣的案例,都說明了掌握了相關(guān)關(guān)系對(duì)于他們策略的幫助。
    一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業(yè)領(lǐng)域的,但是對(duì)于其他領(lǐng)域來說這個(gè)觀點(diǎn)就值得商榷了。比如說,在科學(xué)研究領(lǐng)域,你需要知其然也需要知道其所以然,找到事件發(fā)生的原理。用文中的一個(gè)例子說明,喬布斯測(cè)出整個(gè)基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發(fā)病的原理,知道哪一段基因?qū)е铝诉@種疾病,不可能只是說收集各種數(shù)據(jù),然后利用其相關(guān)性來判斷哪里出現(xiàn)了問題。
    過度依賴所帶來的后果。也用《少數(shù)派的報(bào)告》這部電影來說明如果癡迷于數(shù)據(jù)會(huì)導(dǎo)致我們將生活在一個(gè)沒有獨(dú)立選擇和自由意志的社會(huì),如果一切變?yōu)楝F(xiàn)實(shí),我們將被禁錮在大數(shù)據(jù)的可能性之中。所以書中提出了幾種解決方法,一種是使用數(shù)據(jù)時(shí)征詢數(shù)據(jù)所有個(gè)人的知曉和授權(quán)。第二個(gè)技術(shù)途徑就是匿名化。毫無疑問,大數(shù)據(jù)將會(huì)給社會(huì)管理帶來巨大的變革。
    在這個(gè)信息爆炸的時(shí)代,大數(shù)據(jù)給人類社會(huì)的方方面面帶來了巨大的變革,這是社會(huì)發(fā)展的潮流,不可逆轉(zhuǎn),我們只有順應(yīng)這種潮流,把握住大數(shù)據(jù)時(shí)代變革的思想,才能在時(shí)代潮流中成為佼佼者,在思維上思路上略高一籌,才能在行動(dòng)中占得先機(jī)!
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇十六
    隨著科技的不斷發(fā)展,我們已經(jīng)進(jìn)入了一個(gè)數(shù)據(jù)時(shí)代。在這個(gè)時(shí)代,大量的數(shù)據(jù)被收集、存儲(chǔ)和分析,它們對(duì)于企業(yè)以及政府機(jī)構(gòu)決策的重要性增加了許多。那么,對(duì)于我們每個(gè)人來說,數(shù)據(jù)時(shí)代又意味著什么呢?以下是我對(duì)于數(shù)據(jù)時(shí)代的心得體會(huì),希望能對(duì)大家有所啟發(fā)。
    1.數(shù)據(jù)時(shí)代意味著我們必須更加謹(jǐn)慎地處理個(gè)人信息。
    在數(shù)據(jù)時(shí)代,我們不得不面對(duì)一個(gè)關(guān)鍵問題:我們的個(gè)人信息是否足夠安全?在這個(gè)時(shí)代,每一次網(wǎng)上購物、社交媒體互動(dòng)、或是使用搜索引擎,我們都會(huì)留下許多數(shù)據(jù),這些數(shù)據(jù)會(huì)被永久保存,并且可能會(huì)被泄露或?yàn)E用。因此,我們必須更加謹(jǐn)慎地處理我們的個(gè)人信息,在使用互聯(lián)網(wǎng)時(shí),不要輕易向任何陌生人披露自己的隱私。
    2.數(shù)據(jù)時(shí)代需要我們培養(yǎng)更多的數(shù)據(jù)分析技能。
    在數(shù)據(jù)時(shí)代,我們不僅需要更謹(jǐn)慎地處理個(gè)人信息,我們還需要具備更多的數(shù)據(jù)分析技能。數(shù)據(jù)分析技能的掌握,意味著我們能夠更快地掌握大量信息,并更準(zhǔn)確地做出決策。這種技能不僅對(duì)于職業(yè)發(fā)展有益,還能幫助我們更好地權(quán)衡自己所做出的決策。
    數(shù)據(jù)時(shí)代為我們帶來一個(gè)偉大的好處,那就是:對(duì)于某一個(gè)問題,我們能夠獲得更多、更立體、更具體的信息。這使得我們更容易客觀地看待問題,而不被主觀因素所影響。同時(shí),我們也能夠更細(xì)致地研究問題的來源,因此更有可能擁有更好的解決方案。
    4.數(shù)據(jù)時(shí)代要求我們更好地保護(hù)知識(shí)產(chǎn)權(quán)。
    隨著數(shù)據(jù)時(shí)代的到來,知識(shí)產(chǎn)權(quán)的保護(hù)變得更加困難。尤其是在網(wǎng)絡(luò)上,它使所有人都可以輕易地復(fù)制或加工他人通過努力和經(jīng)驗(yàn)所創(chuàng)造的知識(shí)產(chǎn)權(quán)。因此,我們需要更加謹(jǐn)慎地對(duì)待知識(shí)產(chǎn)權(quán),保護(hù)我們自己的知識(shí)產(chǎn)權(quán)并尊重他人的知識(shí)產(chǎn)權(quán)。
    數(shù)據(jù)時(shí)代不僅是分析數(shù)據(jù)的時(shí)代,還是創(chuàng)造數(shù)據(jù)的時(shí)代。我們?cè)谑褂没ヂ?lián)網(wǎng)時(shí),經(jīng)常通過上傳信息、評(píng)論、和互動(dòng)活動(dòng)等方式為網(wǎng)絡(luò)世界貢獻(xiàn)數(shù)據(jù)。而這些數(shù)據(jù)可以幫助互聯(lián)網(wǎng)更好地服務(wù)于我們,幫助企業(yè)更好地了解他們的需求,進(jìn)一步創(chuàng)造更具價(jià)值的產(chǎn)品和服務(wù),并幫助推動(dòng)社會(huì)的進(jìn)步。
    總之,數(shù)據(jù)時(shí)代已經(jīng)帶來了巨大的變化,這些變化既有好處,也有挑戰(zhàn)。我們需要不斷適應(yīng)這個(gè)時(shí)代,保護(hù)我們的個(gè)人信息和知識(shí)產(chǎn)權(quán),同時(shí)學(xué)會(huì)更好地分析和利用數(shù)據(jù)。通過這樣,我們將能夠更好地從這個(gè)時(shí)代中獲得收益,同時(shí)為這個(gè)時(shí)代的發(fā)展做出更貢獻(xiàn)。
    大數(shù)據(jù)時(shí)代的心得體會(huì)篇十七
    數(shù)據(jù)時(shí)代是一個(gè)無處不在的數(shù)字世界,我們生活在這個(gè)數(shù)字化的時(shí)代當(dāng)中,伴隨著科技的不斷發(fā)展和普及,數(shù)據(jù)也變得日益龐大、重要且不可倒退。在這個(gè)時(shí)代里,科技正在重塑著我們的社會(huì)形態(tài)和人類思維,同時(shí)也為我們帶來了前所未有的機(jī)遇和挑戰(zhàn)。通過對(duì)于數(shù)據(jù)時(shí)代的思考、探索和實(shí)踐,我們可以更好地理解這個(gè)時(shí)代所面臨的機(jī)遇與挑戰(zhàn),在其中找到我們自己的定位,并不斷地完善自己。
    數(shù)據(jù)時(shí)代有許多的機(jī)遇,它不僅僅是一種生產(chǎn)工具,更是一種創(chuàng)新方式和商業(yè)模式。在這個(gè)時(shí)代里,我們可以通過掌握相關(guān)技能、獲得數(shù)據(jù)分析能力,集成多渠道的資源、掌握實(shí)時(shí)數(shù)據(jù)、深入挖掘數(shù)據(jù),如此種種,才能更好的進(jìn)入數(shù)據(jù)時(shí)代的角色,轉(zhuǎn)化機(jī)遇。通過數(shù)據(jù)分析,我們可以做到精細(xì)化營銷、用戶需求細(xì)分以惠及用戶、結(jié)合多種方式實(shí)現(xiàn)新的業(yè)務(wù)形態(tài)。當(dāng)然,隨著數(shù)據(jù)時(shí)代的到來,要充分利用好數(shù)據(jù)所提供的機(jī)遇并不只這些。
    數(shù)據(jù)時(shí)代的挑戰(zhàn)并不少。數(shù)據(jù)時(shí)代下的問題,已經(jīng)不僅僅是如何收集和處理數(shù)據(jù),而是如何高效地利用數(shù)據(jù)進(jìn)行分析和應(yīng)用。復(fù)雜的分析技術(shù)、不穩(wěn)定的模型、部分?jǐn)?shù)據(jù)隱私、多樣性的數(shù)據(jù)資源等等,這些都是數(shù)據(jù)時(shí)代所要面對(duì)的挑戰(zhàn)。同時(shí),我們也需要提高對(duì)于數(shù)據(jù)的素養(yǎng),了解大數(shù)據(jù)安全與數(shù)據(jù)合規(guī)的知識(shí),從而提高數(shù)據(jù)的價(jià)值和安全保障。
    第四段:探索數(shù)據(jù)價(jià)值的實(shí)踐。
    數(shù)據(jù)價(jià)值是數(shù)據(jù)時(shí)代的重要指標(biāo),它對(duì)于企業(yè)和個(gè)人都有著重要的意義。因此,如何獲取和提高數(shù)據(jù)的價(jià)值,已成為我們進(jìn)入數(shù)據(jù)時(shí)代的重要任務(wù)之一。首先,我們需要了解數(shù)據(jù),并不斷探索數(shù)據(jù)背后所蘊(yùn)含的價(jià)值,從而實(shí)現(xiàn)數(shù)據(jù)資源的優(yōu)化利用;其次,我們需要整合數(shù)據(jù),建立包含全方位視角的數(shù)據(jù)管理體系,并實(shí)現(xiàn)對(duì)數(shù)據(jù)的全面監(jiān)測(cè);最后,我們需要通過開放數(shù)據(jù)共享與創(chuàng)新機(jī)制等手段,不斷推進(jìn)數(shù)據(jù)開放與應(yīng)用,讓數(shù)據(jù)價(jià)值得以最大化。
    第五段:結(jié)語。
    對(duì)于數(shù)據(jù)時(shí)代的思考不止于一篇文章,它不斷地為改變著我們的生產(chǎn)模式,我們的思維模式和我們的價(jià)值觀。只有不斷探索和實(shí)踐數(shù)據(jù)時(shí)代的價(jià)值,我們才能充分地提升我們的競(jìng)爭(zhēng)力,成為這個(gè)數(shù)字化時(shí)代的中流砥柱。讓我們?cè)谶@樣的時(shí)代里,積極擁抱變革、把握機(jī)遇,去發(fā)掘數(shù)據(jù)價(jià)值帶來的更多可能。