靈感範文站

位置:首頁 > 心得體會 > 讀後感

《大數據》讀後感(精選多篇)

讀後感1.31W

目錄

《大數據》讀後感(精選多篇)
第一篇:大數據 讀後感第二篇:《大數據》讀後感第三篇:《大數據》讀後感第四篇:《大數據》讀後感第五篇:大數據讀後感更多相關範文

正文

第一篇:大數據 讀後感

從徐子沛的《大數據》中得到的感悟

數據,對於我們現代社社會來說,已經是再熟悉不過了。大量化(volume)、多樣化(variety)、快速化(velocity)和大價值(value)。這四個v就是大數據的基本特徵。每天我們都不得不和數據打交道,比如我們平常所說得“眼觀六路,耳聽八方,”就是生活中一個很好的的收集數據的例子。還有,在我們平時的學習中,我們對於一些學習上的數據的整理等等。可以說,數據已經成爲了我們的影子一樣,無時無刻的在我們的身邊活動。

拿到《大數據》這本書時,吸引我的不是書評的內容,而是書的封面上的一句話“除了上帝,任何人都可以用數據說話。”也就是說,上帝可以不用數據來說話,但是,作爲一個平常人,我們做事,言論等都必須用數據來說話。用數據論來證我們的觀點正確性。

那麼數據真的就是那麼重要嗎?其實不然,數據果真有那麼的重要。作者在書中大量應用世界頭號強國美國的例子來說明美國是如何利用數據以及數據在美國人的利用下,是如何造福美國人的。使得美國人走上了民主、發展的道路。書中還引用了大量的利用數據的案例,以及利用數據會有什麼樣的後果。當然,作者在書中也很明確的表達了自己觀點,也就是數據要被人利用,利用的好了,造福人類,否則,禍害無窮。

毫無疑問,我們正處在一個真正意義的大數據時代。但是,大數據浪潮的來龍去脈如何?數據技術變革何以能推動政府信息的公開、透明和社會公正?又何以給我們帶來無限的商機,既便利又危及我們

每個人的生活?《大數據》給了我們一個很好的答案。在拿到徐子沛《大數據》時,與其說這是個新概念,還不如說就是一個現實。信息技術的迅速發展和普遍應用,存儲能力的膨脹,網絡傳輸的便捷,必然產生巨大的數據量。即使是一個公司,經過多年的積累,產生的數據也是驚人的。每天繁多的數據,這就是要求企業要很好地存儲數據,利用數據通過數據,使得數據說話,提升企業的業績和知名度。對於一個企業來說,比較實際的倒是關注一下企業微觀大數據,如何充分利用現有的、能夠得到的和自己創造的數據,採用《大數據》裏提及的新技術、新方法、新理念,篩選、組織、關聯、分析,精細化管理和挖掘數據,探索規律性的東西,指導企業活動。 儘可能多的獲取數據,首先是要有心,對於公司員工來說,隨時隨地注意收集客戶數據、需求數據、產品數據、市場數據、資源數據等,經過整理,把它變成公司的數據資產;然後是要有據,信息與數據最大的不同,就是數據是能夠度量或者確定的信息,不能“毛估估”,收集數據要精細化,要準確;其次要有序,數據需要存儲,更加需要整理,單個數據沒有很大意義,靜止的數據也沒有很大意義,有價值的數據是流動的、與其他數據交互作用的。一個大雜燴的數據庫,在需要時讓人找不到北,沒有任何意義。再次,需要技術支持,大量的數據如何檢索,如何關聯,單靠人腦是不行的,需要建立基於特定理論的數據處理系統來分析管理。對於一個企業,最理想的是建立一個類似人類神經系統的數據管理系統,採用各種信息終端採集內部和外部信息,通過分析、歸納、篩選,形成管理數據,某些數據可以成爲系統的“本

能”,一旦觸發能夠自動做出反應;某些數據可以成爲組合信息提交大腦綜合分析,作出決策和反應。 數據應該爲人服務,這是一條基本原則。在大數據時代始終發揮人的主觀能動性,採用先進的理念和技術駕馭數據,讓人們生活更方便,工作效率更高,勞動強度降低,爲社會創造更多的物質財富和精神財富。

《大數據》是一本視野獨特的書。它以數據爲軸線,描繪了美國走過的改革創新的過程,行文如流水,引人入勝。書中,我讀到的不是大數據處理技術,更多的是與大數據相關的美國政治、經濟、社會和文化的演進,從民主和國家戰略的層面細解大數據的影響力。美國是全書的主體,但又處處反觀中國當下的現實。內容非常值得我們身處改革開放前沿的政府工作者深思。它讓我們更加深刻地理解了汪洋書記提出的“堅持用數據說話、用數據改進管理、用數據推動創新”的深刻內涵和殷切期望。我們只有重視數據,加強對數據的收集、分析和使用,才能更好地應對正在到來的數據革命的挑戰。那麼,作爲與數據打交道、用數據說話的前線統計工作者,如何應對大數據時代的種種挑戰?

對比《大數據》,結合平時工作和學習的實際情況,我認爲最少應該認真思考和解決好三個問題:

一、提供什麼樣的數據?

在中國,統計部門提供的數據,是各級政府部門和廣大人民羣衆瞭解國家社會經濟發展和人民生活狀況主要渠道。只有真實可靠統計數據,才能使政府決策有的放矢,人民瞭解國家經濟與人民生活的

真實狀況。如果統計數據虛假不實,就會誤導政府和人民,讓政府失信於人民。因此,我們一定把握好數據的生命線—質量關,確保給國家和人民提供準確、真實、可靠、無誤的數據。

二、如何高效有序地收集數據?

面對信息大爆炸時代海量數據,必須充分利用高科技手段,高效有序地收集整理各種數據,以滿足政府和人民羣衆越來越廣泛的信息需求。爲此,我們需要建立完善數據收集網絡,包括部門內部的縱向數據收集網絡和部門之間的橫向數據收集網絡,通過這種縱橫結合的網絡數據收集系統,針對特定主題,持續不斷地收集相關數據,爲大數據發展提供基礎。需要運用互聯網、電子計算機等現代技術手段,加快數據收集、加工數據的速度,確保政府和人民及時得到所需數據。

三、如何加強數據分析利用能力?

收集數據的目的是爲分析利用數據。通過數據分析挖掘數據背後隱含的經濟規律及有利於提高效率、改進工作的因素,提高政府管理、決策和人民生活水平,實現“用數據改進管理”。因此,作爲統計人,不僅要做好數據收集的及時有效和真實正確,更重要的是要善於分析利用數據,寫好專業分析報告,發現問題、支撐決策、評估績效的目的。

此外我們還可以看到不少政府機構或者其他一些組織也在開始大數據解決他們遇到的一些問題。在本書的最後一章,作者告訴了我們大數據可能帶來的壞處。如:通過大數據可能我們的個人各種信息、隱私會很容易地被大數據的擁有者找到,這些信息,可能被政府用來

監管我們等;通過大數據可以預測可能發生的事,或者預測我們人個人本書即將做的行爲,書中有個例子:警察通過大數據分析得出一個人即將可能犯罪,並把它逮捕了,但事實上這個人現在並沒有犯罪。也許這就限制、約束了我們個人的自由。

看完這本書,顛覆了自己之前的一些想法: 以前我們認爲錯誤的數據是沒有用,我們需要保證統計的數據的準確性,但是在大數據中,錯誤的數據也是有用的,它和其他所有相對正確的數據一起構成了整體,也就算不了什麼了。我們同樣可以從這些數據中得出比較正確的預測和分析。 google利用人們搜索的關鍵字來預測和判斷某個地區是否發生流感,google通過分析這個地區的人們搜索和流感有關的詞的數量等來分析得出。 google 從互聯網抓取數以億記的各種語言、各種翻譯水平的翻譯結果,使用其翻譯出來的準確率比那些微軟使用正確的詞庫翻譯出來的句子準備率更高。我自己的感想是,其實大數據無處不在,只要我們細心,我們就可以挖掘出身邊的那些大數據,並做一些有意義的是,就像書中說的那樣,我們不需要強求每條數據都那麼真實準確,但是從大量的數據中我們就可以得出相對準備的結果。未來成功的公司必定是是那些擁有大量數據、並使用那些數據爲大衆提供服務的公司。

公佈官員財產美國是怎麼做的,美國能讓少部人腐敗起來嗎,美國式上訪是怎麼回事,憑什麼美國礦難那麼少,全民醫改美國做得到嗎,美國總統大選有什麼利器才能贏,下一輪全球洗牌我們世界工廠會被淘汰嗎?? 除了上帝,任何人都必須用數據來說話。也就是是

說,美國更好的利用了數據,那麼,我們何嘗不去利用大數據時代的數據呢?

第二篇:《大數據》讀後感

《大數據》讀後感

佘潔婕

讀完《大數據》,我才意識到這並不是一本枯燥無味的書籍。作者運用案例和講故事的方式,把美國數據開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。

我在想,大數據概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。 在教學過程中,學生的行爲表現都可以被數據化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我纔會想到,所謂教育技術與其研究教育的數字化,不如研究教育的數據化來得實在,來的有意義。長期以來,我們並不瞭解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行爲對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大數據概念至少提出了關注“是什麼”比“爲什麼”要有實際意義得多。而我們的教育恰好需要把注意力從“爲什麼”轉移到“是什麼”上面來,只有如此,才能把教育從爲什麼發展成“可能成爲什麼”上來,這會是一次思想上的革命。而對於現在地位岌岌可危的教育技術來說,把研究的重點從數字化轉移到數據化上面,這纔是它的出路。

如何將數據融入教學,教育者首先通過標準化全科教學處方,實現了教師授課模板和教學內容的標準化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的數據,處理好數據,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果爲導向的教學體系。

與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去的教育教學顯然是不同的,面對大數據時代的到來,教學有所改變是必然的。所以,無論環境怎麼變換,數據如何複雜,我們都不能不去改變自己的教學去迎合將來的這個大數據時代。

二等獎

第三篇:《大數據》讀後感

《大數據》讀後感

現代社會是一個技術奔騰、信息爆炸的社會,大數據這個新概念一出現就受到了人們極大的熱捧。每天都身處網絡的信息海洋中,常常會有被數據、信息“淹沒”的窒息感和無力感。塗子沛的《大數據》一書,通過講述美國半個多世紀信息開放、技術創新的歷史,以別開生面的經典案例——奧巴馬建設“前所未有的開放政府”的雄心、公共財政透明的曲折、背後的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智能的前世今生、數據開放運動的全球興起,以及雲計算、facebook和推特等社交媒體、web3.0與下一代互聯網的未來圖景等等,詳細詮釋了數據技術變革與權力合法性、執政正義以及公民社會之間的關係。全面闡述了信息時代數據的重要性,如何加強數據的收集、分析和使用以及通過數據開放改進政府治理等問題。這本書給了我一個全新的閱讀主題,讓我感受到了作爲一名教師必須擁有但卻正是我們目前缺乏的兩種態度。

目前,人類已進入信息社會。人類文明已處於信息時代,人們在因特網上傳和下載數據,傳統的臺式電腦上網更新成了移動終端瀏覽和傳播信息。qq、微信等通訊軟件已然實現手機版,人人、微博、臉譜能夠分享即刻心情,電訊服務商正大張旗鼓地爭奪客戶資源,網絡通訊商也大力渲染雲服務和大數據時代。不管你願不願意,我們已經處在大數據時代。如何在新的時代爭取話語權,如何在新的時代維護自身權益,如何在新的時代實現利益最大化,必將成爲這個時代中每個國家,甚至每個公民應當思考並付諸實踐的重大問題。

一、從美國的發展看美國發展的不足。美國,世界最大的發達國家,藉助其自身的優勢,已然處於信息時代的領頭羊位置。到底是什麼原因使得這個建國才兩百多年的年輕國傢俱備如此強大的實力和創新的活力呢?他們具備什麼優勢?他們成功的祕訣是什麼?結合書中分析和歷史實踐不難得出:適合自身的體制制度、法律、科技、人才、監督是這個年輕國家領跑世界的關鍵因素。

首先、美國結合本國實際選擇“三權分立”的體制制度。政府執法、法院司法、國會立法。政府首腦總統可以提名法官,法院可以宣佈總統行爲違憲;總統能夠否決國會的立法,國會批准總統提名,並可以彈劾、罷免總統;法院可以宣佈國會某項法律違憲,國會也有權限彈劾、罷免法官。這種源於法國思想家孟德斯鳩的“三權分立”民主制度適用美國,並契合美國文化社會生態,爲美國的發展提供了社會基礎。然而,“沒有任何一項民主制度是完美的或者萬能的,甚至在別的國家成爲一種糟糕的制度。(原英國首相丘吉爾)”因此,別的國家必須結合自身國情、民情進行參考,選擇符合自身條件和社會發展需要的制度,而決不能照抄。這樣,才能滿足自身人民需求,推動社會發展。這個觀點的論述將在後文講述“我國國情”中提到。

其次、法律保障。《數據質量法》和《信息自由法》的頒佈爲美國成爲大數據帝國提供了基礎的法律保證,也喚醒了美國民衆對自身數據權益保護的意識。

第三、美國具備發達的科技支持和廣泛的人才支撐。早在上世紀四十年代,第一臺電子計算機誕生在美國,二戰後大量工程師移民美國等諸多因素爲美國的高速發展夯實了人才基礎。

第四、美國擁有完善的、職責分明的社會監督體系。民衆、社團、新聞媒體時刻注視着政府的一舉一動,陽光般的注視成爲防治腐敗最好的消毒劑。

世事無絕對。美國雖然藉助民主制度、法律保證等優勢條件成爲信息時代的領頭羊,也正是這些“優勢”成爲了阻礙其發展的“劣勢”。突出表現在:(一)“三權分立”的民主權衡看似給美國社會帶來了民主、公平、自由的管理體制,實質存在不足,甚至是缺陷。舉個簡單例子,當政府執法時遇到法律障礙,總統就會遞交良法於國會討論,力爭通過。而國會集結的是各黨派、各團體、各企業,甚至是各說客的利益集團,各部分之間產生的利益糾紛必然成爲良法通過的掣肘。就算是投票表決法案通過,在呈交總統簽署的法案裏也會放入短時間內難以解決的問題,即“摻沙子”。“沙子法案”必將成爲社會發展過程中的阻礙;同時,“旋轉門”前後串場的說客們背後強大的利益集團在國會山上說話的語氣也是制約民主的制度硬傷。(二)美國嚴謹卻冗雜的司法程序造成了民衆不滿。2014年上大支礦難便是這一硬傷的突出表現。

二、中國的快速發展與發展中的不足。中國,世界最大的發展中國家,擁有世界最多的人口,最智慧的人民,最悠久的歷史。中國的文化吸引着世界的目光。上世紀七十年代末,中國進行的“改革開放”使中國人民和政府深受裨益。經過三十五年的大膽創新,科學發展,中國已超越日本,成爲世界第二大經濟體,中國政府在世界的發言權已得到足夠的重視,中國人民的聰明才幹也得到充分挖掘,中華民族已鬥志昂揚地屹立在世界民族之林。

但是,我們不能不承認在大數據時代,中國暫時處於靠後的位置,並且行動相對遲緩。主要表現在:(一)不少地方政府爲表政績,存在“邀功尋賞”、謊報數據行爲,導致數據大範圍失真。《焦點訪談》曾經報道過多地基層政府的類似行爲。例如,國家退耕還林政策涉及資金補貼,某地村幹部連續三年虛報數據,最終竟導致所報耕地面積大於該村行政村面積。(二)存在大量應當公開、公佈的數據實際並未及時公之於衆。就拿近年來炒的沸沸揚揚的曬“三公經費”問題來說,目前僅是一線或二、三線城市纔敢於公開,而落實到地、市、縣級卻姍姍來遲。(三)精確的數據測量與統計工作起步晚,差距大。數據收集方法多以基層上報、被動接受爲主,容易“摻水”。

三、結合自身工作和生活實際,發現存在的問題。作爲一名從事經濟研究工作者,身處於我國經濟工作的一線,在進行調查研究的過程中發現了一些機制中或許存在的漏洞或缺陷,正巧反映出我國在大數據時代中所處的不利地位。舉例一:如果m先生想在a地購置房產(普通住房),若是首次購房,那麼根據稅法規定,該項經濟活動買方將涉及契稅優惠,但是必須要求m先生提供房產局出示的家庭唯一住房證明。漏洞便出現了:假設m先生已經在b地事先擁有一套房產,而m先生身份證件登記在a地,那麼m先生便有了在a地成功領取家庭唯一住房證明的可能(前提是a、b兩地房產部門信息無法共享)。

這樣,“聰明”的m先生在已擁有一套房產的前提下,再次在異地購房仍可享受契稅優惠。這將直接導致稅款的流失和稅賦的不公平,不利於我國稅收徵管工作,不利於“兩度”的提升。堵住這一漏洞的前提條件只有一個房產部門全國信息聯網。然而,現實並非如此。舉例二:我國正大力興起的“全民醫保”在大數據時代同樣不盡如人意。醫保卡無法在全國通用,甚至無法在本省內、本市(州)內通用,仍然存在指定醫院刷卡。這直接給一些出差在外的居民,亦或是離指定刷卡醫院較遠的居民帶來不便。

四、中國面臨發展的機遇與挑戰。問題與機遇並存。中國在大數據時代中正面臨着巨大的挑戰和重大的機遇。問題的存在和挑戰的並行必然構成我們在這個時代迎頭追趕的機遇:

第一、體制條件。我國是社會主義國家,我國採取的是民族集中制。也就是說,在絕大多數公民認可的良法在立法過程中不會出現像美國那樣的利益集團間的博弈,或是“摻沙子”。亦即,被廣泛民衆認可的良法在我國立法過程中受到的阻礙相對較小。

第二、政策機遇。黨的十八大報告明確把“信息化水平大幅提升”納入全面建設小康社會的目標之一,並提出了走中國特色新型工業化、信息化、城鎮化、農業現代化道路。明確要堅持信息化和工業化深度融合,工業化和城鎮化良性互動、城鎮化和農業現代化相互協調,促進工業化、信息化、城鎮化、農業現代化同步發展。從此,信息化本身(包括大數據發展)不再只是一種手段,而將成爲發展的目標和途徑;同時提出建設下一代信息基礎設施,發展現代信息技術產業體系,健全信息安全保障體系,推出信息網絡技術廣泛運用作爲“推進經濟結構戰略性調整”方案。信息化建設和大數據時代已納入國家重點戰略層面,中國信息化建設正處於巨大的歷史機遇期和轉折點。

第三、客觀因素。我國是互聯網大國、手機大國,我國是世界上網民人數最多的國家,巨大的數據產生、消費、使用給我國大數據信息技術的發展提供了堅實的客觀條件,我們千萬不可停滯不前,相反,要主動出擊,迎頭趕上。

第四、技術優勢。相對於美國,我國擁有充分的客觀技術優勢----身份證。美國因其文化或歷史原因,公民使用的身份標識不統一,這爲美國政府進行管理和施行政策提出難題。中國卻有着便利的解決方法,因爲每位合法中國公民都擁有唯一的身份標識,有了這一技術優勢作保障,我國大數據推行擁有巨大便捷。

這就從一定意義上說明了大數據時代已經來臨,收集數據,使用數據,開放數據,都是我們需要一一面對的挑戰,我們該如何從容應對?我想,唯有積極參與其中,才能緊跟時代腳步,成爲社會發展的受益者。綜上所述,我認爲美國是一個值得我們認真學習的國家。“中國崛起”要求我們有正確的學習態度和敏銳的學習能力。不要有橋不走,硬要下河摸石頭。要學習、要上路是我們的當務之急。我們應該以全世界的文明爲基礎,客觀洞悉西方世界,理性思考自身問題,刻苦落實解決方案,才能實幹興邦,才能實現中華兒女心中偉大的民族復興之夢!誠然,人心、真情、給予、奉獻……等等,這些也許很難用數據來衡量,但面對社會未來之世界走向,中國如何應對大數據時代的挑戰,我們自己又該從自身、從自己的崗位做哪些改變、哪些突破,這是我們需要,也可以認真思考的問題(注:本文系中國綠色經濟博客博主和中國綠色經濟圈圈主陳玉榮博士撰寫,特此說明)。

第四篇:《大數據》讀後感

《大數據》讀後感

荊家鎮中心學校荊超

在數字信息時代,數據和空氣一樣遍佈生活,對於有些人來說,數據無意義,而對於有些人來說,數據,即真相。讀完《大數據》,我才意識到這並不是一本枯燥無味的書籍。透過全書,一個立體的美國及美國人民的思想呈現在我們面前——美國人民執著於個人隱私的保護,卻又不遺餘力地推動着政府信息的透明與公開。作者運用案例和講故事的方式,把美國數據開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。我在想,大數據概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。

在教學過程中,學生的行爲表現都可以被數據化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我纔會想到,所謂教育技術與其研究教育的數字化,不如研究教育的數據化來得實在,來的有意義。長期以來,我們並不瞭解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行爲對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大數據概念至少提出了關注“是什麼”比“爲什麼”要有實際意義得多。而我們的教育恰好需要把注意力從“爲什麼”轉移到“是什麼”上面來,只有如此,才能把教育從爲什麼發展成“可能成爲什麼”上來,這會是一次思想上的革命。

如何將數據融入教學,教育者首先通過標準化全科教學處方,實現了教師授課模板和教學內容的標準化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的數據,處理好數據,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果爲導向的教學體系。

與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去(推薦訪問範文網:)的教育教學顯然是不同的,面對大數據時代的到來,教學有所改變是必然的。所以,無論環境怎麼變換,數據如何複雜,我們都不能不去改變自己的教學去迎合將來的這個大數據時代。

第五篇:大數據讀後感

假設你要測量一個葡萄園的溫度,但是整個葡萄園只有一個溫度測量儀,那你就必須確保 這個測量儀是精確的而且能夠一直工作。反過來,如果每100棵葡萄樹就有一個測量儀,有些測試的數據可能會是錯誤的,可能會更加混亂,但衆多的讀數合起來就可以提供一個更加準確的結果。因爲這裏麪包含了更多的數據,而它不僅能抵消掉錯誤數據造成的影響,還能提供更多的額外價值。

現在想想增加讀數頻率的這個事情。如果每隔一分鐘就測量一下溫度,我們至少還能夠保 證測量結果是按照時間有序排列的。如果變成每分鐘測量十次甚至百次的話,不僅讀數可能出錯,連時間先後都可能搞混掉。試想,如果信息在網絡中流動,那麼一條記錄很可能在傳輸過程中被延遲,在其到達的時候已經沒有意義了,甚至乾脆在奔涌的信息洪流中徹底迷失。雖然我們得到的信息不再那麼準確,但收集到的數量龐大的信息讓我們放棄嚴格精確的選擇變得更爲划算。在第一個例子裏,我們爲了獲得更廣泛的數據而犧牲了精確性,也因此看到了很多如若不然無法被關注到的細節。在第二個例子裏,我們爲了高頻率而放棄了精確性,結果觀察到了一些本可能被錯過的變化。雖然如果我們能夠下足夠多的工夫,這些錯誤是可以避免的,但在很多情況下,與致力於避免錯誤相比,對錯誤的包容會帶給我們更多好處。(小微金融創新,也可借鑑此思想,然後做好對數據收集與存儲的支撐成爲首要完成的事務,然後是對數據的正確運用是重點)

我們可以在大量數據對計算機其他領域進步的重要性上看到類似的變化。我們都知道,如 摩爾定律所預測的,過去一段時間裏計算機的數據處理能力得到了很大的提高。摩爾定律認 爲,每塊芯片上晶體管的數量每兩年就會翻一倍。這使得電腦運行更快速了,存儲空間更大 了。大家沒有意識到的是,驅動各類系統的算法也進步了——美國總統科技顧問委員會的報告顯示,在很多領域這些算法帶來的進步還要勝過芯片的進步。然而,社會從“大數據”中所能得到的,並非來自運行更快的芯片或更好的算法,而是更多的數據。(數據本身的價值,及數據的價值的體現)

容忍錯誤帶來的是更多數據吞吐(大數據),容忍風險帶來的大量業務的涌現(小微金融) 大量業務的涌現帶來的收益需要大於其風險帶來的損失,最好辦法就是從他處大量收集這些數據,並容忍這些數據存在錯誤,再基於大數據分析(同業數據收集,依託互聯網中搜索等進行收集,阿里可以根據淘寶進行收集)

一致性多樣性

hadoop的輸出結果沒有關係型數據庫輸出結果那麼精確,它不能用於衛星發射、開具銀行 賬戶明細這種精確度要求很高的任務。但是對於不要求極端精確的任務,它就比其他系統運行得快很多,比如說把顧客分羣,然後分別進行不同的營銷活動。 信用卡公司visa使用hadoop,能夠將處理兩年內730億單交易所需的時間,從一個月縮減 至僅僅13分鐘。這樣大規模處理時間上的縮減足以變革商業了。也許hadoop不適合正規記賬,但是當可以允許少量錯誤的時候它就非常實用。

zestfinance,一個由谷歌前任首席信息官道格拉斯·梅里爾創立的公司,用自己的經驗再次 驗證了“寬容錯誤會給我們帶來更多價值”這一觀點。這家公司幫助決策者判斷是否應該向某些擁有不良信用記錄的人提供小額短期貸款。傳統的信用評分機制關注少量突出的事件,比如一次還款的延遲,而zestfinance則分析了大量不那麼突出的事件。2014年,讓zestfinance引以爲豪的就是,它的貸款拖欠率比行業平均水平要低三分之一左右。唯一的

得勝之道還是擁抱混雜。

梅里爾說:“有趣的是,對我們而言,基本沒有任何一個人的信息是齊備的,事實上,總有 大量的數據缺失。”由zestfinance創建的用來記錄客戶信息的矩陣是難以想象得稀疏,裏面充滿了數據的空洞,但zestfinance在這些支離破碎的數據中如魚得水。舉個例子,有10%的客戶屬性信息顯示“已經死亡”,但是依然可以從他們身上收回貸款。梅里爾一臉壞笑地說:“顯然,沒有人會企盼殭屍復活並且主動還貸。但是我們的數據顯示,放貸給殭屍是一項不錯的生意。”

所以有時候,通過代理取得數據信息比自己去操作煩瑣的程序要便宜得多。同時還有另一 個徵信機構出售“支付能力指數”和“可支配支出指數”,這些指數是用來預測一個人的支付能力的。

數據化

必須收集所有信息(包括被否掉的信息和被忽略的信息),所有跟行業接觸的客戶的信息,甚至沒有需求的客戶信息。所以可以分四步來走,第一步所有達成交易客戶的全面信息(*只要能收集到能接觸到的),第二步收集所有跟公司有接觸的客戶的全面信息,第三步收集跟整個行業有接觸的客戶的全面信息,第四步所有跟客戶相關的人或法人的全面信息,第五步所有人的全面信息。

一切給馮·安這位家裏經營糖果廠的危地馬拉人帶來了相當高的知名度,使他能夠在取得 博士學位後進入卡內基梅隆大學工作,教授計算機科學;也使他在27歲時獲得了50萬美元的麥克阿瑟基金會“天才獎”。但是,當他意識到每天有這麼多人要浪費10秒鐘的時間輸入這堆惱人的字母,而隨後大量的信息被隨意地丟棄時,他並沒有感到自己很聰明。

於是,他開始尋找能使人的計算能力得到更有效利用的方法。他想到了一個繼任者,恰如 其分地將其命名爲recaptcha。和原有隨機字母輸入不同,人們需要從計算機光學字符識別程序無法識別的文本掃描項目中讀出兩個單詞並輸入。其中一個單詞其他用戶也識別過,從而可以從該用戶的輸入中判斷註冊者是人;另一個單詞則是有待辨識和解疑的新詞。爲了保證準確度,系統會將同一個模糊單詞發給五個不同的人,直到他們都輸入正確後才確定這個單詞是對的。在這裏,數據的主要用途是證明用戶是人,但它也有第二個目的:破譯數字化文本中不清楚的單詞。recaptcha的作用得到了認可,2014年穀歌收購了馮·安的公司,並將這一技術用於圖書掃描項目。

我們所處的時代之所以與衆不同,是因爲數據的收集不再存在固有的侷限性。技術已經發 展到一定程度,大量信息可以被廉價地捕捉和記錄。數據經常會得到被動地收集,人們無須投入太多精力甚至不需要認識這些數據。而且,由於存儲成本的大幅下降,保存數據比丟棄數據更加容易。這使得以較低成本獲得更多數據的可能性比以往任何時候都大。

大數據創新可以有兩個方向:

1、更適合於已有大量數據在手的進一步數據價值挖掘。

2、或打造向大數據收集方向靠攏的模式,建立一種好的收集機制。

數據創新1:數據的再利用

數據創新2:重組數據

數據創新3:可擴展數據 :可擴展數據

數據創新4:數據的折舊值

數據創新5:數據廢氣

數據創新6:開放數據

這兩家公司的不同做法很能說明問題。微軟只看到了拼寫檢查作爲文字處理這一個目的的 價值,而谷歌卻理解了其更深層次的價值。不僅利用錯別字開發了世界上最好、最新式的拼寫檢查器來提高搜索質量,而且將其應用於許多其他服務中,如搜索的“自動完成”功能、gmail、谷歌文檔甚至翻譯系統。

容錯,包容能帶來新的價值

一位谷歌的員工說:“我們喜歡從大的‘噪音’數據集中吸取教訓。”

很多企業都開始設計他們的系統,以這種方式收集和使用信息。在facebook的早期,數據 科學家們研究了數據廢氣的豐富信息,發現人們會採取某種行動(如回帖、點擊圖標等)的最重要的預測指標就是他們看到了周圍的朋友也在這麼做。緊接着,facebook重新設計了它的系統,使每個用戶的活動變得可見並廣播出去,這爲網站的良性循環做出了新的貢獻。逐漸地,這個想法從互聯網行業傳播至可以收集用戶反饋的任何公司。

數據本身、技能與思維

數據來源,信用卡 匿名信息

手/網遊公司。。。

大數據只是科技發展的一個階段,人類卓越的才華纔是人類最大的優勢(相比較於機器),是我們行進道路上可能用到或可以說必定會用到工具,工具就需要擅用的才華與技巧。 如果存在超越或近似於人類才華的能力,那它就具備人類同樣的智慧。

默認推薦其他範文:

常來福《大數據》讀後感9.03

大數據時代讀後感

《大數據時代》讀後感

大數據時代讀後感

大數據時代讀後感