靈感範文站

讀書實踐活動總結

一、實踐目的

讀書實踐活動總結

就我個人而言,覺得這本書語言風趣幽默,引人入勝。通過大量的例子和詳實的數據證實來論證一門嚴謹的學科——或者說一個比較複雜的工具。這本書是對統計這個工具加深基本瞭解不可多得的好書。於是我選擇在這個實踐周讀這本書。在這個數據爲王的時代,人們可以不在乎微積分等算法步驟,但卻應該重視統計工具,因爲它在社會學、娛樂、體育、金融幾乎所有涉及人類參與的領域都有着大量應用。

(一)素養提升

全書的重點主要是講述統計工具是什麼,怎麼樣去應用,有哪些常見的使用問題等等。就這樣來看,有點像一本使用說明書,但它其實遠不止一本說明書,首先概括來說它很有趣,其次由內深化講述了統計的思想方法內核是量化,並理解數量及其之間的意義。統計學有着非常多且重要的功能,但究其根本,人類喜歡簡化後的信息,我們總希望從雜亂的各種事情提煉出精簡最簡單的信息,用於指導我們的決策或者形成判斷的依據,這些判斷可能包括:這所學校如何?我們班怎麼樣?我們畢業後從事什麼工作工資待遇最高?或者指導我們的決策:如手頭上有筆錢,我該去買期貨還是去買股票?造地鐵對房價有直接的影響?等等。

1.心智訓練

基於以上的原因,人類就發明了用數字來總結信息,僅憑一組數字,你就可以知道兩個樣本的好壞,兩個選擇的未來的收益的好壞去計算出當前最優的選擇;描述統計學的存在意義就是簡化,但不可避免的會丟失一些內容和細節;就像古人說的那樣,盡信書不如無書;也像查理芒格說的那樣,需要有多元的思維模型,僅靠着數據思考模型,定難乘風破浪。所以我感覺通過閱讀這本書,讓我整個人的心智以及思想都上升了不少。

2.工具運用

統計學可以讓我們從大堆數據中找到可以代表羣體的水平,同時也可以從少量數據中得出不可思議的結論。這個工具叫中心極限定理,其核心要義是一個大型樣本的正確抽樣與其代表的羣體存在相似的關係。通俗的說,任意一個羣體的樣本平均值都會圍繞在該羣體平均值周圍,並且呈正態分佈。 舉個例子,當你已經知道一個羣體的描述性數據,假設某次參賽選手的平均體重是80KG,標準差爲36,每輛大巴載64人;那麼任意一臺載着此次參賽運動員的大巴里的運動員平均體重有99.7%的可能性落在樣本平均數的3個樣本標準差之內,樣本標準差= 36/8=4.5,故任意一臺大巴的運動員平均體重99.7%的可能性80±13.5kg內;當然,如果想縮小平均數的範圍,可以標準差放至1個標準差,準確率爲68%;兩個標準差爲95%的準確率。

二、實踐內容

(一)統數侷限

統計數據的侷限性表現爲統計數據可能產生與初衷相悖的負面激勵。統計指標越簡單對事物的客觀描述扭曲的越多。那就是相關關係並不等於因果關係。兩個變量存在正相關或負相關的關係,這並不代表其中一個變量的改變是由另一個變量的變化引起的。比如,家裏電視機數量多的學生往往比電視機數量少的學生學習成績少,電視機數量和成績成正相關,但顯然不構成因果關係。之所以正相關,原因在於電視機數量多的家庭,經濟實力更雄厚,能夠更好輔導孩子功課。爲能夠承擔的風險購買保險不是一個理智的決定。通過研究分析大量數據可以推測出一個人的消費習慣,預測犯罪活動等,得出一個人的行爲特點,預測其行爲。蒙提霍爾悖論好有意思,與人對概率的本能理解相悖。小概率事件也是有可能發生的,甚至是經常發生,原因是發生的次數太多了,比如中彩票的概率低,但買的人多,所以經常聽見中大獎的消息。有喝菠菜湯習慣的人比沒有這個習慣的人身體更健康。這個結論不能充分證明菠菜湯有利於健康,背後的原因可能是那些有喝菠菜湯的人往往具有健康意識,經常鍛鍊身體,有健康的飲食習慣等,而那些不喝菠菜湯並的沒有這些健康的生活習慣。所以起作用的不是菠菜湯而是有這些意識的人。即相關性不能推導出因果性。到底是喝菠菜湯的功勞,還是因爲這羣愛喝菠菜湯的人恰好具備的其他行爲或個人素質?分清楚“相關關係”和“因果關係”將有助於我們更好地理解統計結論。可以使用中心極限定理判斷兩個羣體是不是同一類羣體。

(二)數據在線

隨着移動互聯網的興起,數據變得在線,我們逐漸走進大數據時代,一個前所未有的時代。在許多地方我們可以看到大數據展現的神奇魔力,也一再擔憂大數據所帶來的隱私問題。然而,有一點卻被大家無意識地忽略或者根本沒有注意到,在各種數據圖流行的當今社會,我們每天都會看到媒體制作的信息圖,很漂亮,也有不少的信息量,但是我們不知道這些數據是怎麼來的,經過了怎麼樣的處理方法,我們得到的只是最後的結果,如此,數據也變成了一種快速消費品。舉個例子,像麥當勞、肯德基等快餐店賣的漢堡,我們只是知道那是漢堡,可以吃,但是原料怎麼來的製作過程是怎麼樣的,大部分人都不知道,知道的人也許就不那麼喜歡漢堡了。現在說數據都習慣帶個大字,數據受到如此重視也是在大數據興起之後,一時之間數據驅動的呼聲甚囂塵上,好像誰都可以在大數據這個行當裏露個臉,一如從前的互聯網浪潮,有個電腦就可以建網站,有個點子就可以拉風投,在數據的時代自然是靠數據說話,誰掌握的數據越多,誰拓展的業務邊界就越寬,誰的壁壘就越鞏固。隨着數據的積攢,深挖數據產生新業務的能力越強、數據支撐業務的力度也就越大,而這一切都成本反而會越低。並且新的業務又會反哺到數據,形成一個正循環,時髦的詞叫數據閉環。在這個環裏的,自然就會成爲我的領地。逆趨勢潮流行事的人,自然會死的很慘。數據的重要性越來越凸顯,終有一日,數據會像以前的計算機那個走進千家萬戶,變得稀鬆平常,但是我覺得,數據會像吃的食物、飯菜那樣滲透我們的生活,變得像空氣一樣變得無處不在,處處、時時影響着我們,只是現在我們還感覺不到。所幸,吃吃漢堡只會影響我們的身體,大不了變得胖胖的,說不定還能像大白那樣萌萌噠,然而數據是信息的載體,它所傳達的是一種知識或者說是思維,如果在生產數據的各個環節出了問題,甚至說有意爲之,那麼日子一長,就不知道我們的思想會變得怎麼樣。不乾淨的數據就感覺好像是街邊小飯店做菜參了地溝油,大不了我們不吃了,回家自己做,自己做的總要安心許多。然而在這個網絡世界,我們卻沒有生產數據的能力,哦不,應該是權力。是的,數據將會是一種權力。我們只能等待巨頭們把數據生產出來,然後吃下去。

(三)“反實現”過程

創造實驗組和對照組的最佳方法就是將研究對象隨機分配到兩個組裏。隨機性的好處就在於,與實驗無關的變量一般會在兩個小組裏實現平均分配,既包括那些顯而易見的特性如性別、種族、年齡和教育,也包括其他難以察覺但可以干擾實驗結果的特性。對於任何一個項目評估來說,其目的都是爲評價治療或介入手段的效果提供某種“反現實”。在隨機控制實驗中,對照組就是“反現實”;但當對照實驗不具有可行性或有違道德時,我們就需要尋求其他方式來模擬“反現實”。對這個世界的探索在很多時候就依賴於尋找“反現實”的聰明才智。

三、實踐體會

全書從描述性統計學講到了相關性、假設檢驗和迴歸分析。內容以身邊簡單例子爲主,很少涉及生澀的統計學公式,風趣幽默通俗易懂,是一本很好的統計學入門讀物。通過這本書你會發現原來統計學也可以這麼簡單有趣,並且認識到了數據的謊言,比如你的工資被平均了,這就是很大的數據謊言。我還更深刻的認識到了選擇性偏見和倖存者偏差等數據偏見,數據讓我們方便,方便到不用去思考我們想要什麼信息就會推送過來。可是,當我們真正習慣了這些算法後,我們是不是隻是他們算法中的一環,換句話說,我們還是我們嗎?還是我們只是流量。這裏值得我們去深思。

標籤:讀書 實踐