(作者:吳榮彬 老師/逢甲大學統計學系)

以下這一段文字會連續出現四週,原因是我必須保證後來的讀者也能清楚知道這四週徵文活動的本意。

我計畫在「數字會不會說話」系列文章的前四篇各出一道與數字有關的小問題,徵集逢甲大學讀者的答題回覆,並且在活動結束後致送勝選文章一篇一份神祕禮物。嚴格說起來一開始這四篇不能被歸類為文章,它們只是一個引子,引領有興趣、有創意的讀者進入數據分析的殿堂。請有意願參與競賽的讀者在2012年3月15日到2012年4月30日活動期間回覆我的每週一問。比賽詳情,請前進http://www.library.fcu.edu.tw/libnews/?p=2781

第二週的題目說明如下:

【溫加寶】今年在股市賺進100萬新台幣這樣的事實,會不會改變你在股市賺進100萬新台幣的機會?[提示] 統計獨立性

這一週我決定除了題目再加上一段小提示。讓有意競逐神祕獎品的讀者能聚焦在某個統計的議題。

上一週的數字是100%,這一週的數字是100萬。並不是因為喜歡100這個數字,而是它影響我們太深、太深了。考試要考100分、人生的第一桶金就是要存個100萬。

這一週的提示 — 統計獨立性 — 是一項重要的假設。獨立性談的是變數與變數之間的一種關係,也會是樣本與樣本之間的關係。這裡我們想先談變數與變數之間的獨立性。不論那一項專業領域都充斥著各種變數,統計分析首重隨機變數,它是一種會跟著機率起舞的變數。意味著,不保證看到變數的那一個數字,想要看到股市衝過8000點,得問問機率大神!機率到底是什麼?體會一下這句話:下一秒的你比現在的你老一秒,這是肯定的,表示看到比現在老一秒的你的機率等於1.0。除非!機率現象俯拾即是,但我們卻只會看到數字。數字暗藏著機率,數據分析師用盡心機就是為了把數字背後的機率挖出來。如果兩變數是統計獨立的,那麼它們彼此帶著關於機率的資訊是不重疊的。意思就是說,如果【溫加寶今年在股市賺進新台幣】這個變數,跟【你今年在股市賺進新台幣】這個變數是統計獨立的,那麼兩變數所帶關於賺進100萬新台幣的資訊不會重複。上述這一句話對不對,請讀者諸君仔細評論。你注意到全球化出現在哪裡了嗎?下週再見。

※有意挑戰本週答題者,請於下方「Discussion Area」發表您的意見!
錯過第一週者請連結:報到率
也歡迎前進看看:瞎說窮人的風險