概率與數理統計沖刺復習
查看(905) 回復(0) |
|
smallbs
|
發表于 2010-09-23 21:47
樓主
曹顯兵:概率和數理統計數一要考30分,比高等數學的考試結果要差一些,沒有那么理想,比線性代數也要差一些,給考生的印象是這個似乎是最難的,其實不是這樣的。這門課程考試結果,雖然是最差的,最不理想的,但是并不等于這個最難,分數低主要有幾個原因:這個課程在大學里高年級開的,是同學們最后學的課程,大家沒有那么重視,而且課時比較少,有的學校也沒有把這門課程作為必修課,而是選修課,作為必修課的學校可能在統計方面也沒有怎么講,所以大家這門課普遍考得不太理想。
我想重點是,如何去計算概率的問題,概率統計的一個核心問題是求概率?荚囶}可能從哪幾個方面來考大家呢?第一可以利用隨機事件的關系和運算律,還有概率的性質來求某些事件發生的概率。第二方面重點的是可以利用一些重要的概型,比如說古典概型,幾何概型等來求概率,還有一些重要的公式,比如說貝斯公式、條件概率公式來求概率。第三方面,它的可以重點考0-1分布來求概率,同學們要注意了,0-1分布求概率可以從這幾個方面來出題,一個是0-1分布律,就是離散性數學說的分布律,再一個是0-1密度函數求概率,一個隨機變量的函數和兩個隨機變量的函數都包括在這里,無論怎么考你都能夠從容的對付他,0-1分布求概率絕對是考試的重點。 另外一個方面還可以從哪方面考察呢?就是0-1數字特征,這個是沒有考過的。這個包括了數字期望,方差和協方差和相關系數,這些都是由概率求出來的,當然我們可以利用數字特征反過來求概率,這是考察我們反向思維能力,尤其是離散的分布律和聯合分布律是可以反過來求概率的,求概率的問題主要是從這四個方面來出題。 我們從老師出題的角度來準備是非常充分的。 第二考試的重點大家要關注的是求分布。第一個問題是求概率,第二個問題是求分布?梢詮哪男┓矫鎭砜寄兀康谝皇欠植己瘮档挠嬎悖@個可以有這么些變化,一個是把分布律,或者把密度直接告訴考生,讓大家把分布函數求出來,這是比較容易的,比較難的話,就可以給你一個隨機實驗,你從隨機實驗中要提煉出分布函數,當然大家要記住,分布函數本質是求概率,又回到第一個問題了。什么是分布函數?是隨機變量小于等于自變量的概率。所以這個地方又可以歸結為求概率,求概率又會有很多的方法,這個地方也可以考我們這個問題。這個是大家要重點關注的題型,要在考試前鞏固一下,這個絕對是考試的重點。 去年我們的考試情況是這樣的,數學一分布函數考了8分的大題,數學三兩個大題都是考分布函數。 第二個問題是求分布函數的第二個重點是,二維離散型隨機變量聯合的計算,04年就考了大題。對于這種離散型分布函數的分布律來說,它給出已知的隨機變量,反過來造出兩個新的隨機變量,要你研究出這兩個新的變量的分布律或者是其他的數字特征,包括協方差等,把問題展開。求分布的還有一個特點是連續型的隨機變量,是求邊緣密度和條件密度,以及二維隨機變量的取值概率。像邊緣分布的的分布密度是考試的重點,求一個和兩個函數的密度也是考試的重點。大家要從這幾個方面鞏固一下,這個是絕對會考的。 再說一個重點的話,就是求數值特征的問題,就是方差、協方差和相關系數,表面上有這么多不同的特征,大家要把握函數的數學期望,你只要掌握了函數的數學期望,你的數字特征的問題就解決了。這是概率的問題,三個重點的問題。一個是求概率的問題,二是求分布的問題,三是求數字特征的問題。數字特征歸根到底是求函數的數學期望,一個隨機函數的期望和兩個隨機函數的期望。 統計部分的話,數四是不考的,只有數一和數三要考,數一03年前大約是7分左右的題,最少是6分,最多是8分。數三100分制的時候,最少是9分,從去年和今年來看,數一是9分的題,數三比較特殊,03年這一部分沒有出題,04年考了17分,一般情況下這個是要出一個題的,所以大家不要放棄統計的部分。我們看看會考什么東西呢? 第一個是求統計量的數字特征,或者是求統計量的分布,這個題型你做過沒有,一般的方法是否掌握了?第二個是求矩估計和極大似然估計,第三是對估計量的好壞進行評價,第一是無偏檢,有效性和一致性,這里面最重要的是無偏性,這個涉及到數學期望的計算,其次是有效性,一致性不是重點,但是什么是一致性你要知道。 05年的考統計的地方,最有可能考什么不好說,但是我可以作一下預測。04年最有可能考試的是矩估計和極大似然估計,不小心說對了,05年最有可能考的是求統計量的數字特征,這是重點要關注的。我認為這個考的可能性最大。其次關注是矩估計,極大似然估計求出來之后估計量的評價,這個也是重點考的,最大的分數放在估計量的標準上。05年假設檢驗這個地方會出一個小題,這個不是考試的重點,已經連續6年沒有在這一地方出題了,但是既然大綱里寫了,今年很可能考。 關于你比如說U檢驗,T檢驗還有卡方檢驗,這三個的檢驗統計是什么,分布是什么,你了解一下,說不定一秒鐘會得四分,這個不是重點,但是6年沒有考了,可能會出小題。 網友:請問在答題書寫方面有什么要注意的,我在大學里沒有學過數學,是自學的,所以這方面比較欠缺。 曹顯兵:這位網友沒有學過數學的話,一定要注意這幾個方面,根據教育部的評分標準上看,每一個題的關鍵步驟要寫出來,如果寫出來分數就高了,有的同學是知道這個步驟,但是沒有寫就丟分了,簡單的步驟可以少一點,節約時間。舉個例子說,積分定理上,你是用的什么定理一定要寫出來,由什么定理得到什么東西?這都要寫出來,還要明確函數的性質,這個題的關鍵的理論依據你必須要寫出來。還有盡可能不要涂改得太多,不小心寫錯一個地方是可以的,但是少作涂改,卷面整潔會給老師一個好印象,印象分也是重要的。如果你的卷面比較工整,可能就會少失分。 網友:概率這部分,公式、概念特別多,而且不好記,請問老師現在沖刺階段應該如何復習比較好? 曹顯兵:概率統計的公式相對于微積分來說是比較少的,大家想想古典概型談不上公式,有些公式就是重要幾個分布,0-1分布,泊松分布,正態分布、區域分布、指數分布,這些分布律和密度函數和分布函數、數學期望等這些都是要記住的,公式密的也基本上在這里。還有剛才說的函數的期望公式,在后面公式是不多的,概念是有一些。我想同學們如何死記硬背,效果會差一些,而且很快會忘記,大家可以結合一些模型來記憶。比如說二項分布,可以去記一個例子,就是把一枚硬幣重復的拋N次,你想想正面向上的次數是K次,如何計算?你把這個模型記住了,公式你就記住了,就是在N中取K的總和。這個公式可是一個考試的重點,而且05年最有可能考的公式,這個公式已經有幾年沒有考了,前幾年考得頻率非常非常高,我們之前考過指數分布和特征分布,這個公式大家要記住。另外比如說想全概率公式也可以通過這個模型記住。我舉個例子,全概率公式如果是死記硬背,就算記得再熟悉可能不一定會解決問題,大家可以記得這么一個模型,比如說現在我們有兩箱產品,每箱產品的次品率大家知道了,我們在任一個箱子中任取一些產品,現在我要求得出來,拿出來的產品次品的概率是什么?這個就是我們要解決的問題。我們仔細推敲一下這個隨機實驗,這個有一個特點,我們是分兩步作完的,第一步是取出一個箱子,第二步我們取出一些產品,F在我們要求的是產品是次品的概率,這個就要求公式里B,自然就記住了,你要總結一下,什么時候用這個公式,就是一個隨機實驗分兩步作完,要求第二步發生的情況的概率。第一步的所有的結果,你找出來,這就是公式里面的完美事件組。這里面有模型的,你盡可能的通過模型去理解和分析,這是最牢固的,也是最能解決問題的。 網友:今年數一概率統計的重點是什么?是中間估計和矩估計,還是中心極限定理? 曹顯兵:剛才這個網友說的中心極限定理考試的重點,這個好象數一還從來沒有考過,只要了解一下什么是中心極限定理就可以了,不要當成重點。似然估計和矩估計在04年是考過大題的,05年不是重點,如果要考,就是求出來之,是不是無偏的,是不是有效的。區間估計數一和數三都不是重點,只要知道方程可以了。這個不能改的,是固定的。 復習技巧 網友:沖刺階段復習概率有沒有好的辦法? 曹顯兵:我剛才說了,最好這一部分的復習,因為就只有這么三個禮拜了,這一階段時間的重點應該放在前邊已經作過的模型題和真題拉出來看一下,鞏固一下,不要陷在題海里面,再做一到兩套就足夠了。要把以前的題拿出來看一下,是否很快就可以想到方法,而且是否會知道這個題的考試重點是什么?如果這個題有困難的話,再把參考書拿出來看一下,找出自己的漏洞,看是否有不熟悉的概念和公式,不要做太多的題。 網友:感覺事件的關系運算比較有難度,能不能請老師說一下復習的重點和方法? 曹顯兵:好的,事件的關系和性質這方面一般會出填空題和選擇題的可能性大一點,一般不會出大題,事件的關系和運算規律要把中學學的集合聯系起來,這個不是數的運算而是集合的運算。比如我們有A-B+B=A,但是A-B+A不等于A.把這些關系和集合作一些比較,重點要放在概率的性質中,性質有這么幾個:加法公式、減法公式、對立事件的概率公式。大家注意尤其是減法公式考得比較多,A-B的概率等于A-AB的概率,還有一些題型是A-B實際上是差別的事件,這個事件是與A和B的對立事件的集事件是相等的,經常要搞好這個互換,就是A的概率減去B的概率,要把這個概率性質熟悉一下,從書中總結歸納的結論再仔細看一下,鞏固一下,我想這就沒有問題了。 網友:我參加的是MBA的聯考,這樣的題目特別多,同時關系的運算往往同概率計算結合到一起,遇到獨立的事件我就感覺更暈了。 曹顯兵:MBA聯考時概率是要考的,分數也占得很多,我也在北京大學講過課。聯考和普研比要簡單一些,獨立性也是要考的,我想獨立性這方面我再說兩句,B發生的條件下A發生的條件概率就是A的獨立性,如果嚴格的判斷兩個獨立性的話,積事件的概率等于概率的乘積,用它去判別它,一個事件發生不影響另外一個事件發生的概率,這兩個事件都是獨立的,這個獨立性千萬不要把它混淆起來,去年普研就單獨考了一個題,兩個事件獨立,并不能推出這兩個事件是互斥的,也就是說兩個獨立的事件可能是互斥的,也可能不是互斥的,可以獨立也可以不獨立,在邏輯上是沒有推導關系的。如果兩個事件是獨立的,而且這兩個事件的概率都不為零的話,可以推出這兩個事件一定是相容的,這個沒有考過。 我再說一個命題:如果兩個隨機事件已經互斥了,而且這兩個事件的概率不為零,那么這兩個事件肯定是不獨立的。另外的話,包括普研和聯考,兩個事件和三個事件的獨立性大家區別一下,兩個事件的獨立是一個概念,但是三個或者三個以上事件的話有兩個獨立和兩兩獨立,大家查一下書,這個是容易混淆的概念,相互獨立和兩兩獨立也是不同的。 網友:請問曹老師,有人說由于數三考的概率內容比數四多,所以個別題目數四會難于數三,有這回事嗎? 曹顯兵:應該說沒有這回事,數三數四的大題基本上是一樣的,而且數四因為自考的部分可能會多一個題,但是難度是差不多的,我們數三數四的概率統計部分比數一要難,分數也會多一些,上了研究生以后,這門課程經濟類的會比理工的會重要一些。 網友:我認為古典概率比較難,雖然高中接觸過,但是經常做錯,有必要花很多時間做這個嗎? 曹顯兵:古典概率概率里面最難的,但是最難的是從來不考的。古典概率是難點、考點,但是不是考試的重點。古典概率的公式要記住,什么是古典概率你要知道,就是一個隨機實驗所有發生的結果,每個結果發生的可能性相同,那么一些比較簡單的古典概率會做就可以了,在這個上面花太多的時間是得不償失的,而且一般這個不單獨出題。比如說十件產品里面有三件次品,你任取一件,那么拿到次品概率是什么。網友:數理統計部分好難啊,曹老師是否有好的建議? 數理統計是最容易的部分,可能網友在大學中沒有學過這門課程,所以復習起來比較困難。數理統計的題型特別少,而且作題的方法也是固定的,只要把數理統計的三個重要分布,卡方分布、T分布和F分布的結構掌握了,把重要統計的分布掌握了,那么前面這一部分求統計量的數字特征和分布量題就掌握了,至于矩陣完全是固定的方法,就是一個求數學期望的問題,如果把這個問題解決了,矩估計是可以完全解決的。不會考一個非常復雜數學期望,你會做期望就會做矩估計,第一步把似然函數寫出來,第二步求對數,第三步求偏導數,在這也不會考導的問題。每個題都是這樣的步驟,所以我想數理統計部分,只要概率重要部分掌握了的話,應該沒有什么難度的。一致性也不是重點,只要知道什么是一致性就可以了。 網友:曹老師,數一的平均分這幾年大概是多少? 曹顯兵:比較理想的是50分到51分,不是很理想的,比如說98年就只有37分多一點。那一年的錄取分數線也只是40分,然后比較難的是01年是38分,錄取分數線是41分,現在考150分了,統計的平均分應該是67分的樣子,這個是符合教育部對試卷的要求的。如果100分制,低于40分,就說明出得難了。題目難易程度對考生的影響不是太大,因為要難大家都難,實際上最關心難度的還是主管部門:教育部,因為如果太難,對考生的區分不太好辦。所以現在不會太難,重點還是在基本的知識點和基本概念和基本原理上面,看大家是否熟練,可以結合兩個以上的考點來考大家的知識掌握的連續性。 網友:關于數字特征部分去年考了協方差結算,今年是考一維隨機變量的可能性大還是二維? 曹顯兵:網友問到這個問題,我想05年到底考一維還是二維不是我出題,我不好說。但是我可以作一個分析,無論是一個隨機變量一維還是二維,我前面說了都歸結為函數的數學期望,什么是數學期望?我分成兩種類型的隨機變量,一個是離散性一個是連續型,其他類型的隨機變量我們是求不了的,也是大綱之外的。離散型的隨機變量是變量的取值和概率,作乘積再作和,連續型是求值和密度的乘積在整個上面做廣義積分,要把握離散型要知道分布函數,連續型要知道密度函數,有的同學搞混了。協方差是兩個隨機變量乘積的期望減去期望的乘積,方差也是期望。 05年如果考一個隨機變量的話,可能會給你一個隨機實驗,你自己找出來,再去作期望。如果考分布函數,重點可能在二維,因為考二維你肯定要掌握一維,所以最有可能考的是二維。 網友:概率題型感覺上很固定,是不是每年把考研真題做好了,考研就沒有問題的? 曹顯兵:考研真題作好了,對你有極大的參考作用,但不是說這樣就可以穩穩的到理想的分數。一個前提條件是你是否把歷年真題的考的重點掌握了?不要投機取巧的押題。比如說求分布函數的題,你是否真正掌握了?自己是否能夠真的作出來。你指導了已知的隨機變量,抓兩個新的變量出來,你會不會做。還有聯合密度,你是否會求,是否會處理?還有兩個隨機變量函數的問題,這個是考試的重點和難點,你要把這個地方掌握透了,我說幾點,看看你是否掌握了。 兩個隨機變量函數分布,離散性,那么函數的隨機變量一定是離散性的,這個分布如何求呢?就把函數隨即變量看成Z,這個Z取什么值?把概率的值求出來,04年經濟類的不就考了嗎?連續性的你是否掌握了?基本方法是求分布函數,是求新的隨機變量的分布函數,關鍵是要求流動區域上面的二層積分,這是考試的難點,它的基本的方法是討論積分區域,要分情況討論。要根據流動的積分區域和函數,如果是分段函數的話,要分析區域,不相交的是哪些情況?這個地方掌握了嗎? 還有一個隨機變量函數的分布,你是否掌握了,標準是什么呢?我給一個隨機變量X,你要知道Y=GX,Y的分布你就會求,你可以知道已知的X是離散型的你會嗎?如果是連續型的你會嗎?那么只給你分布函數,不給你連續型還是離散型,你會求嗎?如果你把這幾個問題搞清楚了,這個地方你就徹底搞清楚的,如果考這幾個知識點你就應該可以了。當然第三個問題從來沒有考過。分布函數完全可以作為概率里面最重要也是最基礎的問題去分析,每年都會直接或者間接的涉及到分布函數,大家還要再鞏固一下分布函數,對大家會有很大的幫助。 網友:在計算時我們會假設一個事件,之后進行計算,但是我可能假設不到,所以無法作出,但是我只要看到書上的答案,就可以做下去。這是什么原因? 曹顯兵:可能大家對題沒有準確的把握住,有人給他假設好了,他就會做了。我們不妨看一個練習來說,我說一個例子,現在我們城里有兩個小孩的家庭,我們從這些家庭中作這么一個實驗,隨機的選一個家庭,現在我知道所選擇的家庭里面小孩有一個是男孩,我讓你計算一下另外一個小孩是女孩概率,你是否會做出正確的假設,你會正確的表述這個事件。我們要把握兩點,要求的東西是什么概率?你要清楚什么是條件概率,你要知道一個小孩是男孩,這是一個信息,另外一個信息你不知道,所以這是條件概率。你假設事件A是有一個小孩是男孩,要完全根據來假設。B表示另外一個小孩是女孩,你要求的是P(B一數A)這個就表示A方程下B發生的概率。你會寫出條件概率的話,會表述了就會求了,簡單的條件概率可以直接寫出來,復雜的概率也可以根據方程去做。這個結果應該是2/3,這個也是可以根據古典概型去計算的。兩個小孩有四種情況,老大是男孩,老二是男孩,老大是男孩,老二是女孩,老大是女孩,老二是男孩,還有老大老二都是女孩,之后就可以求出來了,能否正確的作出假設就需要大家準確的理解題意,不知道這個同學是否滿意。 關于答題技巧 網友:請問在答題書寫方面有什么要注意的,我在大學里沒有學過數學,是自學的,所以這方面比較欠缺。 曹顯兵:這位網友沒有學過數學的話,一定要注意這幾個方面,根據教育部的評分標準看,每一個題的關鍵步驟要寫出來,如果寫出來分數就高了,有的同學是知道這個步驟,但是沒有寫就丟分了,簡單的步驟可以少一點,節約時間。舉個例子說,積分定理上,你是用的什么定理一定要寫出來,由什么定理得到什么東西?這都要寫出來,還要明確函數的性質,這個題的關鍵的理論依據你必須要寫出來。還有盡可能不要涂改得太多,不小心寫錯一個地方是可以的,但是少作涂改,卷面整潔會給老師一個好印象,印象分也是重要的。如果你的卷面比較工整,可能就會少失分。 主持人:由于時間關系,我們的聊天就要結束了,最后請曹顯兵老師就概率和數理統計的沖刺作一些指導性建議? 曹顯兵:在最后20多天的復習中,大家要把握,這些重要的公式,包括全概率公式,貝葉斯公式,貝努利概型公式等,這些重要的公式一定要通過具體的例子去理解和把握它,剛才說的這幾個公式也是05年要重點考的,求分布的題是肯定考的,至于是求分布函數還是聯合分布律還是考密度,這個就不好說了,但是求分布是肯定要考的,同學們要把歷年考求分布的題看一下,也可以把我們學校中講的題拿出來看一下,鞏固一下,不要做什么難題了,這樣會打擊自己的信心。碩士研究生也不會考什么難題,會考基本題,要看一下方差、協方差和函數,歸根到底是函數的數學期望,一個函數隨機變量函數和兩個函數的隨機變量函數,這個地方也是要看,也是一定要考的。 剛才有的網友提出來古典概型,這個不要去花太多的時間看了。像中心極限定理都不是考試的重點,大家看一下就可以了,統計這一部分就是數一和數三的同學考,重點關注一下無偏性有效性的地方,如果把握好這些地方就沒有問題了,就可以拿到好的成績。謝謝大家。 |
回復話題 |
||
上傳/修改頭像 |
|
|