Hướng dẫn giãi toán xác suất bằng phân phối chuẩn

Lời giải Ví dụ 2.33 Gọi X là tuổi thọ của mạch điện tử trong máy tính. X tuân theo phân phối mũ với tham số

Vậy có khoảng 55,06% mạch điện tử bán ra phải thay thế trong thời gian bảo hành.

Ví dụ 2.34. Công ty điện thoại A thu phí 0,15$ mỗi phút cho các cuộc gọi điện thoại. Với bất kỳ cuộc gọi nào trong vòng một phút, họ sẽ tính phí trong một phút. Công ty điện thoại B cũng tính phí 0,15$ mỗi phút. Tuy nhiên, công ty điện thoại B tính toán phí dựa trên thời lượng chính xác của một cuộc gọi. Cho T, thời lượng của một cuộc gọi tính bằng phút, là biến ngẫu nhiên có phân phối mũ với tham số λ = 1/3.

[a] Hàm mật độ xác suất của T là gì?

[b] Kỳ vọng của T là bao nhiêu?

[c] Doanh thu trung bình cho mỗi cuộc gọi E [ R A ] và E [ R B ] của công ty A và B là bao nhiêu? Lời giải Ví dụ 2.34

2.4.6 Phân phối chuẩn

2.4.4a Phân phối chuẩn Định nghĩa 2.19 [Phân phối chuẩn]. Biến ngẫu nhiên liên tục X được gọi là tuân theo luật phân phối chuẩn [normal distribution] với tham số µ, σ 2 , ký hiệu là X ∼ N [ µ, σ 2 ] , nếu hàm mật độ xác suất của X có dạng

ở đây e và π được lấy xấp xỉ lần lượt là 2, 71828 và 3, 14159.

Định lý 2.17. Kỳ vọng và phương sai của biến ngẫu nhiên X có phân phối chuẩn

và độ lệch tiêu chuẩn là σ [ X ] = σ.

Chứng minh. Để xác định kỳ vọng, trước hết ta tính

Đặt z = [ x − µ ] /σ và dx = σdz, ta nhận được

vì hàm số dưới dấu tích phân là hàm lẻ của z. Do đó, E [ X ] = µ. Phương sai của biến ngẫu nhiên tuân theo luật phân phối chuẩn được cho bởi

Đặt z = [ x − µ ] /σ và dx = σdz, ta nhận được

Tích phân từng phần với

ta tìm được

Nhận xét 2.14. Phân phối liên tục quan trọng nhất trong lĩnh vực thống kê là phân phối chuẩn. Đồ thị của hàm mật độ xác suất f X [ x ] của biến ngẫu nhiên tuân theo luật phân phối chuẩn, được gọi là đường cong chuẩn, có dạng hình chuông [xem Hình 2.9], mô tả gần đúng nhiều hiện tượng trong tự nhiên, công nghiệp và nghiên cứu.

Hình 2.9: Đường cong chuẩn

Hình 2.10 mô tả hai đường cong chuẩn có cùng độ lệch chuẩn nhưng kỳ vọng khác nhau. Hai đường cong giống hệt nhau về hình thức nhưng được tập trung tại các vị trí khác nhau dọc theo trục hoành. Hình 2.11 mô tả hai đường cong chuẩn có cùng kỳ vọng nhưng độ lệch chuẩn khác nhau. Hình 2.12 mô tả cho trường hợp kỳ vọng và độ lệch chuẩn khác nhau.

Hình 2.10: Đường cong chuẩn với µ 1 < µ 2 và σ 1 = σ 2

Hình 2.11: Đường cong chuẩn với µ 1 = µ 2 và σ 1 < σ 2

Hình 2.12: Đường cong chuẩn với µ 1 < µ 2 và σ 1 < σ 2

Định lý 2.18. Nếu X là biến ngẫu nhiên tuân theo luật phân phối chuẩn N [ µ, σ 2 ] , thì biến ngẫu nhiên Y = aX + b tuân theo luật phân phối chuẩn N [ aµ + b, a 2 σ 2 ] . Chú ý 2.5. 1. Nếu X 1 , X 2 là hai biến ngẫu nhiên độc lập có phân phối chuẩn X 1 ∼ N [ µ 1 , σ 1 2 ] , X 2 ∼ N [ µ 2 , σ 2 2 ] thì

X 1 + X 2 cũng có phân phối chuẩn X 1 + X 2 ∼ N [ µ 1 + µ 2 , σ 1 2 + σ 2 2 ] [xem Chương 3]. 2. Nếu n biến ngẫu nhiên độc lập X i cùng có phân phối chuẩn N [ µ, σ 2 ] , i = 1, . . . , n, thì

[xem Chương 3].

2.4.4b Phân phối chuẩn tắc Định nghĩa 2.20 [Phân phối chuẩn tắc]. Phân phối chuẩn N [ µ, σ 2 ] với µ = 0 và σ = 1 gọi là phân phối chuẩn tắc N [ 0, 1 ] . Nếu X là biến ngẫu nhiên có phân phối chuẩn N [ µ, σ 2 ] thì

là biến ngẫu nhiên có phân phối chuẩn tắc N [ 0, 1 ] . Do đó các tính toán về X sẽ được quy về U. Định nghĩa 2.21 [Hàm mật độ xác suất]. Hàm mật độ xác suất của biến ngẫu nhiên có phân phối chuẩn tắc là

Đây là hàm Gau–xơ với các giá trị được tính sẵn trong Phụ lục 1.

Hình 2.13: Hàm mật độ của biến ngẫu nhiên có phân phối chuẩn tắc N [ 0, 1 ]

Định nghĩa 2.22 [Hàm phân phối xác suất]. Hàm phân phối xác suất của biến ngẫu nhiên U phân phối chuẩn tắc là

Giá trị của hàm Φ [ x ] được tính sẵn trong Phụ lục 3. Hàm Φ [ x ] có tính chất sau.

Định lý 2.19.

Chứng minh. Từ Định nghĩa 2.22,

2.4.4c Xác suất để biến ngẫu nhiên X có phân phối chuẩn N [ µ, σ 2 ] nhận giá trị trong khoảng [ α, β ] Định lý 2.20. Nếu X là biến ngẫu nhiên có phân phối chuẩn N [ µ, σ 2 ] thì

trong đó φ [ x ] là hàm số Láp–la–xơ xác định bởi [1.24].

Định lý 2.21. Nếu X là biến ngẫu nhiên có phân phối chuẩn N [ µ, σ 2 ] thì hàm phân phối xác suất của X là

Khi đó, xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng [ α, β ] là

Chú ý 2.6. 1. Các giá trị của hàm Láp–la–xơ [1.24] được tính trong bảng Phụ lục 2 [xem Mục 1.5.5] đối với các giá trị x dương. Hàm φ [ x ] là hàm lẻ, tức là φ [− x ] = − φ [ x ] . Khi x > 5 ta có thể lấy φ [ x ] ≈ 0, 5. 2. Hàm phân phối xác suất của biến ngẫu nhiên phân phối chuẩn tắc Φ [ x ] xác định bởi [2.42] và hàm Láp–la–xơ φ [ x ] xác định bởi [1.24] có mối liên hệ:

Các giá trị của hàm phân phối chuẩn tắc Φ [ x ] được tính sẵn trong bảng Phụ lục 3 đối với các giá trị x dương. 3. Nếu X ∼ N [ µ, σ 2 ] thì các công thức [2.44] và [2.45] là tương đương.

2.4.4d Quy tắc 3σ Từ Hệ quả 2.3[3] suy ra xác suất để độ lệch tuyệt đối của biến ngẫu nhiên X ∼ N [ µ, σ 2 ] khỏi trị trung bình của nó bé hơn ε = tσ là

Thay t = 1, 2, 3, tra bảng giá trị hàm số Láp–la–xơ [Phụ lục 2] ta nhận được

Quy tắc 3σ được phát biểu như sau: Hầu chắc chắn rằng [với độ tin cậy 0,9973] X có phân phối chuẩn N [ µ, σ 2 ] lấy giá trị trong khoảng [ µ − 3σ, µ + 3σ ] . Trong thực tế, quy tắc 3σ được áp dụng như sau: Nếu quy luật phân phối xác suất của biến ngẫu nhiên được nghiên cứu chưa biết, song nó thỏa mãn điều kiện của Quy tắc 3σ thì có thể xem như nó là biến ngẫu nhiên có phân phối chuẩn. Chú ý 2.7. 1. Phân phối chuẩn được Gao–xơ tìm ra năm 1809 nên nó còn được gọi là phân phối Gao–xơ. 2. Phân phối chuẩn thường được sử dụng trong các bài toán đo đạc các đại lượng vật lý, thiên văn . . .

3. Trong thực tế, nhiều biến ngẫu nhiên tuân theo phân phối chuẩn hoặc tiệm cận chuẩn. Chẳng hạn, trọng lượng, chiều cao của một nhóm người nào đó; điểm thi của thí sinh; năng suất cây trồng; mức lãi suất của một công ty; nhu cầu tiêu thụ của một mặt hàng nào đó; nhiễu trắng trên các kênh thông tin . . . là các biến ngẫu nhiên có phân phối chuẩn.

Ví dụ 2.35. Lãi suất [%] đầu tư vào một dự án trong năm 2018 được coi như một biến ngẫu nhiên tuân theo quy luật chuẩn. Theo đánh giá của ủy ban đầu tư thì với xác suất 0,1587 cho lãi suất lớn hơn 20% và với xác suất 0,0228 cho lãi suất lớn hơn 25%. Vậy khả năng đầu tư mà không bị lỗ là bao nhiêu?

Lời giải Ví dụ 2.35 Gọi X là lãi suất [%] của dự án trong năm 2018. Khi đó X là biến ngẫu nhiên có phân phối chuẩn N [ µ, σ 2 ] . Theo đầu bài ta có

Từ bảng giá trị hàm số Láp–la–xơ [Phụ lục 2] suy ra

Hay µ = 15,σ = 5. Vậy khả năng đầu tư không bị lỗ là P [ X ≥ 0 ] = 0, 5 + φ [ 3 ] = 0, 5 + 0, 49865 = 0, 99865.

2.4.4e Xấp xỉ phân phối nhị thức bởi phân phối chuẩn Trong Mục 1.5.5 ta đã đề cập đến việc xấp xỉ công thức Béc–nu–y [1.20] bởi công thức [3.40] khi số phép thử n khá lớn. Ở đây ta xét chi tiết về mối liên hệ giữa phân phối nhị thức và phân phối chuẩn. Phân phối chuẩn có thể dùng xấp xỉ khá tốt cho một số phân phối rời rạc. Ta có định lý sau đây mang tên là Định lý Moa-vrơ–Lap-la-xơ. Định lý 2.22. Giả sử X là biến ngẫu nhiên có phân phối nhị thức B[ n; p ] . Nếu np > 5 và n [ 1 − p ] > 5 thì X có phân phối xấp xỉ phân phối chuẩn với tham số µ = np, σ 2 = np [ 1 − p ] . Phân phối chuẩn với kỳ vọng µ = np và phương sai σ 2 = np [ 1 − p ] không chỉ xấp xỉ khá tốt cho phân phối nhị thức khi n khá lớn và xác suất p không quá gần 0 hoặc 1 mà còn cung cấp một xấp xỉ khá tốt cho phân phối nhị thức ngay cả khi n nhỏ và p gần 1/2. Để minh họa việc xấp xỉ phân phối chuẩn cho phân phối nhị thức, ta vẽ biểu đồ của B[ 15; 0, 4 ] và vẽ đường cong chuẩn có cùng kỳ vọng µ = np = 15 × 0, 4 = 6 và phương sai σ 2 = np [ 1 − p ] = 15 × 0, 4 × 0, 6 = 3, 6 với biến ngẫu nhiên tuân theo luật phân phối nhị thức X [xem Hình 2.14].

Hình 2.14: Xấp xỉ phân phối chuẩn cho phân phối nhị thức B[ 15; 0, 4 ]

Trong hình minh họa về xấp xỉ phân phối nhị thức bởi phân phối chuẩn, vì ta xấp xỉ một phân phối rời rạc bằng một phân phối liên tục, nên cần một sự hiệu chỉnh để giảm sai số. Định lý 2.23. Cho X là biến ngẫu nhiên tuân theo luật phân phối nhị thức B[ n; p ] . Phân phối xác suất của X được xấp xỉ bởi phân phối chuẩn N [ µ, σ 2 ] với µ = np và σ 2 = np [ 1 − p ] và

Nhận xét 2.15. Hình 2.15 và 2.16 biểu thị biểu đồ xác suất nhị thức với n = 25 và p = 0, 5, p = 0, 1 tương ứng. Phân phối trong Hình 2.15 là hoàn toàn đối xứng.

Hình 2.15: Phân phối nhị thức với n = 25 và p = 0, 5 xấp xỉ bởi phân phối chuẩn với µ = 12, 5 và σ = 2, 5

Hình 2.16: Phân phối nhị thức và xấp xỉ phân phối chuẩn với n = 25 và p = 0, 1

Việc thêm + 0, 5 và − 0, 5 chính là yếu tố hiệu chỉnh và gọi là hiệu chỉnh liên tục.

Ví dụ 2.36. Sử dụng phân phối chuẩn xấp xỉ xác suất X = 8, 9, hoặc 10 cho biến ngẫu nhiên X tuân theo luật phân phối nhị thức với n = 25 và p = 0, 5. So sánh với công thức tính chính xác. Lời giải Ví dụ 2.36 Vì X là biến ngẫu nhiên tuân theo luật phân phối nhị thức với n = 25 và p = 0, 5,

Sử dụng công thức xấp xỉ [3.42] với

ta nhận được P [ 8 ≤ X ≤ 10 ] ≈ φ [− 0.8 ] − φ [− 2 ] = 0, 18911.

Giá trị xấp xỉ 0,18911 với giá trị thực 0,190535 là khá gần nhau.

Ví dụ 2.37. Kiểm tra chất lượng 1000 sản phẩm với tỷ lệ chính phẩm 0,95. Tìm xác suất để số chính phẩm trong lô kiểm tra từ 940 đến 960. Lời giải Ví dụ 2.37 Gọi X là biến ngẫu nhiên chỉ số chính phẩm trong lô sản phẩm kiểm tra, ta có X ∼ B[ 1000; 0, 95 ] . Với n = 1000, p = 0, 95, ta có np = 950 và np [ 1 − p ] = 47, 5 đủ lớn nên ta xấp xỉ bởi X ∼ N [ 950; 47, 5 ] :

2.4.7 Phân phối khi bình phương Định nghĩa 2.23 [Phân phối khi bình phương]. Biến ngẫu nhiên liên tục X được gọi là tuân theo luật phân phối khi bình phương với n bậc tự do, ký hiệu là X ∼ χ 2 n , nếu hàm mật độ xác suất của X có dạng

ở đây

là hàm Gamma [đã đề cập trong Giải tích 2].

Định nghĩa sau cho cách nhận biết một biến ngẫu nhiên có phân phối khi bình phương xuất phát từ n biến ngẫu nhiên độc lập có cùng phân phối chuẩn tắc. Định nghĩa 2.24. Nếu X 1 , X 2 , . . . , X n là các biến ngẫu nhiên độc lập có cùng phân phối chuẩn tắc N [ 0, 1 ] thì

[U n có phân phối khi bình phương với n bậc tự do]. Kỳ vọng và phương sai của biến ngẫu nhiên U n :

Tính chất 2.1.

1. Nếu X 1 và X 2 là hai biến ngẫu nhiên độc lập có phân phối khi bình phương với n 1 , n 2 bậc tự do thì biến ngẫu nhiên X 1 + X 2 có phân phối khi bình phương với n 1 + n 2 bậc tự do [xem Chương 3]. 2. Biến ngẫu nhiên

có phân phối xấp xỉ phân phối chuẩn tắc N [ 0, 1 ] khi n đủ lớn. 3. Một hệ quả quan trọng được dùng nhiều trong thống kê [xem Chương 3]: Nếu X 1 , X 2 , . . . , X n là các biến ngẫu nhiên độc lập có phân phối chuẩn N [ µ, σ 2 ] và

thì

Việc tính toán với phân phối χ2n đưa về việc sử dụng bảng Phụ lục 4.

2.4.8 Phân phối Student Định nghĩa 2.25 [Phân phối Student]. Biến ngẫu nhiên liên tục X được gọi là tuân theo luật phân phối Student với n bậc tự do, ký hiệu là X ∼ t [ n ] , nếu hàm mật độ xác suất của X có dạng

ở đây Γ [ x ] là hàm Gamma. Để nhận biết một biến ngẫu nhiên có phân phối Student ta sử dụng định nghĩa sau.

Định nghĩa 2.26. Nếu X và Y là hai biến ngẫu nhiên độc lập tuân theo luật N [ 0, 1 ] và χ2n tương ứng thì

[T n có phân phối Student với n bậc tự do].

Kỳ vọng và phương sai của biến ngẫu nhiên T n có phân phối Student:

Tính chất 2.2. Biến ngẫu nhiên T n có phân phối xấp xỉ phân phối chuẩn tắc N [ 0, 1 ] khi n đủ lớn. Nhận xét 2.16. 1. Phân phối Student có cùng dạng và tính đối xứng như phân phối chuẩn nhưng nó phản ánh tính biến đổi của phân phối sâu sắc hơn. Phân phối chuẩn không thể dùng để xấp xỉ phân phối khi mẫu có kích thước nhỏ. Trong trường hợp này ta dùng phân phối Student. 2. Khi bậc tự do n tăng lên [n ≥ 30] thì phân phối Student tiến nhanh về phân phối chuẩn. Do đó khi n ≥ 30 ta có thể dùng phân phối chuẩn thay thế cho phân phối Student. 3. Một hệ quả quan trọng được dùng nhiều trong thống kê [xem Chương 3]: Nếu X 0 , X 1 , X 2 , . . . , X n là các biến ngẫu nhiên độc lập có phân phối chuẩn tắc N [ 0, 1 ] thì

2.4.9 Phân phối Fisher

Định nghĩa 2.27. Cho X 1 , X 2 , . . . , X n và Y 1 , Y 2 , . . . , Y m là n + m biến ngẫu nhiên độc lập, trong đó X i ∼ N [ 0; 1 ] và Y j ∼ N [ 0; 1 ] , i = 1, . . . , n, j = 1, . . . , m. Khi đó biến ngẫu nhiên

Chủ Đề