Эмпирик тархалтын функцийн илэрхийлэл. Эмпирик тархалтын функц, шинж чанар. Вариацын цуврал. Полигон ба гистограм

Вариацын цуврал. Полигон ба гистограм.

Түгээлтийн хүрээ- тодорхой хувьсах шинж чанарын дагуу судлагдсан популяцийн нэгжийн дараалсан хуваарилалтыг илэрхийлдэг.

Түгээлтийн цуваа үүсэх үндсэн шинж чанараас хамааран тэдгээрийг ялгадаг атрибутив ба хэлбэлзэлтэйтүгээлтийн эгнээ:

§ Тоон шинж чанарын утгуудын өсөх эсвэл буурах дарааллаар бүтээгдсэн тархалтын цувааг нэрлэдэг. хувьсах.

Түгээлтийн вариацын цуврал нь хоёр баганаас бүрдэнэ.

Эхний баганад гэж нэрлэгддэг янз бүрийн шинж чанарын тоон утгыг өгдөг сонголтуудболон томилогдсон. Дискрет сонголт - бүхэл тоогоор илэрхийлнэ. Интервалын сонголт нь хооронд хэлбэлздэг. Сонголтуудын төрлөөс хамааран та салангид эсвэл интервалын өөрчлөлтийн цуваа үүсгэж болно.
Хоёр дахь баганад агуулагдаж байна тодорхой сонголтын тоо, давтамж эсвэл давтамжаар илэрхийлсэн:

Давтамжууд- эдгээр нь үнэмлэхүй тоо бөгөөд тухайн шинж чанарын өгөгдсөн утга нэгтгэлд хэдэн удаа тохиолдохыг илэрхийлдэг. Бүх давтамжийн нийлбэр нь нийт хүн ам дахь нэгжийн тоотой тэнцүү байх ёстой.

Давтамжууд() нь нийт дүнгийн хувиар илэрхийлсэн давтамж юм. Хувь хэмжээгээр илэрхийлсэн бүх давтамжийн нийлбэр нь нэгийн бутархайгаар 100% -тай тэнцүү байх ёстой.

Түгээлтийн цувралын график дүрслэл

Түгээлтийн цувралуудыг график дүрслэл ашиглан нүдээр үзүүлэв.

Түгээлтийн цувралыг дараах байдлаар дүрсэлсэн болно.

§ Олон өнцөгт

§ Гистограмм

§ Хуримтлагдах

Олон өнцөгт

Олон өнцөгтийг бүтээхдээ янз бүрийн шинж чанарын утгыг хэвтээ тэнхлэгт (x тэнхлэг), давтамж эсвэл давтамжийг босоо тэнхлэгт (y тэнхлэг) зурдаг.

1. Зураг дээрх олон өнцөгт. 6.1 нь 1994 онд Оросын хүн амын бичил тооллогын мэдээлэлд үндэслэсэн болно.


баганат график



Гистограммыг бий болгохын тулд интервалын хилийн утгыг абсцисса тэнхлэгийн дагуу зааж өгсөн бөгөөд тэдгээрийн үндсэн дээр өндөр нь давтамж (эсвэл давтамж) -тай пропорциональ тэгш өнцөгтүүдийг байгуулдаг.

Зураг дээр. 6.2. 1997 онд Оросын хүн амын насны ангиллаар хуваарилах гистограмыг харуулав.

Зураг 1. Оросын хүн амын насны ангиллаар хуваарилалт

Эмпирик тархалтын функц, шинж чанар.

X тоон шинж чанарын статистик давтамжийн тархалтыг тодорхой болгоё.Тэр шинж чанарын утга х-ээс бага ажиглагдсан ажиглалтын тоогоор, нийт ажиглалтын тоог n-ээр тэмдэглэе. Мэдээжийн хэрэг, X үйл явдлын харьцангуй давтамж

Эмпирик тархалтын функц (түүврийн тархалтын функц) нь X үйл явдлын харьцангуй давтамжийг х утга тус бүрээр тодорхойлдог функц юм.

Түүврийн эмпирик тархалтын функцээс ялгаатай нь популяцийн тархалтын функцийг онолын тархалтын функц гэж нэрлэдэг. Эдгээр функцүүдийн ялгаа нь онолын функц нь X үйл явдлын магадлалыг тодорхойлдогт оршино

n нэмэгдэх тусам X үйл явдлын харьцангуй давтамж

Үндсэн шинж чанарууд

Анхан шатны үр дүнг тогтоогоорой. Дараах магадлалын функцээр өгөгдсөн дискрет тархалтын тархалтын функц байна.

хаана ба - түүвэр элементийн тоо -тэй тэнцүү байна. Ялангуяа дээжийн бүх элементүүд өөр өөр байвал .

Энэ хуваарилалтын математикийн хүлээлт нь:

.

Тиймээс түүврийн дундаж нь түүврийн тархалтын онолын дундаж юм.

Үүний нэгэн адил түүврийн дисперс нь түүврийн тархалтын онолын дисперс юм.

Санамсаргүй хэмжигдэхүүн нь бином тархалттай:

Түүврийн тархалтын функц нь хуваарилалтын функцийн шударга бус үнэлгээ юм.

.

Түүврийн тархалтын функцийн дисперс нь дараах хэлбэртэй байна.

.

Олон тооны хүчтэй хуулийн дагуу түүврийн тархалтын функц нь онолын тархалтын функцтэй бараг нийлдэг.

дээр бараг гарцаагүй.

Түүврийн тархалтын функц нь онолын тархалтын функцийн асимптотын хэвийн тооцоо юм. Хэрэв бол

түгээлтийн дагуу .

Зарим тоон шинж чанарыг судалцгаая? ерөнхий популяци, ямар ч түүврийн хэмжээ нь энэ шинж чанарын давтамжийн тархалтыг мэддэг гэж үзье. Түүврийн хэмжээг тохируулах замаар П,-ээр тэмдэглэнэ p x x-ээс бага сонголтуудын тоо. Дараа нь харилцаа холбоо байгааг харахад хэцүү биш юм njnүйл явдлын харьцангуй давтамжийг илэрхийлдэг (?

Энэ харьцаа нь тогтмол x тооноос хамаардаг тул энэ x хэмжигдэхүүний зарим функц юм. -ээр тэмдэглэе F*(x).

Тодорхойлолт 1.10. Чиг үүрэг F*(x) = -, харьцангуйг илэрхийлнэ

үйл явдлын давтамж (? эмпирик функц

хуваарилалт (түүврийн хуваарилалтын функцэсвэл статистикийн тархалтын функц).

Тиймээс, тодорхойлолтоор

Онцлогийн хуваарилалтын функцийг санаарай ?, популяци нь үйл явдлын магадлалаар тодорхойлогддог (?

ба эмпирик хуваарилалтын функцээс ялгаатай нь гэж нэрлэдэг онолын тархалтын функц.Эмпирик тархалтын функц нь ижил үйл явдлын магадлал тул Бернулли теоремын дагуу (5.4-р хэсгийг үзнэ үү) түүврийн хэмжээ их байвал тэдгээр нь бие биенээсээ бага зэрэг ялгаатай байдаг.

Энд e нь дурын жижиг эерэг тоо юм.

(1.2) хамаарлаас харахад онолын тархалтын функц тодорхойгүй бол түүврээс олдсон эмпирик тархалтын функцийг түүний түүврийн үнэлгээ болгон ашиглаж болно. Томъёо (1.2)-аас нэгэн зэрэг энэ тооцоо нь нийцэж байна (Тодорхойлолт 2.4-ийг үзнэ үү).

Сэтгэгдэл 1.6. Хандлага nJnгэж бас тайлбарлаж болно хуваалцахТогтмол x тооны зүүн талд байрлах түүврийн гишүүд. Үүнийг co^ гэж тэмдэглэе.

Одоо салангид түүврийн эмпирик тархалтын функцийг байгуулах жишээг харцгаая.

Жишээ 1.2. Дээжийн тархалт мэдэгдэж байна (Хүснэгт 1.7).

Хүснэгт 1.7

Сонголт x.

Давтамж I.

Түүний эмпирик тархалтын функцийг байгуул.

Эхлээд түүврийн хэмжээг олъё:

Сонголт х х- хамгийн жижиг. Тийм ч учраас n x = 0 ба F*(x)= 0 үед X% 3, тэгвэл П z = 6, өөрөөр хэлбэл. цэгийн зүүн талд X= 3 зургаан түүврийн утга байна. Тиймээс, F*(3) = - = 0.12. Зүүн талд нь x = 5байрладаг

эхнэрүүд n x=5 = 6 + 9= 15 жишээ сонголт. Тийм ч учраас Fn(5) = - = 0.3. Тэгэхээр

Хэрхэн n x=1 = 6 + 9 + 18 = 33, тэгвэл Fn(7) = - = 0.66. Үүнтэй адил бид олдог

33 + 12 = 45. Тиймээс F* (9) = ^ = 0,9.

Сонголт x 5 = 9 нь хамгийн том нь юм. Иймд x > 9-ийн хувьд бүх түүвэр энэ x цэгийн зүүн талд байрлана. Тийм ч учраас n x>9= 50 ба F*(x) = -= 1 бол x > 9. 50

Тиймээс, дээр дурдсан тооцооллуудаас үзэхэд хүссэн эмпирик функц нь бүхэл бүтэн бодит тэнхлэгт тодорхойлогддог, хэсэгчилсэн тогтмол бөгөөд хэлбэртэй байна.

Энэ функцийн график нь алхам алхмаар дүрслэгдсэн бөгөөд Зураг дээр үзүүлэв. 1.6. ?

Үргэлжилсэн дээжийн эмпирик функцийг бий болгох асуултын хувьд энэ асуудлыг ерөнхийд нь хоёрдмол утгагүй байдлаар шийдсэн. Энэ нь эмпирик функцийн утгыг зөвхөн түүврийн популяцийг агуулсан үндсэн интервалыг хуваах хэсэгчилсэн интервалын төгсгөлийн цэгүүдээс л олох боломжтой байдагтай холбоотой юм. Гэхдээ хэсэгчилсэн интервалын дотоод цэгүүдэд энэ нь тодорхойлогдоогүй байна. Эдгээр цэгүүдэд үүнийг хэсэгчилсэн тогтмол функцээр (өмнөх жишээг харна уу) эсвэл нэмэгдэж буй тасралтгүй функцээр, жишээлбэл, шугаман функцээр тодорхойлно. Эмпирик тархалтын функцийг бий болгохын тулд шугаман ойролцооллыг ашигладаг.

Жишээ 1.3. Хүснэгт 1.3-аас харахад аж ахуйн нэгжийн ажилчдын ажилласан хугацааны туршид эмпирик хуваарилалтын функцийг ол.

Тодорхой байдлын хувьд бид авч үзэж буй хэсэгчилсэн интервалууд нь зүүн талд хаалттай, баруун талд нээлттэй байна гэж үздэг. тэдгээр нь зөвхөн зүүн үзүүрийг агуулдаг. x = 2. Дараа нь n 2 = 0 үйл явдал ба F*(2)= 0. Хэрэв x e (2; 6) бол энэ үед утга p xтодорхойгүй болсон бөгөөд түүнтэй хамт эмпирик функцийн утга тодорхойлогдоогүй байна. Жишээлбэл, хэрэв x = 3 бол асуудлын нөхцлөөс гурван жилээс доош ажлын туршлагатай ажилчдын тоог тодорхойлох боломжгүй юм. давтамжийг олж чадахгүй байна p xТиймээс F*(x).

Цаашилбал, үүнтэй төстэй үндэслэлээр бид шаардлагатай функцтэй гэдэгт итгэлтэй байна F*(x)Хэсэгчилсэн интервалын зүүн төгсгөлийн цэгүүдэд тодорхой утгыг авдаг, жишээлбэл: "6) = 4/100 = 0.04; "10) = 0.12; "14) = 0.24; "18) = 0.59; F*(22) = 0.78; "26) = 0.90"; "30) = 1, гэхдээ энэ нь хэсэгчилсэн интервалын дотоод цэгүүдэд тодорхойлогдоогүй байна. Асуудлыг эцэслэн шийдвэрлэхийн тулд хэсэгчилсэн интервалын дотоод цэгүүд дэх хүссэн функцийг хэсэгчилсэн тогтмол функцээр (Зураг 1.7) эсвэл зарим тасралтгүй нэмэгдэж буй функцээр (Зураг 1.8, хүссэн эмпирик функцийг өргөтгөсөн хэлбэрээр) тодорхойлно. шугаман функц). ?

Лекц 13. Санамсаргүй хэмжигдэхүүний статистик үнэлгээний тухай ойлголт

X тоон шинж чанарын статистик давтамжийн тархалтыг тодорхой болгоё.Тэр шинж чанарын утга х-ээс бага ажиглагдсан ажиглалтын тоогоор, нийт ажиглалтын тоог n-ээр тэмдэглэе. Мэдээжийн хэрэг, X үйл явдлын харьцангуй давтамж< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Эмпирик тархалтын функц(түүврийн тархалтын функц) нь X үйл явдлын харьцангуй давтамжийг х утга тус бүрээр тодорхойлдог функц юм< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

Түүврийн эмпирик тархалтын функцээс ялгаатай нь популяцийн тархалтын функцийг нэрлэдэг онолын тархалтын функц.Эдгээр функцүүдийн ялгаа нь онолын функцийг тодорхойлдог магадлалүйл явдал X< x, тогда как эмпирическая – харьцангуй давтамжижил үйл явдал.

n нэмэгдэх тусам X үйл явдлын харьцангуй давтамж< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Эмпирик тархалтын функцийн шинж чанарууд:

1) Эмпирик функцийн утгууд нь сегментэд хамаарна

2) - буурахгүй функц

3) Хэрэв хамгийн жижиг сонголт бол -ийн хувьд = 0, хэрэв хамгийн том сонголт бол = 1 байна.

Түүврийн эмпирик тархалтын функц нь популяцийн онолын тархалтын функцийг тооцоолоход үйлчилдэг.

Жишээ. Түүврийн тархалт дээр үндэслэн эмпирик функцийг байгуулъя:

Сонголтууд
Давтамжууд

Түүврийн хэмжээг олъё: 12+18+30=60. Хамгийн бага сонголт нь 2, тэгэхээр =0 нь x £ 2. x-ийн утга<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Тиймээс хүссэн эмпирик функц нь дараах хэлбэртэй байна.

Статистикийн тооцооллын хамгийн чухал шинж чанарууд

Нийт хүн амын зарим тоон шинж чанарыг судлах шаардлагатай байна. Онолын үндэслэлээр үүнийг тогтоох боломжтой гэж үзье яг аль ньтархалт нь тэмдэгтэй бөгөөд түүнийг тодорхойлсон параметрүүдийг тооцоолох шаардлагатай. Жишээлбэл, хэрэв судалж буй шинж чанар нь популяцид хэвийн тархсан бол математикийн хүлээлт ба стандарт хазайлтыг тооцоолох шаардлагатай; хэрэв шинж чанар нь Пуассоны тархалттай бол l параметрийг тооцоолох шаардлагатай.

Ихэвчлэн зөвхөн түүвэр мэдээлэл байдаг, жишээлбэл, n бие даасан ажиглалтын үр дүнд олж авсан тоон шинж чанарын утгууд. Бие даасан санамсаргүй хэмжигдэхүүн гэж үзвэл бид үүнийг хэлж чадна онолын тархалтын үл мэдэгдэх параметрийн статистик тооцоог олох гэж тооцоолсон параметрийн ойролцоо утгыг өгдөг ажиглагдсан санамсаргүй хэмжигдэхүүний функцийг олохыг хэлнэ. Жишээлбэл, хэвийн тархалтын математик хүлээлтийг тооцоолохын тулд функцийн үүргийг арифметик дундаж гүйцэтгэдэг.



Статистикийн тооцоолол нь тооцоолсон параметрүүдийн зөв ойролцоо байдлыг хангахын тулд тэдгээр нь тодорхой шаардлагыг хангасан байх ёстой бөгөөд үүнд хамгийн чухал нь тавигдах шаардлага юм. нүүлгэн шилжүүлээгүй Тэгээд төлбөрийн чадвар үнэлгээ.

Онолын тархалтын үл мэдэгдэх параметрийн статистик тооцоолол байг. n хэмжээтэй түүврээс тооцооллыг олъё. Туршилтыг давтъя, өөрөөр хэлбэл. Нийт хүн амын дундаас ижил хэмжээтэй өөр түүврийг гаргаж аваад түүний өгөгдөлд үндэслэн өөр тооцоо гаргая. Туршилтыг олон удаа давтаж, бид өөр өөр тоо авдаг. Оноог санамсаргүй хэмжигдэхүүн, тоог түүний боломжит утга гэж үзэж болно.

Хэрэв тооцоолол нь ойролцоо утгыг өгсөн бол элбэг дэлбэг, өөрөөр хэлбэл тоо бүр нь жинхэнэ утгаас их байх ба үүний үр дүнд санамсаргүй хэмжигдэхүүний математик хүлээлт (дундаж утга) нь:-ээс их байна. Үүний нэгэн адил, хэрэв энэ нь тооцоолсон бол сул талтай, Тэр .

Тиймээс, математикийн хүлээлт нь тооцоолсон параметртэй тэнцүү биш статистик тооцоог ашиглах нь системчилсэн (ижил тэмдэгт) алдаа гаргахад хүргэдэг. Хэрэв эсрэгээрээ энэ нь системчилсэн алдаанаас хамгаална.

Шударга бус Математикийн хүлээлт нь аливаа түүврийн хэмжээний тооцоолсон параметртэй тэнцүү байх статистик тооцоо гэж нэрлэдэг.

Нүүлгэн шилжүүлсэнэнэ нөхцлийг хангаагүй тооцоо гэж нэрлэдэг.

Тооцооллын шударга бус байдал нь тооцоолсон параметрийн сайн ойролцоо байдлыг баталгаажуулахгүй, учир нь боломжит утгууд байж болно. маш тараагдсан түүний дундаж утгын ойролцоо, өөрөөр хэлбэл. ялгаа нь мэдэгдэхүйц байж болно. Энэ тохиолдолд нэг түүврийн өгөгдлөөс олж авсан тооцоолол нь дундаж утгаас, улмаар тооцоолж буй параметрээс нэлээд хол байж болно.

Үр дүнтэй нь өгөгдсөн түүврийн хэмжээ n-тэй байх статистик тооцоолол юм боломжит хамгийн бага хэлбэлзэл .

Том түүврийг авч үзэхдээ статистик тооцоолол хийх шаардлагатай төлбөрийн чадвар .

Чинээлэг n®¥ нь тооцоолсон параметрт магадлалын хандлагатай байдаг тул статистик тооцоолол гэж нэрлэдэг. Жишээлбэл, хэрэв шударга бус үнэлгээний дисперс нь n®¥ гэж тэг болох хандлагатай байвал ийм тооцоо тогтмол болж хувирна.

Мэдэгдэж байгаагаар санамсаргүй хэмжигдэхүүний тархалтын хуулийг янз бүрийн аргаар тодорхойлж болно. Дискрет санамсаргүй хэмжигдэхүүнийг тархалтын цуваа эсвэл интеграл функцээр, тасралтгүй санамсаргүй хэмжигдэхүүнийг интеграл эсвэл дифференциал функцээр тодорхойлж болно. Эдгээр хоёр функцийн сонгомол аналогийг авч үзье.

Зарим санамсаргүй эзлэхүүний хувьсагчийн утгуудын түүвэр багц байг мөн энэ багцын сонголт бүр өөрийн давтамжтай холбоотой. Цааш нь өгье ямар нэг бодит тоо, мөн - санамсаргүй хэмжигдэхүүний түүврийн утгуудын тоо
, жижиг .Дараа нь тоо түүвэрт ажиглагдсан хэмжигдэхүүнүүдийн давтамж юм X, жижиг , тэдгээр. үйл явдлын давтамж
. Энэ нь өөрчлөгдөхөд xерөнхий тохиолдолд утга нь мөн өөрчлөгдөх болно . Энэ нь харьцангуй давтамжтай гэсэн үг юм нь аргументийн функц юм . Энэ функцийг туршилтын үр дүнд олж авсан түүвэр мэдээллээс олдог тул үүнийг сонгомол эсвэл гэж нэрлэдэг эмпирик.

Тодорхойлолт 10.15. Эмпирик тархалтын функц(түүврийн тархалтын функц) нь функц юм
, утга тус бүрийг тодорхойлох xүйл явдлын харьцангуй давтамж
.

(10.19)

Эмпирик түүврийн тархалтын функцээс ялгаатай нь тархалтын функц Ф(xнийт хүн амын ) гэж нэрлэдэг онолын тархалтын функц. Тэдний хоорондын ялгаа нь онолын функц юм Ф(x) үйл явдлын магадлалыг тодорхойлдог
, эмпирик нь ижил үйл явдлын харьцангуй давтамж юм. Бернуллигийн теоремоос энэ нь дараах байдалтай байна

,
(10.20)

тэдгээр. томоор магадлал
үйл явдлын харьцангуй давтамж
, өөрөөр хэлбэл
бие биенээсээ бага зэрэг ялгаатай. Эндээс харахад нийт хүн амын онолын (интеграл) тархалтын функцийг ойролцоогоор гаргахын тулд түүврийн эмпирик тархалтын функцийг ашиглах нь зүйтэй юм.

Чиг үүрэг
Тэгээд
ижил шинж чанартай байдаг. Энэ нь функцийн тодорхойлолтоос үүдэлтэй.

Үл хөдлөх хөрөнгө
:


Жишээ 10.4.Өгөгдсөн түүврийн тархалт дээр үндэслэн эмпирик функцийг байгуул.

Сонголтууд

Давтамжууд

Шийдэл:Түүврийн хэмжээг олцгооё n= 12+18+30=60. Хамгийн жижиг сонголт
, тиймээс,
цагт
. Утга
, тухайлбал
12 удаа ажиглагдсан тул:

=
цагт
.

Утга x< 10, тухайлбал
Тэгээд
12+18=30 удаа ажиглагдсан тул
=
цагт
. At

.

Шаардлагатай эмпирик хуваарилалтын функц:

=

Хуваарь
Зурагт үзүүлэв. 10.2

Р
байна. 10.2

Хяналтын асуултууд

1. Математик статистик ямар гол асуудлыг шийддэг вэ? 2. Ерөнхий болон түүвэр популяци? 3. Түүврийн хэмжээг тодорхойлох. 4. Ямар дээжийг төлөөлөх гэж нэрлэдэг вэ? 5. Төлөөлөгчийн алдаа. 6. Дээж авах үндсэн аргууд. 7. Давтамж, харьцангуй давтамжийн тухай ойлголт. 8. Статистикийн цувааны тухай ойлголт. 9. Стержсийн томьёог бич. 10. Түүврийн хүрээ, медиан, горимын тухай ойлголтыг томъёол. 11. Давтамжийн олон өнцөгт, гистограмм. 12. Түүврийн олонлогийн цэгийн үнэлгээний тухай ойлголт. 13. Нэг талыг барьсан ба шударга бус онооны тооцоо. 14. Түүврийн дундаж гэсэн ойлголтыг томъёол. 15. Түүврийн дисперсийн тухай ойлголтыг томъёол. 16. Түүврийн стандарт хазайлтын тухай ойлголтыг томъёол. 17. Түүврийн вариацын коэффициент гэсэн ойлголтыг томъёол. 18. Түүврийн геометрийн дундаж гэсэн ойлголтыг томъёол.

Хуваалцах: