Quti diagramma
Tasviriy statistikada
quti diagramma yoki
quti chizmasi raqamli maʼlumotlarning joylashuvi, tarqalishi va egrilik guruhlarini ularning kvartillari orqali grafik koʻrsatish usuli hisoblanadi. Quti hududidagi qutiga qoʻshimcha ravishda, qutidan yuqori va pastki kvartillardan tashqaridagi oʻzgaruvchanlikni koʻrsatadigan chiziqlar (ular bakenbarda deb ataladi) boʻlishi mumkin, shuning uchun uchastka quti va bakenbardali uchastka deb ham ataladi.
Maʼlumotlar toʻplamining qolgan qismidan sezilarli darajada farq qiluvchi chegaralar qutidagi bakenbardadan tashqari alohida nuqtalar sifatida chizilishi mumkin. Qutidagi chizmalar parametrik emas: ular asosiy statistik taqsimot haqida hech qanday taxminlarsiz statistik populyatsiya namunalarida oʻzgaruvchanlikni koʻrsatadi (garchi
Tukey ning qutisi bakenbarda uchun simmetriyani va ularning uzunligi uchun normallikni nazarda tutsada). Quti-syujetning har bir kichik boʻlimidagi intervallar maʼlumotlarning tarqalishi (tarqalishi) va egrilik darajasini koʻrsatadi, ular odatda besh raqamli xulosa yordamida tavsiflanadi. Bunga qoʻshimcha ravishda, quti syujeti turli L-baholovchilarni, xususan, kvartillar oraligʻi, oʻrta diapazon, diapazon, oʻrta diapazon va trimeanni vizual ravishda baholashga imkon beradi.
Qutili diagramma gorizontal yoki vertikal ravishda chizilgan boʻlishi mumkin.
Tarixi
Diapazon-bar usuli birinchi marta
Mary Eleanor Spear tomonidan 1952-yilda "Charting Statistics" kitobida va yana 1969-yilda "Amaliy grafik uslublari" kitobida ishlatilgan. Box-and-whisker chizmasi birinchi marta 1970-yilda
John Tukey tomonidan kiritilgan bo'lib, u keyinchalik 1977-yilda
"Exploratory Data Analysis" kitobida nashr etilgan.
Elementlari
Quti diagramma - bu besh raqamli xulosaga asoslangan ma'lumotlar to'plamini ko'rsatishning standartlashtirilgan usuli: minimal, maksimal, namunaviy mediana va birinchi va uchinchi kvartillar.
Quti uchastkasini qurish uchun foydalaniladigan minimal va maksimal qiymatlarga qo'shimcha ravishda, quti uchastkasini olish uchun ishlatilishi mumkin bo'lgan yana bir muhim element quyida ko'rsatilganidek, kvartillararo diapazondir (IQR):
IQR
=
Q
3
−
Q
1
=
q
n
(
0.75
)
−
q
n
(
0.25
)
{\displaystyle {\text{IQR}}=Q_{3}-Q_{1}=q_{n}(0.75)-q_{n}(0.25)}
Misollar
Cheksiz misollar
Kun davomida bir qator soatlik harorat Farengeyt darajasida oʻlchandi. Yozilgan qiymatlar quyidagi tartibda keltirilgan (°F): 57, 57, 57, 58, 63, 66, 66, 67, 67, 68, 69, 70, 70, 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 81.
Maʼlumotlar toʻplamining quti chizmasi birinchi navbatda ushbu maʼlumotlar toʻplamining beshta tegishli qiymatini hisoblash orqali yaratilishi mumkin: minimal, maksimal, median (Q2), birinchi kvartil (Q1) va uchinchi kvartil (Q3).
Minimal — maʼlumotlar toʻplamining eng kichik soni. Bunday holda, minimal qayd etilgan kunlik harorat 57 ° F ni tashkil qiladi.
Maksimal - maʼlumotlar toʻplamining eng katta soni. Bunday holda, maksimal qayd etilgan kunlik harorat 81 ° F ni tashkil qiladi.
Median — bu tartiblangan maʼlumotlar toʻplamining „oʻrta“ raqami. Bu shuni anglatadiki, elementlarning aniq 50 % medianadan kichikroq va elementlarning 50 % medianadan kattaroqdir. Ushbu tartiblangan maʼlumotlar toʻplamining mediani 70 ° F.
Birinchi kvartil qiymati (Q1 yoki 25 foiz) buyurtma qilingan maʼlumotlar toʻplamining toʻrtdan birini belgilaydigan raqamdir. Boshqacha qilib aytganda, birinchi kvartildan kichik boʻlgan elementlarning aniq 25 % va undan katta boʻlgan elementlarning aniq 75 % mavjud. Birinchi kvartil qiymatini minimal va mediana orasidagi „oʻrta“ raqamni topish orqali osongina aniqlash mumkin. Soatlik haroratlar uchun 57 °F va 70 °F orasida topilgan „oʻrta“ raqam 66 °F ni tashkil qiladi.
Uchinchi kvartil qiymati (Q3 yoki 75-persentil) buyurtma qilingan maʼlumotlar toʻplamining toʻrtdan uch qismini belgilaydigan raqamdir. Boshqacha qilib aytganda, uchinchi kvartildan kichik boʻlgan elementlarning aniq 75 % va undan katta boʻlgan elementlarning 25 % mavjud. Uchinchi kvartil qiymatini median va maksimal oʻrtasidagi „oʻrta“ raqamni topish orqali osongina olish mumkin. Soatlik haroratlar uchun 70 ° F va 81 ° F orasidagi „oʻrta“ raqam 75 ° F ni tashkil qiladi.
Kvartallararo diapazon ni yoki
IQR ni uchinchi kvartil qiymatidan (Q3) birinchi kvartil qiymatini (Q1) ayirish yoʻli bilan hisoblash mumkin:
IQR
=
Q
3
−
Q
1
=
75
∘
F
−
66
∘
F
=
9
∘
F
.
{\displaystyle {\text{IQR}}=Q_{3}-Q_{1}=75^{\circ }F-66^{\circ }F=9^{\circ }F.}
Shuning uchun
1.5
IQR
=
1.5
⋅
9
∘
F
=
13.5
∘
F
.
{\displaystyle 1.5{\text{IQR}}=1.5\cdot 9^{\circ }F=13.5^{\circ }F.}
Uchinchi kvartildan yuqori 1,5
IQR :
Q
3
+
1.5
IQR
=
75
∘
F
+
13.5
∘
F
=
88.5
∘
F
.
{\displaystyle Q_{3}+1.5{\text{ IQR}}=75^{\circ }F+13.5^{\circ }F=88.5^{\circ }F.}
Birinchi kvartildan past 1,5
IQR :
Q
1
−
1.5
IQR
=
66
∘
F
−
13.5
∘
F
=
52.5
∘
F
.
{\displaystyle Q_{1}-1.5{\text{ IQR}}=66^{\circ }F-13.5^{\circ }F=52.5^{\circ }F.}
Qutidagi uchastkaning yuqori moʻylov chegarasi uchinchi kvartildan 1,5 IQR yuqori boʻlgan eng katta maʼlumotlar qiymatidir. Bu erda uchinchi kvartildan 1,5 IQR 88,5 °F va maksimal 81 °F ni tashkil qiladi. Shuning uchun, yuqori moʻylov 81 ° F boʻlgan maksimal qiymatda chiziladi. Xuddi shunday, quti uchastkasining pastki moʻylov chegarasi birinchi kvartildan 1,5 IQR ostida boʻlgan eng kichik maʼlumotlar qiymatidir. Bu erda birinchi kvartildan pastda 1,5 IQR 52,5 °F, minimal esa 57 °F. Shuning uchun, pastki moʻylov 57 ° F boʻlgan minimal qiymatda chiziladi.
Chegarali misollar
Yuqorida istisnosiz misol keltirilgan. Bu erda chegaraviy qiymatlar bilan quti chizmasini yaratish uchun keyingi misol:
Ro'yxatga olingan haroratlar uchun tartiblangan to'plam (°F): 52, 57, 57, 58, 63, 66, 66, 67, 67, 68, 69, 70, 70, 70, 70, 72, 73, 75, 75 , 76, 76, 78, 79, 89.
Ushbu misolda faqat birinchi va oxirgi raqam o'zgartiriladi. Median, uchinchi chorak va birinchi chorak bir xil bo'lib qoladi.
Bunday holda, ushbu ma'lumotlar to'plamidagi maksimal qiymat 89 ° F va uchinchi kvartildan 1,5 IQR 88,5 ° F ni tashkil qiladi. Maksimal qiymat 1,5 IQR va uchinchi kvartildan kattaroqdir, shuning uchun maksimal chegara hisoblanadi. Shuning uchun, yuqori mo'ylov uchinchi kvartildan 1,5 IQR dan kichikroq eng katta qiymatda chiziladi, bu 79 ° F.
Xuddi shunday, ushbu ma'lumotlar to'plamidagi minimal qiymat 52 °F va birinchi kvartildan pastda 1,5 IQR 52,5 °F. Minimal 1,5 IQR minus birinchi kvartildan kichikroq, shuning uchun minimal qiymat ham chetga chiqadi. Shuning uchun, pastki mo'ylov birinchi kvartildan 1,5 IQR dan kattaroq eng kichik qiymatda chiziladi, bu 57 ° F.
Katta maʼlumot toʻplamlari
Koʻp sonli maʼlumotlar nuqtalarini oʻz ichiga olgan maʼlumotlar toʻplamidan quti syujetini olish uchun qoʻshimcha misol:
Empirik kvantlarni hisoblash uchun umumiy tenglama q
n
(
p
)
=
x
(
k
)
+
α
(
x
(
k
+
1
)
−
x
(
k
)
)
{\displaystyle q_{n}(p)=x_{(k)}+\alpha (x_{(k+1)}-x_{(k)})}
bilan
k
=
[
p
(
n
+
1
)
]
and
α
=
p
(
n
+
1
)
−
k
{\displaystyle {\text{bilan }}k=[p(n+1)]{\text{ and }}\alpha =p(n+1)-k}
Ushbu maʼlumotlar nuqtalarining umumiy tartibini bildiradi.
Yuqoridagi misoldan foydalanib, 24 ta maʼlumot nuqtasi (n = 24), medianani, birinchi va uchinchi kvartilni matematik yoki vizual tarzda hisoblash mumkin.
Mediana :
q
n
(
0.5
)
=
x
(
12
)
+
(
0.5
⋅
25
−
12
)
⋅
(
x
(
13
)
−
x
(
12
)
)
=
70
+
(
0.5
⋅
25
−
12
)
⋅
(
70
−
70
)
=
70
∘
F
{\displaystyle q_{n}(0.5)=x_{(12)}+(0.5\cdot 25-12)\cdot (x_{(13)}-x_{(12)})=70+(0.5\cdot 25-12)\cdot (70-70)=70^{\circ }F}
Birinchi kvartil :
q
n
(
0.25
)
=
x
(
6
)
+
(
0.25
⋅
25
−
6
)
⋅
(
x
(
7
)
−
x
(
6
)
)
=
66
+
(
0.25
⋅
25
−
6
)
⋅
(
66
−
66
)
=
66
∘
F
{\displaystyle q_{n}(0.25)=x_{(6)}+(0.25\cdot 25-6)\cdot (x_{(7)}-x_{(6)})=66+(0.25\cdot 25-6)\cdot (66-66)=66^{\circ }F}
Uchinchi kvartil :
q
n
(
0.75
)
=
x
(
18
)
+
(
0.75
⋅
25
−
18
)
⋅
(
x
(
19
)
−
x
(
18
)
)
=
75
+
(
0.75
⋅
25
−
18
)
⋅
(
75
−
75
)
=
75
∘
F
{\displaystyle q_{n}(0.75)=x_{(18)}+(0.75\cdot 25-18)\cdot (x_{(19)}-x_{(18)})=75+(0.75\cdot 25-18)\cdot (75-75)=75^{\circ }F}
Vizualizatsiya
Garchi quti syujetlari gistogramma yoki yadro zichligi taxminlaridan ko'ra ibtidoiy ko'rinishi mumkin bo'lsa-da, ular bir qator afzalliklarga ega. Birinchidan, quti diagrammasi statistiklarga bir yoki bir nechta ma'lumotlar to'plamida tezkor grafik tekshiruv o'tkazish imkonini beradi.
Qutidagi chizmalar ham kamroq joy egallaydi va shuning uchun bir nechta guruhlar yoki ma'lumotlar to'plami o'rtasidagi taqsimotlarni parallel ravishda solishtirish uchun ayniqsa foydalidir.
Nihoyat, gistogrammalarning umumiy tuzilishi va yadro zichligi bahosi mos ravishda qutilarning soni va kengligi texnikasini tanlash va tarmoqli kengligi tanlash bilan kuchli ta'sir qilishi mumkin.
Statistik taqsimotni ko'rib chiqish quti grafigiga qaraganda keng tarqalgan bo'lsa-da, normal N(0,s2) taqsimot uchun quti grafigini ehtimollik zichligi funksiyasi (nazariy gistogramma) bilan solishtirish va ularning xususiyatlarini bevosita kuzatish foydali bo'lishi mumkin.
Manbalar
Havolalar
uz.wikipedia.org