SlideShare una empresa de Scribd logo
1 de 73
Бизнес статистикийн үндэс

Сэдэв 4
Хүснэгт, график дүрслэл,
тэдгээрийн хэрэглээ
Дэд сэдвүүд


Олон хэмжээст тоон өгөгдлийг хүснэгтлэх ба
диаграмм зурах





Давталттай тархалт: хүснэгт, гистограмм, полигон
Хуримтлагдсан тархалт: хүснэгт, огив

Хоёр хэмжээст тоон өгөгдлийг графикт дүрслэх
Дэд сэдвүүд


Олон хэмжээст категорийн өгөгдлийг
хүснэгтлэх ба графикт дүрслэх




Тэгш өнцөгт ба дугуй диаграмм, Pareto диаграмм

Хоёр хэмжээст категорийн өгөгдлийг
хүснэгтлэх ба графикт дүрслэх


Санамсаргүй үзэгдлийн хүснэгт





(үргэлжлэл)

Хоёр талт тэгш өнцөгт диаграмм

Өгөгдлийг илэрхийлэх графикийн төгс байдал
ба энгийн алдаанууд
Эдийн засгийн үзэгдлийг
илэрхийлэх аргууд





Үгээр илэрхийлэх
Тоон хүснэгтээр илэрхийлэх
Графикаар илэрхийлэх
Аналитик хэлбэрээр илэрхийлэх
Тоон өгөгдлийг хүснэгтлэх ба
графикт дүрслэх
Тоон өгөгдөл

Дараалласан
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

41, 24, 32, 26, 27, 27, 30, 24, 38, 21

Давталттай тархалт
Хуримтлагдсан тархалт

O give

120
100
80
60
40
20
0
10

Иш ба Навч
дэлгэц

2 144677
3 028
4 1

Гистограмм

20

30

6

Хүснэгт

Полигон

4
3
2
1
0
10

20

30

40

50

60

50

Огив

7

5

40

60
Тоон өгөгдлийн хүснэгт
Статистик хүснэгт бол тодорхой дэс
дараалал болон холбоо бүхий мөр баганын
систем юм.
Шинж чанараар нь статистик хүснэгтийг
энгийн, бүлэглэсэн, хосолсон гэж ангилдаг.
Хүснэгтэн доторхи нэр нь (баганын нэр)
үзүүлэлтүүдийн
нэр
(үгийг
товчлолгүйгээр) тэдгээрийг хэмжих
нэгжийг агуулдаг.
Тоон өгөгдлийн график
Статистик график нь тоон хэмжигдэхүүн



болон тэдгээрийн харьцааг шугам, геометр
дүрс, зураг, эсвэл газар зүйн карт схем
зэргээр дүрслэн үзүүлдэг.
Графикийг



байгуулах

аргаар

нь

диаграмм, кортограмм, каритодиаграмм гэж
Тоон өгөгдлийн график
Мэдээллийг дүрслэх хамгийн тархсан арга нь



диаграмм юм. Энэ нь янз бүрийн хэлбэртэй. Үүнд:
Шугаман, цэгэн, хавтгай, эзэлхүүнт, дүрсэн, дугуй.
Диаграммийн хэлбэр нь дүрсэлж буй мэдээллийн
хэлбэр (нэг, эсвэл хэд хэдэн үзүүлэлт, нэг хувьсагч,
хэд хэдэн хувьсагч, тоон эсвэл чанарын үзүүлэлт)
график байгуулах зорилгоос хамаарна.
Тоон өгөгдлийн график


Дискрет шинжтэй тархалтын цувааг
графикаар дүрслэн харуулахдаа полигоныг
ашиглана. Интервалын тархалтын цувааг
графикаар
дүрслэн
харуулахдаа
гистограммыг ашиглана. Өсөн нэмэгдэх
шууд болон урвуу давталтуудаар огивыг
байгуулна. Шууд өсөн нэмэгдэх давталтаар
байгуулсан огивыг "төдөөс бага", урвуу
өсөн нэмэгдэх давталтаар байгуулсан
огивыг "төдөөс их" гэж нэрлэнэ.
Тоон өгөгдлийг хүснэгтлэх:
Давталттай тархалт


Эмх цэгцгүй өгөгдлийг өсөх дарааллаар эрэмбэл:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58



Далайцыг олох: 58 - 12 = 46



Бүлгийн тоог сонгох: 5 (ихэвчлэн 5-аас 15-ын хооронд)
Бүлгийн интервалыг тооцох (width): 10 (46/5 then round



up)




Бүлгийн хилийг тодорхойлох (limits): 10, 20, 30, 40, 50, 60
Бүлгийн төвийг тооцох: 15, 25, 35, 45, 55
Ажиглалтыг тоолж бүлэглэлт хийх
Давталттай тархалт, Харьцангуй давталтын
тархалт ба Хувиарх тархалт

Дараалласан өгөгдөл:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Бүлэг
10 ба 20-иос бага
20 ба 30-аас бага
30 ба 40-өөс бага
40 ба 50-иас бага
50 ба 60-аас бага
Нийт

Харьцангуй
Давталт давталт
3
.15
6
.30
5
.25
4
.20
2
.10
20
1

Хувь
15
30
25
20
10
100
Тоон өгөгдлийн график:
Гистограмм
Дараалласан өгөгдөл:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

y
c
n
u
q
e
r
F

Histogram
7
6
5
4
3
2
1
0

6
5
3
2
0
5

Бүлгийн хил

Баганын
хооронд
зайгүй

4

0
15

25

36

45

Бүлгийн төв

55

More
Тоон өгөгдлийн график:
Давталттай полигон
Дараалласан өгөгдөл:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

y
c
n
u
q
e
r
F

Polygon
7
6
5
4
3
2
1
0
5

15

25

36

Бүлгийн төв

45

55

More
Тоон өгөгдлийг хүснэгтлэх:
Хуримтлагдсан давтамж
Дараалласан өгөгдөл:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Бүлэг
10 but under 20
20 but under 30
30 but under 40
40 but under 50
50 but under 60

Харьцангуй
Давталт %
3
9
14
18
20

Хуримтлагдсан
Давталт %
15
45
70
90
100
Тоон өгөгдлийн график:
Огив (Хуримтлагдсан % Полигон)
Дараалласан өгөгдөл:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Ogive
100
80
60
40
20
0
10

20

30

40

50

60

Бүлгийн хил (Бүлгийн төв биш)
Дискрет тархалтын цуваа
Ìýðãýæëèéí

Àæèë÷äûí òîî

ªñºí íýìýãäýõ äàâòàìæ

çýðýã Õ

Òîîãîîð f

Õóâèàð w

Øóóä Sf

Óðâóó Sfi

1

1

5

1

20

2

3

10

4

19

3

5

25

9

16

4

6

30

15

11

5

3

15

18

5

6

2

15

20

2

Ä¿í

20

100

-

-
Хоёр хэмжээст тоон өгөгдлийн
график (Scatter Plot)
Mutual Funds Scatter Plot
40
Total Year to
Date Return
(%)

30
20
10
0
0

10
20
30
Net Asset Values

40
Категорийн өгөгдлийн хүснэгт ба
график: Олон хэмжээст өгөгдөл
Категорийн
өгөгдөл

Өгөгдлийг
хүснэгтлэх
Хураангуй хүснэгт

Өгөгдлийн график

Дугуй диаграмм
Тэгш
өнцөгт
диаграмм

Парето
диаграмм
Хураангуй хүснэгт
(Хөрөнгө оруулагчийн богц)
Хөрөнгө оруулалтын
категор
Хувьцаа
Бонд
CD
Хадгаламж
Total

Дүн

(мянган $)

46.5
32
15.5
16
110

Категорийн хувьсагчид

Хувь
42.27
29.09
14.09
14.55
100
Категорийн өгөгдлийн график:
Олон хэмжээст өгөгдөл
Категорийн өгөгдөл

Өгөгдлийн график

Өгөгдлийг
хүснэгтлэх
Хураангуй хүснэгт

Дугуй диаграмм

CD
S avings
B onds
S toc k s
0

10

20

30

40

50

Тэгш
өнцөгт
диаграмм

Парето диаграмм
45

12 0

40

10 0

35
30

80

25

60

20
15

40

10

20

5
0

0
S toc k s

B ond s

S a vings

CD
Дөрвөлжин диаграмм
(Хөрөнгө оруулагчийн богц)
Investor's Portfolio
Savings
CD
Bonds
Stocks
0

10

20

30

Amount in K$

40

50
Дугуй диаграмм
(Хөрөнгө оруулагчийн богц)
Хөрөнгө оруулалтын дүн
Хадгаламж
15%
Хувьцаа
42%

CD
14%

Бонд
29%

Хувиудыг
ойролцоогоор
авсан
Парето диаграмм
45%

40%

Дөрвөлжин
диаграмм
нь категор
бүрийн
эзлэх хувь

100%

90%
80%

35%

70%
30%
60%
25%
50%
20%

Шулуун
график нь
хуримтлаг
дсан хувь

40%
15%
30%
10%

20%

5%

10%

0%

0%
Stocks

Bonds

Savings

CD
Хоёр хэмжээст категорийн
өгөгдлийн хүснэгт ба график


Санамсаргүй үзэгдлийн хүснэгт: хөрөнгө оруулалт мянган
доллараар

Investment
Category

Investor A

Investor B

Investor C

Total

Stocks
Bonds
CD
Savings

46.5
32
15.5
16

55
44
20
28

27.5
19
13.5
7

129
95
49
51

Total

110

147

67

324
Хоёр хэмжээст категорийн
өгөгдлийн хүснэгт ба график


Хоёр талт диаграмм
Comparing Investors
S avings
CD
B onds
S toc k s
0

10
Inves tor A

20

30
Inves tor B

40

50
Inves tor C

60
Төгс графикийн зарчмууд









Мөн
чанар,
статистик,
хэв
загварыг
тодорхойлохуйц өгөгдлийг илэрхийлэх
Нарийн, тодорхой, үр ашигтай цогц ойлголтыг
дамжуулах
Хамгийн үр ашигтай аргаар хамгийн олон
ойлголтыг өгөх
Гол чухал хэмжигдэхүүнүүдийг хамруулах
Өгөгдлийн тухай үнэнийг өгүүлэх
Өгөгдлийг илэрхийлэхэд
гардаг нийтлэг алдаа


Буруу диаграмм хэрэглэх



Бүлгүүдийн
хоорондох
өгөгдлийг
харьцуулахдаа
харьцангуй
хэмжигдэхүүн
хэрэглээгүйтэй холбоотой алдаа



Босоо тэнхлэгийг шахаж харуулах



Босоо тэнхлэгт тэг утгыг харуулахгүй байх
“Буруу диаграмм”
Муу танилцуулга

Сайн танилцуулга

Минимум цалин
1960: $1.00
1970: $1.60

Минимум цалин
4

$

2

1980: $3.10
0

1990: $3.80

1960

1970

1980

1990
Харьцангуй хэмжигдэхүүнд
суурилаагүй
Муу танилцуулга
Хүлээн авсан
Freq. оюутны тоо
300
200

 Сайн танилцуулга
30 %

Хүлээн авсан
оюутны тоо

20

100

10

0

0
FR SO

JR SR

FR SO JR SR

FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
Босоо тэнхлэгийг шахах
Муу танилцуулга
200

$

Улирлын
борлуулалт

Сайн танилцуулга

50

100

$

25

0

Улирлын
борлуулалт

0
Q1 Q2

Q3 Q4

Q1

Q2

Q3 Q4
Босоо тэнхлэгт тэг утга аваагүй
Муу танилцуулга
45

$

Сарын
борлуулалт

42
39

 Сайн танилцуулга
45
42
39

$

Сарын
борлуулалт

36

36
J F M A M J
Эхний 6 сарын борлуулалтыг
дүрслэв

0

J F M A M J
Нэг хувьсагчтай графикууд
1. Дугуй диаграмм

Үндэсний орлого

6%

6%

8%
12%
68%

Хөлсний
ажилчдын
цалин
Корпорацийн
ашиг
Өмч
эзэмшигчийн
орлого
Хүүгийн
орлого
Түрээсийн
орлого
2. Баганан диаграмм
3. Хугацааны диаграмм
Шалтгаан үр дагаврын
урвуу хамаарал

Цагдаагийн тоо нэмэгдсэнээр гэмт хэргийн тоо өссөн үү?
Гэмт хэргийн тоо өссөнөөр цагдаагийн тоо нэмэгдсэн үү?
Орхигдсон хувьсагчтай график

Гэрт тамхилагчдын тоо тогтмол байхад өвчний эрсдэл нэмэгдэж
байна. Энэ нь орхигдсон функц болох тамхи татах тоо нь их
болж байгаатай холбоотой нэмэгдэж байж болох юм.
Квантиль
Бие даасан ажиглалтын утгууд нь /дискрет
тархалт нь, i-р квартиль, j-р децил ба k-р
перцентиль нь дарааллаж байршина/ дараах
хамааралтай дискрет тархалттай байна
Qi =

i(n + 1)
th observation in the distribution, i = 1, 2, 3
4

j(n + 1)
th observation in the distribution, j = 1, 2, ,9
10
k(n + 1)
Pk =
th observation in the distribution, k = 1, 2,  ,99
100
Dj =
Квартиль
7 хоногт телевиз үзэх давтамж (цаг):
25 41 27 32 43 66 35 31 15 5
34 26 32 38 16 30 38 30 20 21

Дээрх өгөгдлийг дарааллуулж бичвэл:

5 15 16 20 21 25 26 27 30 30
31 32 32 34 35 37 38 41 43 66
Квартиль
1(20 + 1)
Q1 =
th observation in the distribution
4
= 5.25th observation in the distribution
= 5th obs. + 0.25{6th obs. - 5th obs.}
= 21 + 0.25{25 - 21} = 22.0 Hours
Квартиль
2(20 + 1)
Q2 =
th observation in the distribution
4
= 10.50 th observation in the distribution
= 10 th obs. + 0.50{11th obs. - 10th obs.}
= 30 + 0.50{31 - 30} = 30.5 Hours
Квартиль
Inter-quartile Range (IQR)

Inter-quartile range = 3rd quartile – 1st Quartile
Q3 - Q1

IQR is independent of outliers
Inter-quartile Range
X

minimum

25%
12

Q1

Median
(Q2)

25%
30

Q3
25%

45

57

Inter-quartile Range (IQR)
= 57 – 30 = 27

X

maximum

25%
70
Five Number Summary
The weekly TV viewing times (in hours).
25
34

41 27
26 32

32
38

43 66
16 30

35
38

31 15
30 20

5
21

The array of the above data is given below:

5
15 16 20 21 25 26 27 30 30
31 32 32 34 35 37 38 41 43 66
Five Number Summary
LOCATION of Q1 ;

1(20 + 1)
4

th obs. in the data = 5.25th obs.

VALUE of Q1 ; 5th obs. + 0.25{6th obs. - 5th obs.} = 21 + 0.25{25 - 21} = 22.0 Hrs

LOCATION of Q 2 ;
VALUE of Q2

2(20 + 1)
4

th obs. in the data = 10.50 th obs.

;10 th obs. + 0.50{11th obs. - 10th obs.} = 30 + 0.50{31 - 30} = 30.5 Hrs

LOCATION of Q 3 ;

3(20 + 1)
4

th obs. in the data = 15.75th obs.

VALUE of Q 3 ; 15th obs + 0.75 {16th obs - 15th obs} = 35 + 0.75{37 - 35} = 36.5 Hrs

Minimum value=5.0

Maximum value=66.0
Box and Whisker Diagram
A box and whisker diagram or box-plot is a
graphical mean for displaying the five number
summary of a set of data. In a box-plot the first
quartile is placed at the lower hinge and the
third quartile is placed at the upper hinge. The
median is placed in between these two hinges.
The two lines emanating from the box are
called whiskers. The box and whisker diagram
was introduced by Professor Jhon W. Tukey.
Construction of Box-Plot Max
Valu
1.

2.

3.

4.

Start the box from Q1 and end at
Q3
Within the box draw a line to
represent Q2
Draw lower whisker to Min. Value
up to Q1
Draw upper Whisker from Q3 up
to Max. Value

e
Q3

Q2

Q1
Min
Value
70

Construction of Box-Plot
1.
2.
3.
4.

Q1=22.0 Q3=36.5
Q2=30.5
Minimum Value=5.0
Maximum Value=66.0

60
50
40
30
20
70

Interpretation of Box-Plot
Box-Whisker Plot is useful to identify

60

•Maximum and Minimum Values in the data
•Median of the data

50

•IQR=Q3-Q1,
Lengthy box indicates more variability in the data
•Shape of the data From Position of line within box
Line At the center of the box----Symmetrical
skewed

Line above center of the box----Negatively
Line below center of the box----Positively Skewed

•Detection of Outliers in the data

40
30
20
Outliers
An outlier is the values that falls well outside the overall
pattern of the data. It might be
•
•
•

the result of a measurement or recording error,
a member from a different population,
simply an unusual extreme value.

An extreme value needs not to be an outliers; it might,
instead, be an indication of skewness.
Inner and Outer Fences
If

Q1=22.0
Q3=36.5

Q2=30.5

Lower Inner Fence = Q1 − 1.5( IQR ) = 0.25
Inner Fences : 
Upper Inner Fence = Q 3 + 1.5( IQR ) = 58.25

Lower Outer Fence = Q1 − 3( IQR ) = −21.5
Outer Fences : 
Upper Outer Fence = Q 3 + 3( IQR ) = 80.0
80

Identification of the Outliers

70

1. The values that lie within inner
fences are normal values
2. The values that lie outside inner
fences but inside outer fences
are
possible/suspected/mild
outliers
3. The values that lie outside outer
fences are sure outliers

60

Only
66 is a
mild
outlier

Plot each suspected outliers with an asterisk
and each sure outliers with an hollow dot.

50
40
30
20
10
0

*
Uses of Box and Whisker Diagram
Box plots are
especially suitable for
comparing two or more
data sets. In such a
situation the box plots
are constructed on the
same scale.
Male

Female
Standardized Variable








A variable that has mean “0” and Variance “1” is
called standardized variable
Values of standardized variable are called standard
scores
Values of standard variable i.e standard scores are
unit-less
Construction

Variable − Mean of Variable
Z=
Standard Deviation of Variable
Standardized Variable
X

( X − X )2

3

25

-1.3624 1.8561

6

4

-0.5450 0.2970

Z

(Z − Z ) 2

11

9

0.81741 0.6682

12

16

1.0899

32

54

0

1.1879

4.009

Variable Z has mean “0” and

X
2
Sx

∑X
=

=

32
=8
4

n
54
=
=13.5
4

Z=

X− X X−8
=
Sx
3.67

∑Z
Z =
2
Sz

=0

n
4.009
=
≅1
4

variance “1” so Z is a standard
variable.
X − X 11 − 8
Z=
=
= 0.8174
3.67
Standard Score at X=11 is Sx
The Empirical Rule
68.26%
X ± 1S contains about 68.26% of values

X
X ± 1S

X ± 2S contains about 95.45% of values

95.45%

X ± 2S
99.73%

X ± 3S

X ± 3S contains about 99.73% of values
Measures of

Skewness

A distribution in which the values
equidistant from the centre have
equal frequencies is defined to be
symmetrical and any departure from
symmetry is called skewness.
1. Length of Right Tail = Length of Left
Tail
2. Mean = Median = Mode
3. Sk=0
a) Sk=(Mean-Mode)/SD
b) Sk=(Q3-2Q2+Q1)/(Q3-Q1)
Measures of Skewness
A distribution is positively skewed, if the
observations tend to concentrate more at
the lower end of the possible values of the
variable than the upper end. A positively
skewed frequency curve has a longer tail
on the right hand side
1. Length of Right Tail > Length of Left
Tail
2. Mean > Median > Mode
3. SK>0
Measures of Skewness
A distribution is negatively skewed, if
the observations tend to concentrate
more at the upper end of the possible
values of the variable than the lower
end. A negatively skewed frequency
curve has a longer tail on the left side.
1. Length of Right Tail < Length of Left
Tail
2. Mean < Median < Mode
3. SK< 0
Measures of Kurtosis
•

•

•

The Kurtosis is the degree of peakedness or flatness of a
unimodal (single humped) distribution,
When the values of a variable are highly concentrated around
the mode, the peak of the curve becomes relatively high; the
curve is Leptokurtic.
When the values of a variable have low concentration
around the mode, the peak of the curve becomes relatively
flat;curve is Platykurtic.
A curve, which is neither very peaked nor very flat-toped, it
is taken as a basis for comparison, is called
Mesokurtic/Normal.
Measures of
Kurtosis
Measures of Kurtosis
Coefficient of Kurtosis=

n ∑ ( X-X )

4

2 2

 ( X-X ) 
∑


1. If Coefficient of Kurtosis > 3 ----------------- Leptokurtic.
2. If Coefficient of Kurtosis = 3 ----------------- Mesokurtic.
3. If Coefficient of Kurtosis < 3 ----------------- is Platykurtic.
Histograms and Bar Charts
To help students distinguish
the
histogram from the simple bar chart,
for the data here is the example from
page 39 of the Histograms Chapter
(Chapter 3) which also mentions the
advantage of the histogram for larger
data sets.
Histogram, Box Plot, and CDF
To compare and contrast these three
basic exploratory charts, here is the
example from page 83 of Chapter 4
on Landmark Summaries.
Probability Trees
Probability is less
mysterious to
students when
there is a visual
framework, as
shown here in the
example from page
144 of Chapter 6.
Bivariate Data Examples
Relationships and regression are powerful
business concepts. Here are a couple of the
examples from Chapter 11 on Bivariate
Data (pages 295 and 308).
Magazine Ads and Multiple Regression
The cost of advertising can be explained,
in part, by magazine characteristics such
as audience size and income level in this
example that is used to illustrate the
power of multiple regression in business,
from Chapter 12.
Excel Guide

The Excel Guide goes step-by-step
through, chapter by chapter, to show
students how Excel can be used to obtain
statistical results. Here is the scatterplot
example from page 82 of the Excel Guide.
Сэдвийн дүгнэлт
• Тоон өгөгдлийг цэгцлэх
– Дараалласан тархалт ба иш-навч дэлгэц

• Олон хэмжээст тоон өгөгдлийн хүснэгт ба
график
– Давталттай тархалт: хүснэгт, гистограмм,
полигон
– Хуримтлагдсан тархалт: хүснэгт ба огив

• Хоёр хэмжээст тоон өгөгдлийн график
Сэдвийн дүгнэлт

(үргэлжлэл)

• Олон хэмжээст категорийн өгөгдлийн
хүснэгт ба график
– Хураангуй хүснэгт
– Тэгш өнцөгт ба дугуй диаграмм, Парето
диаграмм

• Хоёр хэмжээст категорийн өгөгдлийн
хүснэгт ба график
– Санамсаргүй үзэгдлийн хүснэгт
– Хоёр талт диаграмм

• Төгс график болон өгөгдлийг илэрхийлэхэд
гардаг нийтлэг алдааны талаар хэлэлцсэн
Анхаарал тавьсанд
баярлалаа

Más contenido relacionado

Destacado (20)

3 numerical descriptive measures
3 numerical descriptive measures3 numerical descriptive measures
3 numerical descriptive measures
 
To rs middle income group in mic_mon_final
To rs middle income group in mic_mon_finalTo rs middle income group in mic_mon_final
To rs middle income group in mic_mon_final
 
Regression for hdi & gdp
Regression for hdi & gdpRegression for hdi & gdp
Regression for hdi & gdp
 
SIW - Index
SIW - IndexSIW - Index
SIW - Index
 
Tuuverlelt
TuuverleltTuuverlelt
Tuuverlelt
 
Ulirliin nuluulultei hugatsaanii tsuvaag tegshitgeh
Ulirliin nuluulultei hugatsaanii tsuvaag tegshitgehUlirliin nuluulultei hugatsaanii tsuvaag tegshitgeh
Ulirliin nuluulultei hugatsaanii tsuvaag tegshitgeh
 
Lecture 3
Lecture 3Lecture 3
Lecture 3
 
Soril 1 onoo 2014 havar
Soril 1 onoo 2014 havarSoril 1 onoo 2014 havar
Soril 1 onoo 2014 havar
 
Biy daaltiin tsag
Biy daaltiin tsagBiy daaltiin tsag
Biy daaltiin tsag
 
Basic01
Basic01Basic01
Basic01
 
Basic02
Basic02Basic02
Basic02
 
Basic03
Basic03Basic03
Basic03
 
Lecture 3,4 loose ends
Lecture 3,4  loose endsLecture 3,4  loose ends
Lecture 3,4 loose ends
 
Lecture 3,4 dcf analysis
Lecture 3,4  dcf analysisLecture 3,4  dcf analysis
Lecture 3,4 dcf analysis
 
Session 1 introduction to valuation
Session 1  introduction to valuationSession 1  introduction to valuation
Session 1 introduction to valuation
 
50 bodlogo
50 bodlogo50 bodlogo
50 bodlogo
 
семинарын хичээл 1
семинарын хичээл 1семинарын хичээл 1
семинарын хичээл 1
 
International financial management standard
International financial management standardInternational financial management standard
International financial management standard
 
Soril 1
Soril 1Soril 1
Soril 1
 
Lecture 5,6 ratio analysis
Lecture 5,6 ratio analysisLecture 5,6 ratio analysis
Lecture 5,6 ratio analysis
 

Lecture 4

  • 1. Бизнес статистикийн үндэс Сэдэв 4 Хүснэгт, график дүрслэл, тэдгээрийн хэрэглээ
  • 2. Дэд сэдвүүд  Олон хэмжээст тоон өгөгдлийг хүснэгтлэх ба диаграмм зурах    Давталттай тархалт: хүснэгт, гистограмм, полигон Хуримтлагдсан тархалт: хүснэгт, огив Хоёр хэмжээст тоон өгөгдлийг графикт дүрслэх
  • 3. Дэд сэдвүүд  Олон хэмжээст категорийн өгөгдлийг хүснэгтлэх ба графикт дүрслэх   Тэгш өнцөгт ба дугуй диаграмм, Pareto диаграмм Хоёр хэмжээст категорийн өгөгдлийг хүснэгтлэх ба графикт дүрслэх  Санамсаргүй үзэгдлийн хүснэгт   (үргэлжлэл) Хоёр талт тэгш өнцөгт диаграмм Өгөгдлийг илэрхийлэх графикийн төгс байдал ба энгийн алдаанууд
  • 4. Эдийн засгийн үзэгдлийг илэрхийлэх аргууд     Үгээр илэрхийлэх Тоон хүснэгтээр илэрхийлэх Графикаар илэрхийлэх Аналитик хэлбэрээр илэрхийлэх
  • 5. Тоон өгөгдлийг хүснэгтлэх ба графикт дүрслэх Тоон өгөгдөл Дараалласан 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 41, 24, 32, 26, 27, 27, 30, 24, 38, 21 Давталттай тархалт Хуримтлагдсан тархалт O give 120 100 80 60 40 20 0 10 Иш ба Навч дэлгэц 2 144677 3 028 4 1 Гистограмм 20 30 6 Хүснэгт Полигон 4 3 2 1 0 10 20 30 40 50 60 50 Огив 7 5 40 60
  • 6. Тоон өгөгдлийн хүснэгт Статистик хүснэгт бол тодорхой дэс дараалал болон холбоо бүхий мөр баганын систем юм. Шинж чанараар нь статистик хүснэгтийг энгийн, бүлэглэсэн, хосолсон гэж ангилдаг. Хүснэгтэн доторхи нэр нь (баганын нэр) үзүүлэлтүүдийн нэр (үгийг товчлолгүйгээр) тэдгээрийг хэмжих нэгжийг агуулдаг.
  • 7. Тоон өгөгдлийн график Статистик график нь тоон хэмжигдэхүүн  болон тэдгээрийн харьцааг шугам, геометр дүрс, зураг, эсвэл газар зүйн карт схем зэргээр дүрслэн үзүүлдэг. Графикийг  байгуулах аргаар нь диаграмм, кортограмм, каритодиаграмм гэж
  • 8. Тоон өгөгдлийн график Мэдээллийг дүрслэх хамгийн тархсан арга нь  диаграмм юм. Энэ нь янз бүрийн хэлбэртэй. Үүнд: Шугаман, цэгэн, хавтгай, эзэлхүүнт, дүрсэн, дугуй. Диаграммийн хэлбэр нь дүрсэлж буй мэдээллийн хэлбэр (нэг, эсвэл хэд хэдэн үзүүлэлт, нэг хувьсагч, хэд хэдэн хувьсагч, тоон эсвэл чанарын үзүүлэлт) график байгуулах зорилгоос хамаарна.
  • 9. Тоон өгөгдлийн график  Дискрет шинжтэй тархалтын цувааг графикаар дүрслэн харуулахдаа полигоныг ашиглана. Интервалын тархалтын цувааг графикаар дүрслэн харуулахдаа гистограммыг ашиглана. Өсөн нэмэгдэх шууд болон урвуу давталтуудаар огивыг байгуулна. Шууд өсөн нэмэгдэх давталтаар байгуулсан огивыг "төдөөс бага", урвуу өсөн нэмэгдэх давталтаар байгуулсан огивыг "төдөөс их" гэж нэрлэнэ.
  • 10. Тоон өгөгдлийг хүснэгтлэх: Давталттай тархалт  Эмх цэгцгүй өгөгдлийг өсөх дарааллаар эрэмбэл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58  Далайцыг олох: 58 - 12 = 46  Бүлгийн тоог сонгох: 5 (ихэвчлэн 5-аас 15-ын хооронд) Бүлгийн интервалыг тооцох (width): 10 (46/5 then round  up)    Бүлгийн хилийг тодорхойлох (limits): 10, 20, 30, 40, 50, 60 Бүлгийн төвийг тооцох: 15, 25, 35, 45, 55 Ажиглалтыг тоолж бүлэглэлт хийх
  • 11. Давталттай тархалт, Харьцангуй давталтын тархалт ба Хувиарх тархалт Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Бүлэг 10 ба 20-иос бага 20 ба 30-аас бага 30 ба 40-өөс бага 40 ба 50-иас бага 50 ба 60-аас бага Нийт Харьцангуй Давталт давталт 3 .15 6 .30 5 .25 4 .20 2 .10 20 1 Хувь 15 30 25 20 10 100
  • 12. Тоон өгөгдлийн график: Гистограмм Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 y c n u q e r F Histogram 7 6 5 4 3 2 1 0 6 5 3 2 0 5 Бүлгийн хил Баганын хооронд зайгүй 4 0 15 25 36 45 Бүлгийн төв 55 More
  • 13. Тоон өгөгдлийн график: Давталттай полигон Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 y c n u q e r F Polygon 7 6 5 4 3 2 1 0 5 15 25 36 Бүлгийн төв 45 55 More
  • 14. Тоон өгөгдлийг хүснэгтлэх: Хуримтлагдсан давтамж Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Бүлэг 10 but under 20 20 but under 30 30 but under 40 40 but under 50 50 but under 60 Харьцангуй Давталт % 3 9 14 18 20 Хуримтлагдсан Давталт % 15 45 70 90 100
  • 15. Тоон өгөгдлийн график: Огив (Хуримтлагдсан % Полигон) Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Ogive 100 80 60 40 20 0 10 20 30 40 50 60 Бүлгийн хил (Бүлгийн төв биш)
  • 16. Дискрет тархалтын цуваа Ìýðãýæëèéí Àæèë÷äûí òîî ªñºí íýìýãäýõ äàâòàìæ çýðýã Õ Òîîãîîð f Õóâèàð w Øóóä Sf Óðâóó Sfi 1 1 5 1 20 2 3 10 4 19 3 5 25 9 16 4 6 30 15 11 5 3 15 18 5 6 2 15 20 2 Ä¿í 20 100 - -
  • 17.
  • 18.
  • 19. Хоёр хэмжээст тоон өгөгдлийн график (Scatter Plot) Mutual Funds Scatter Plot 40 Total Year to Date Return (%) 30 20 10 0 0 10 20 30 Net Asset Values 40
  • 20. Категорийн өгөгдлийн хүснэгт ба график: Олон хэмжээст өгөгдөл Категорийн өгөгдөл Өгөгдлийг хүснэгтлэх Хураангуй хүснэгт Өгөгдлийн график Дугуй диаграмм Тэгш өнцөгт диаграмм Парето диаграмм
  • 21. Хураангуй хүснэгт (Хөрөнгө оруулагчийн богц) Хөрөнгө оруулалтын категор Хувьцаа Бонд CD Хадгаламж Total Дүн (мянган $) 46.5 32 15.5 16 110 Категорийн хувьсагчид Хувь 42.27 29.09 14.09 14.55 100
  • 22. Категорийн өгөгдлийн график: Олон хэмжээст өгөгдөл Категорийн өгөгдөл Өгөгдлийн график Өгөгдлийг хүснэгтлэх Хураангуй хүснэгт Дугуй диаграмм CD S avings B onds S toc k s 0 10 20 30 40 50 Тэгш өнцөгт диаграмм Парето диаграмм 45 12 0 40 10 0 35 30 80 25 60 20 15 40 10 20 5 0 0 S toc k s B ond s S a vings CD
  • 23. Дөрвөлжин диаграмм (Хөрөнгө оруулагчийн богц) Investor's Portfolio Savings CD Bonds Stocks 0 10 20 30 Amount in K$ 40 50
  • 24. Дугуй диаграмм (Хөрөнгө оруулагчийн богц) Хөрөнгө оруулалтын дүн Хадгаламж 15% Хувьцаа 42% CD 14% Бонд 29% Хувиудыг ойролцоогоор авсан
  • 25. Парето диаграмм 45% 40% Дөрвөлжин диаграмм нь категор бүрийн эзлэх хувь 100% 90% 80% 35% 70% 30% 60% 25% 50% 20% Шулуун график нь хуримтлаг дсан хувь 40% 15% 30% 10% 20% 5% 10% 0% 0% Stocks Bonds Savings CD
  • 26. Хоёр хэмжээст категорийн өгөгдлийн хүснэгт ба график  Санамсаргүй үзэгдлийн хүснэгт: хөрөнгө оруулалт мянган доллараар Investment Category Investor A Investor B Investor C Total Stocks Bonds CD Savings 46.5 32 15.5 16 55 44 20 28 27.5 19 13.5 7 129 95 49 51 Total 110 147 67 324
  • 27. Хоёр хэмжээст категорийн өгөгдлийн хүснэгт ба график  Хоёр талт диаграмм Comparing Investors S avings CD B onds S toc k s 0 10 Inves tor A 20 30 Inves tor B 40 50 Inves tor C 60
  • 28. Төгс графикийн зарчмууд      Мөн чанар, статистик, хэв загварыг тодорхойлохуйц өгөгдлийг илэрхийлэх Нарийн, тодорхой, үр ашигтай цогц ойлголтыг дамжуулах Хамгийн үр ашигтай аргаар хамгийн олон ойлголтыг өгөх Гол чухал хэмжигдэхүүнүүдийг хамруулах Өгөгдлийн тухай үнэнийг өгүүлэх
  • 29. Өгөгдлийг илэрхийлэхэд гардаг нийтлэг алдаа  Буруу диаграмм хэрэглэх  Бүлгүүдийн хоорондох өгөгдлийг харьцуулахдаа харьцангуй хэмжигдэхүүн хэрэглээгүйтэй холбоотой алдаа  Босоо тэнхлэгийг шахаж харуулах  Босоо тэнхлэгт тэг утгыг харуулахгүй байх
  • 30. “Буруу диаграмм” Муу танилцуулга Сайн танилцуулга Минимум цалин 1960: $1.00 1970: $1.60 Минимум цалин 4 $ 2 1980: $3.10 0 1990: $3.80 1960 1970 1980 1990
  • 31. Харьцангуй хэмжигдэхүүнд суурилаагүй Муу танилцуулга Хүлээн авсан Freq. оюутны тоо 300 200  Сайн танилцуулга 30 % Хүлээн авсан оюутны тоо 20 100 10 0 0 FR SO JR SR FR SO JR SR FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
  • 32. Босоо тэнхлэгийг шахах Муу танилцуулга 200 $ Улирлын борлуулалт Сайн танилцуулга  50 100 $ 25 0 Улирлын борлуулалт 0 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4
  • 33. Босоо тэнхлэгт тэг утга аваагүй Муу танилцуулга 45 $ Сарын борлуулалт 42 39  Сайн танилцуулга 45 42 39 $ Сарын борлуулалт 36 36 J F M A M J Эхний 6 сарын борлуулалтыг дүрслэв 0 J F M A M J
  • 34. Нэг хувьсагчтай графикууд 1. Дугуй диаграмм Үндэсний орлого 6% 6% 8% 12% 68% Хөлсний ажилчдын цалин Корпорацийн ашиг Өмч эзэмшигчийн орлого Хүүгийн орлого Түрээсийн орлого
  • 37. Шалтгаан үр дагаврын урвуу хамаарал Цагдаагийн тоо нэмэгдсэнээр гэмт хэргийн тоо өссөн үү? Гэмт хэргийн тоо өссөнөөр цагдаагийн тоо нэмэгдсэн үү?
  • 38. Орхигдсон хувьсагчтай график Гэрт тамхилагчдын тоо тогтмол байхад өвчний эрсдэл нэмэгдэж байна. Энэ нь орхигдсон функц болох тамхи татах тоо нь их болж байгаатай холбоотой нэмэгдэж байж болох юм.
  • 39. Квантиль Бие даасан ажиглалтын утгууд нь /дискрет тархалт нь, i-р квартиль, j-р децил ба k-р перцентиль нь дарааллаж байршина/ дараах хамааралтай дискрет тархалттай байна Qi = i(n + 1) th observation in the distribution, i = 1, 2, 3 4 j(n + 1) th observation in the distribution, j = 1, 2, ,9 10 k(n + 1) Pk = th observation in the distribution, k = 1, 2,  ,99 100 Dj =
  • 40. Квартиль 7 хоногт телевиз үзэх давтамж (цаг): 25 41 27 32 43 66 35 31 15 5 34 26 32 38 16 30 38 30 20 21 Дээрх өгөгдлийг дарааллуулж бичвэл: 5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 37 38 41 43 66
  • 41. Квартиль 1(20 + 1) Q1 = th observation in the distribution 4 = 5.25th observation in the distribution = 5th obs. + 0.25{6th obs. - 5th obs.} = 21 + 0.25{25 - 21} = 22.0 Hours
  • 42. Квартиль 2(20 + 1) Q2 = th observation in the distribution 4 = 10.50 th observation in the distribution = 10 th obs. + 0.50{11th obs. - 10th obs.} = 30 + 0.50{31 - 30} = 30.5 Hours
  • 44. Inter-quartile Range (IQR) Inter-quartile range = 3rd quartile – 1st Quartile Q3 - Q1 IQR is independent of outliers
  • 46. Five Number Summary The weekly TV viewing times (in hours). 25 34 41 27 26 32 32 38 43 66 16 30 35 38 31 15 30 20 5 21 The array of the above data is given below: 5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 37 38 41 43 66
  • 47. Five Number Summary LOCATION of Q1 ; 1(20 + 1) 4 th obs. in the data = 5.25th obs. VALUE of Q1 ; 5th obs. + 0.25{6th obs. - 5th obs.} = 21 + 0.25{25 - 21} = 22.0 Hrs LOCATION of Q 2 ; VALUE of Q2 2(20 + 1) 4 th obs. in the data = 10.50 th obs. ;10 th obs. + 0.50{11th obs. - 10th obs.} = 30 + 0.50{31 - 30} = 30.5 Hrs LOCATION of Q 3 ; 3(20 + 1) 4 th obs. in the data = 15.75th obs. VALUE of Q 3 ; 15th obs + 0.75 {16th obs - 15th obs} = 35 + 0.75{37 - 35} = 36.5 Hrs Minimum value=5.0 Maximum value=66.0
  • 48. Box and Whisker Diagram A box and whisker diagram or box-plot is a graphical mean for displaying the five number summary of a set of data. In a box-plot the first quartile is placed at the lower hinge and the third quartile is placed at the upper hinge. The median is placed in between these two hinges. The two lines emanating from the box are called whiskers. The box and whisker diagram was introduced by Professor Jhon W. Tukey.
  • 49. Construction of Box-Plot Max Valu 1. 2. 3. 4. Start the box from Q1 and end at Q3 Within the box draw a line to represent Q2 Draw lower whisker to Min. Value up to Q1 Draw upper Whisker from Q3 up to Max. Value e Q3 Q2 Q1 Min Value
  • 50. 70 Construction of Box-Plot 1. 2. 3. 4. Q1=22.0 Q3=36.5 Q2=30.5 Minimum Value=5.0 Maximum Value=66.0 60 50 40 30 20
  • 51. 70 Interpretation of Box-Plot Box-Whisker Plot is useful to identify 60 •Maximum and Minimum Values in the data •Median of the data 50 •IQR=Q3-Q1, Lengthy box indicates more variability in the data •Shape of the data From Position of line within box Line At the center of the box----Symmetrical skewed Line above center of the box----Negatively Line below center of the box----Positively Skewed •Detection of Outliers in the data 40 30 20
  • 52. Outliers An outlier is the values that falls well outside the overall pattern of the data. It might be • • • the result of a measurement or recording error, a member from a different population, simply an unusual extreme value. An extreme value needs not to be an outliers; it might, instead, be an indication of skewness.
  • 53. Inner and Outer Fences If Q1=22.0 Q3=36.5 Q2=30.5 Lower Inner Fence = Q1 − 1.5( IQR ) = 0.25 Inner Fences :  Upper Inner Fence = Q 3 + 1.5( IQR ) = 58.25 Lower Outer Fence = Q1 − 3( IQR ) = −21.5 Outer Fences :  Upper Outer Fence = Q 3 + 3( IQR ) = 80.0
  • 54. 80 Identification of the Outliers 70 1. The values that lie within inner fences are normal values 2. The values that lie outside inner fences but inside outer fences are possible/suspected/mild outliers 3. The values that lie outside outer fences are sure outliers 60 Only 66 is a mild outlier Plot each suspected outliers with an asterisk and each sure outliers with an hollow dot. 50 40 30 20 10 0 *
  • 55. Uses of Box and Whisker Diagram Box plots are especially suitable for comparing two or more data sets. In such a situation the box plots are constructed on the same scale. Male Female
  • 56. Standardized Variable     A variable that has mean “0” and Variance “1” is called standardized variable Values of standardized variable are called standard scores Values of standard variable i.e standard scores are unit-less Construction Variable − Mean of Variable Z= Standard Deviation of Variable
  • 57. Standardized Variable X ( X − X )2 3 25 -1.3624 1.8561 6 4 -0.5450 0.2970 Z (Z − Z ) 2 11 9 0.81741 0.6682 12 16 1.0899 32 54 0 1.1879 4.009 Variable Z has mean “0” and X 2 Sx ∑X = = 32 =8 4 n 54 = =13.5 4 Z= X− X X−8 = Sx 3.67 ∑Z Z = 2 Sz =0 n 4.009 = ≅1 4 variance “1” so Z is a standard variable. X − X 11 − 8 Z= = = 0.8174 3.67 Standard Score at X=11 is Sx
  • 58. The Empirical Rule 68.26% X ± 1S contains about 68.26% of values X X ± 1S X ± 2S contains about 95.45% of values 95.45% X ± 2S 99.73% X ± 3S X ± 3S contains about 99.73% of values
  • 59. Measures of Skewness A distribution in which the values equidistant from the centre have equal frequencies is defined to be symmetrical and any departure from symmetry is called skewness. 1. Length of Right Tail = Length of Left Tail 2. Mean = Median = Mode 3. Sk=0 a) Sk=(Mean-Mode)/SD b) Sk=(Q3-2Q2+Q1)/(Q3-Q1)
  • 60. Measures of Skewness A distribution is positively skewed, if the observations tend to concentrate more at the lower end of the possible values of the variable than the upper end. A positively skewed frequency curve has a longer tail on the right hand side 1. Length of Right Tail > Length of Left Tail 2. Mean > Median > Mode 3. SK>0
  • 61. Measures of Skewness A distribution is negatively skewed, if the observations tend to concentrate more at the upper end of the possible values of the variable than the lower end. A negatively skewed frequency curve has a longer tail on the left side. 1. Length of Right Tail < Length of Left Tail 2. Mean < Median < Mode 3. SK< 0
  • 62. Measures of Kurtosis • • • The Kurtosis is the degree of peakedness or flatness of a unimodal (single humped) distribution, When the values of a variable are highly concentrated around the mode, the peak of the curve becomes relatively high; the curve is Leptokurtic. When the values of a variable have low concentration around the mode, the peak of the curve becomes relatively flat;curve is Platykurtic. A curve, which is neither very peaked nor very flat-toped, it is taken as a basis for comparison, is called Mesokurtic/Normal.
  • 64. Measures of Kurtosis Coefficient of Kurtosis= n ∑ ( X-X ) 4 2 2  ( X-X )  ∑  1. If Coefficient of Kurtosis > 3 ----------------- Leptokurtic. 2. If Coefficient of Kurtosis = 3 ----------------- Mesokurtic. 3. If Coefficient of Kurtosis < 3 ----------------- is Platykurtic.
  • 65. Histograms and Bar Charts To help students distinguish the histogram from the simple bar chart, for the data here is the example from page 39 of the Histograms Chapter (Chapter 3) which also mentions the advantage of the histogram for larger data sets.
  • 66. Histogram, Box Plot, and CDF To compare and contrast these three basic exploratory charts, here is the example from page 83 of Chapter 4 on Landmark Summaries.
  • 67. Probability Trees Probability is less mysterious to students when there is a visual framework, as shown here in the example from page 144 of Chapter 6.
  • 68. Bivariate Data Examples Relationships and regression are powerful business concepts. Here are a couple of the examples from Chapter 11 on Bivariate Data (pages 295 and 308).
  • 69. Magazine Ads and Multiple Regression The cost of advertising can be explained, in part, by magazine characteristics such as audience size and income level in this example that is used to illustrate the power of multiple regression in business, from Chapter 12.
  • 70. Excel Guide The Excel Guide goes step-by-step through, chapter by chapter, to show students how Excel can be used to obtain statistical results. Here is the scatterplot example from page 82 of the Excel Guide.
  • 71. Сэдвийн дүгнэлт • Тоон өгөгдлийг цэгцлэх – Дараалласан тархалт ба иш-навч дэлгэц • Олон хэмжээст тоон өгөгдлийн хүснэгт ба график – Давталттай тархалт: хүснэгт, гистограмм, полигон – Хуримтлагдсан тархалт: хүснэгт ба огив • Хоёр хэмжээст тоон өгөгдлийн график
  • 72. Сэдвийн дүгнэлт (үргэлжлэл) • Олон хэмжээст категорийн өгөгдлийн хүснэгт ба график – Хураангуй хүснэгт – Тэгш өнцөгт ба дугуй диаграмм, Парето диаграмм • Хоёр хэмжээст категорийн өгөгдлийн хүснэгт ба график – Санамсаргүй үзэгдлийн хүснэгт – Хоёр талт диаграмм • Төгс график болон өгөгдлийг илэрхийлэхэд гардаг нийтлэг алдааны талаар хэлэлцсэн