경찰학(警察學)2019. 4. 9. 22:56
반응형

사례3.

 

교통국장은 교통교육의 효과를 알아보기 위하여 교육을 이수한 사람과 그렇지 않은 사람과의 법규위반여부를 조사하였다. 만약, 교통교육의 준법운전에 대한 효과가 없다면 교통교육을 폐지하거나 축소할 방침이다. 

3-1. 자료를 이용하여 2X2교차표를 만들고 기대빈도와 관측빈도를 구할 것. 

3-2. 여러분이 교통국장이라면 교통안전교육을 존속, 강화하겠는가 아니면 폐지, 축소하겠는가? 95% 신뢰수준에서 검증할 것. (여기서 0은 교육미이수를 한 자, 그리고 교통법규위반이 없는 자이며 1은 교육 이수자, 그리고 법규위반경험이 있는 자를 의미한다.)

 

<문제의 소재>

교통교육 이수 여부에 따라 교통법규위반 여부가 영향을 받는지 알아보려는 것 이므로, 어떤 모집단에서 어떤 속성을 가진 것의 비율과 가지고 있지 않는 것의 비율에 따라 또 다른 속성을 가진 비율과 그렇지 않은 비율 간의 상관관계 여부 를 조사하는 카이스퀘어 검정을 하면 된다.

 

<검정의 원리>

카이스퀘어 검정은 모집단에서 각각의 속성이 나타나는 비율에 따른 기대빈도와 실체로 관측된 실제빈도간의 차이를 비교 검정하여 각각의 속성이 독립적인지 연 관성이 있는지 알아본다.

문제 3에서는 교통교육의 이수여부와 교통법규위반사이 의 기대빈도와 실제로 관측된 관측빈도 사이의 상관관계를 조사하는 것이다.

 

<문제의 해결>

<표 3-1> 은 교차분석한 결과인 2 X 2 교차표를 나타낸다. 각각의 속성의 분포 비율과 그에 따른 기대빈도, 실제로 관측된 관측빈도와 각 열과 행의 합을 나타 낸 2X2 교차표이다.

기대빈도가 도출되는 과정은 간단하다. 첫 행, 첫 열의 실제 빈도인 18과 기대빈도 21.3이 나온 과정을 살펴보면, 전체 74개의 표본 중에 법 규위반을 하지 않은 자의 비율은 35/74 에 해당하고 다시 전체 74개의 표본 중 에 교육이수를 받지 않은 자의 비율은 45/74에 해당한다.

따라서 교통법규위반 여부와 교통교육이수 여부가 독립적이라면 교통법규를 위반하지 않고 교육을 이 수받지 않은 자의 비율은 (35/74)*(45/74) 가 될 것이고 이에 따른 기대빈도는 21.3 이 된다.

 

 

 

<표 3-2>는 카이스퀘어 검정 결과이다. 카이스퀘어 값은 2.453임을 알 수 있다. 이는

식을 이용한다.

카이스퀘어 값을 구한 다음에는 자유도를 구해서 카이스퀘어 분할표의 유의도를 파악한다. 자유도는 (2-1)(2-1)=1이 된다. 카이스퀘어 표에 의거해 귀무가설(교통교육이수여부와 교통법규위반여부는 독립적이다.)의 귀각여부를 결정한다.

문제 3의 경우, 자유도는 1, 카으스퀘어 값은 2.453이므로 유의수준(P)은 0.117 정도가 된다. 따라서 신뢰수준 95%에서 P=0.117 > 0.05 이므로 귀무가설을 채택한다. 즉, 교통교육이수여부와 교통법규위 반여부는 독립적이다.

 

 

<결론>

교통교육이수여부와 교통법규위반여부는 그 연관성을 인정할 수 없이 독립적 이므로(신뢰수준 95%) 교통국장은 교통안전교육을 축소하는 한편 교통법규위반을 줄이기 위한 다른 방법을 모색해야 한다.

반응형
Posted by CCIBOMB
경찰학(警察學)2019. 4. 9. 22:08
반응형

사례4.

 

 

경찰청장은 음주운전 횟수에 따라 혈중 알코올 농도가 높아지면 현행보다 더 처벌을 강화하려고 도로교통법을 개정하려고 하고 있다. 교통과장은 음주운전자의 음주횟수에 따른 혈중 알코올 농도변화를 알아보기 위하여 음주횟수(1, 2, 3)에 따라 각 10명씩을 뽑아 혈중 알코올 농도를 조사하여 경찰청장에게 보고하였다. 경찰청장은 음주운전 횟수가 많은 운전자를 더 강하게 처벌하는 도로교통법을 개정할 수 있는가? (90%신뢰수준에서 검증할 것.)

 

 

- 분산분석을 이용한 검정 -

<문제의 소재>

음주운전 횟수가 증가할수록 혈중 알코올 농도가 증가하는지 여부를 판별하여 야 한다.

데이터의 경우, 음주횟수가 각각 1회, 2회, 3회로서, 집단 세 개로 나누어 질 수 있으므로, 해당 집단간 차이가 유의한지 분산분석(Analysis of variance : ANOVA)으로 확인하면 될 것이다.

종속변수인 혈중 알코올 농도(%)에 영향을 미치는 독립변수는 음주횟수(회) 1개이므로, 일원 분산 분석(one-way ANOVA)을 통 해 각 집단에 따라 혈중 알코올 농도의 차이가 있는지 알아보겠다.

 

<검정의 원리>

1. 분산분석의 의의

셋 이상의 집단들의 평균들이 서로 차이가 있는지를 검정할 때 이용되는 통계 방법을 분산분석이라고 한다. 분산분석은 주로 비계량적인 독립변수(명목척도)와 계량적인 종속변수(등간 혹은 비율 척도) 사이의 관계를 파악하는 데 이용된다.

분산 분석의 귀무가설은 집단들의 집단 평균값이 모두 동일하다는 것이며, 대립 가설은 집단 평균값이 동일하지 않다는 것이다. 여기서 주의할 것은 귀무가설에서 보는 바와 같이 분산 분석은 다수의 모집단 의 평균의 동일성 여부를 총괄적으로 검정하는 것이며, 개별적인 모집단의 평균 이나 두 모집단의 평균차를 검정하는 것이 아니라는 것이다.

 

2. 분산분석의 원리

분산분석은 독립변수에 의해 구분된 집단들이 동일한 집단인지 아닌지를 분산의 개념을 이용해 검정하는 통계적 분석 방법이다. 일반적으로 모든 실험은 여러 가지 요인들에 의해 영향을 받는데, 분산분석은 실험에서 관측된 변동량(문제 4의 경우, 혈중 알코올농도)을 분산의 개념으로 파악한 다음, 이러한 분산을 체계적 분산과 오차분산에 의한 부분으로 구분해 비교함으로써, 각 요인의 영향력 유무 에 관한 판단을 하는 것이다.

즉, 관측된 변동량은 요인간의 차이(처리 변동)과 우 연적인 변동(오차 변동)의 합이며, 전체분산은 집단 간 분산과 집단 내 분산의 합 이다. 분산분석에서는 가설의 검정을 위해 F 검정 통계량을 사용한다. F검정이란 집단 간의 차이가 있음을 검정하기 위해 집단 간 평균 분산을 집단 내 평균 분산으로 나눈 값이며, F 분포는 자유도값에 좌우된다.

분산 분석에서 집단 간 차이가 유의 하기 위해서는 (즉, 문제 4에서 음주횟수에 따라 혈중 알코올 농도의 차이가 있기 위해서는) 집단 내의 변이는 가능한 한 작아야 하고, 집단 간의 변이는 가능한 한 커야 한다.

 

3. 일원 분산 분석(one-way ANOVA)

독립변수의 개수가 1개인 경우 일원 분산 분석을 이용하므로, 문제 4의 경우 독립변수로서 음주운전횟수만을 가정하고 있으므로 이를 통해 파악이 가능하다.

문제 4의 경우, 집단을 나타내는 변수(분류 변수)인 음주운전횟수가 요인(factor) 혹은 인자(effects)가 되고, 음주운전횟수 1,2,3회는 분류 집단이 된다.

 

 

<문제의 해결>

귀무가설 : 음주횟수 1회, 2회, 3회 각각의 평균이 모두 같다.

대립가설 : 귀무가설 평균 중에서 적어도 두 모집단의 평균은 서로 같지 않다.

SPSS 통계 패키지를 이용해 일원 분산 분석을 실시하기 위해서는 독립변수와 종속변수가 하나이고, 독립변수는 명목수준, 종속 변수는 등간수준 이상이어야 한 다. 또한 표본이 정규성과 등분산성을 충족할 수 있어야 한다. 문제 4의 데이터는 전자의 조건을 만족하고 있으며, 후자의 조건을 충족하는지 검증할 필요가 있다.

아래의 <표 4-1>은 기술통계량으로서 음주운전횟수 1,2,3별 표본 개수, 평균, 표준 편차, 평균에 대한 95% 신뢰 구간 등의 정보를 알 수 있다.

 

<표 4-2>는 분산의 동질성에 대한 검정으로서 유의 수준 P = 0.028 < 0.10 이므로, 각 집단의 분산이 동일하다는 귀무가설을 기각해야 한다. 즉, 각 집단의 분산이 동일하지 않으므로 현재의 자료가 분산 분석을 하는 데 통계적으로 문제가 있다는 것을 의미한다.

 

 

<표 4-3>은 음주운전횟수에 따른 알코올농도의 차이에 대한 분산 분석 결과이 다. 집단 간의 차이를 검정하는 F 검정 통계량의 유의수준 P = 0.112 > 0.10 이므 로 귀무가설을 채택할 수 있다. 즉, 음주운전횟수에 따른 알코올농도는 통계적으 로 차이가 없다고 할 수 있어, 음주운전횟수가 많은 운전자에게 가중처벌을 할 수 없다. 그러나, 위의 <표 4-2>에서 보는 바와 같이, 분산의 동질성 검정 결과, 각 집단의 분산이 동일하지 않아, 분산분석 자체의 시행이 무의미하다.

 

 

<결론>

분산분석이 유용하기 위해서는 표본이 무작위적으로 추출되었으며, 모집단은 동일한 분산을 가지고 있다는 가정을 충족시켜야 한다. 현재의 분석하고 있는 자 료가 이러한 가정을 충족시키는지를 알아보기 위해 Levene 통계량을 사용하였다.

Levene 통계량의 유의확률이 0.10보다 클수록(P>0.1) 모집단의 분산이 동일하다는 귀무가설이 채택된다. 그러나 문제 4의 데이터의 경우, 유의확률이 0.1보다 작아 자료를 이용하지 않는 것이 좋다. 따라서 데이터가 분산분석을 행하기에, <그림 4-1>과 같이 유의미한 비교결과가 있는 듯 보이더라도 분산분석결과는 차이가 없다고 나오는 등, 이는 통계적으로 무의미하므로 유의미한 분산분석을 위해서는 데이터 수집을 다시 하여야 한다.

 

 

 

- 상관분석을 이용한 검정 -

<문제의 소재>

문제 4의 데이터를 음주운전횟수에 따라 세 집단으로 나누어, 분산분석을 통 해 각각의 평균이 동일한지 여부를 판단하려 했으나, 위의 분산분석 결과 각 집단의 분산의 동질성이 동일하지 않아 분산분석을 할 수 없었다.

그러나 <그림 4- 1>에서 보는 바와 같이 두 변수간의 상관관계가 있을 것으로 예상되어, 상관분석 을 통해 그 상관관계를 알아보고, 그 관계가 있다면 회귀분석으로 독립변수(음주 운전횟수)가 종속변수(혈중알코올농도)에 미치는 영향을 예측하고자 한다.

 

<검정의 원리>

상관분석

상관분석은 연구목적에 해당하는 변수의 관계를 중심적으로 살펴보는 것이므 로, 다른 변수에 의해서 생겨난 관련성을 확인할 수는 없다. 문제 4에서 주어진 데이터로, 음주운전횟수가 증가할수록 혈중알코올농도가 높아진다는 문제를 검정하기 위해서 두 변수의 상관관계를 알아본다.

하지만 혈중알코올농도가 높은 자가 실제로 음주운전횟수가 많기 때문인지 그 여부는 밝혀내기 힘들다. 따라서 상관분석을 할 때에는 연구하고자 하는 목적에 정확한 변수를 설정하는 것이 바람직하다. 또한 상관분석은 두 변수간의 관련된 정도나 방향만을 의미하는 것이지 어떤 변수가 영향을 주는가에 대한 인과관계를 보여주지 못한다.

변수의 관계란 그 관련성의 정도와 방향을 의미하는데, Pearson의 R과 같은 상관계수에 의해서 판단할 수 있다. 상관계수의 해석은 관련 정도를 알아보기 위해서는 절대값으로 표현되는 수치를 보면 되고, 방향은 수치의 부호(+,-)를 가 지고 해석한다.

 

<문제의 해결>

표 4-4는 기술통계표로서, 음주횟수의 경우 각각 1, 2, 3회인 경우를 10개의 Case를 수집한 것이므로 평균은 2가 되고, 알코올 농도는 평균 0.0864로 나타났다.

표 4-5의 상관계수는 대각선 방향으로 대칭이 같게 구성되어 있는데, 어느 한쪽 방향의 계수만을 확인하면 된다. 첫 번째 줄의 두 번째 칸을 보면 두 변수간의 관계에 대한 Pearson 상관계수와 유의확률, N(빈도)이 나와있다.

음주운전횟수와 혈중알코올농도 간의 상관관계계수는 0.386으로 약간의 관련성(0.2~0.39)을 가진다 고 할 수 있다. 또한 유의확률 값을 보면 0.035로 유의수준 10%에서 볼 때 두 변수간의 상관관계가 유의미한 관계라는 것을 알 수 있다.

다시 말하면, 약간의 관련성을 가지고 있으며, 이 관계는 통계적으로 의미가 있는 것이라고 할 수 있다.

따라서 음주운전횟수가 많을수록 혈중알코올농도가 높다고 할 수 있으므로, 음주운전횟수가 많은 위반자들을 가중처벌을 하려는 도로교통법 개정법에 근거가 된다.

 

 

 

 

- 회귀분석을 이용한 검정 -

<문제의 소재>

회귀분석은 독립변수(음주운전횟수)가 종속변수(혈중알코올농도)에 미치는 영향력이 얼마나 되는가를 알아보기 위해 사용한다. 회귀분석의 경우 회귀분석을 위 한 가정을 지켜야 한다. 특히, 종속변수와 독립변수가 모두 연속형의 변수이어야 한다.

더미(Dummy) 변수를 사용하는 등의 특별한 경우가 아니면 반드시 지켜야 한다. 문제 4의 경우, 종속변수인 혈중알코올농도는 연속형의 변수이고, 독립변수인 음주운전횟수는 더미(Dummy) 변수보다는 등간 척도에 가까우며, 이 둘간의 관계가 직선의 관계를 가지므로 회귀분석이 가능할 것으로 가정하였다.

 

<문제의 해결>

다음의 표는 모형의 설명력을 나타내는 표인데, R 제곱 값을 통해서 이 회귀모 형이 전체 자료를 얼마나 잘 설명하고 있는가를 보여준다. 문제 4에서 R 제곱 값 은 0.149로서 실제로 조사된 관측값을 현재의 이 모형은 14.9%정도 설명하고 있 다는 것이다. 회귀직선은 실제 관측값에서 가상으로 계산된 모형이므로 그 모형 자체가 관측값을 얼마나 대변하고 있는가를 알 수 있는 것이다. 현재의 R 제곱값은 높지 않은 값으로, 실제 조사된 관측값을 잘 설명하고 있지는 못하다고 할 수 있다. 

 

 

다음으로 회귀모형이 통계적으로 적합한지에 대한 검정을 하는 것으로 ANOVA 분석을 하여 그 결과가 유의미하면 적합하다고 판단한다. 여기에서는 F값이 4.902 이고 P값(sig값이 0.035)이 0.1보다 낮기 때문에 이 회귀모형이 적합하다고 판단하 여 그대로 사용할 수 있다.

 

 

마지막으로 회귀계수와 상수값을 표시하고 있는데, 이를 식으로 표현하면 다음과 같다.

혈중알코올농도(Y) = 0.057 + 0.015 * 음주운전횟수(X)

 

 

<결론>

혈중알코올농도는 음주운전횟수가 1회씩 증가할 때 0.015(%)씩 증가한다고 해석하면 된다.

따라서 위의 회귀분석 결과가 음주운전횟수가 많은 위반자를 가중처벌하는 도로교통법 개정안의 근거가 될 수는 있으나, 회귀분석 식이 조사된 관측값을 잘 설명하고 있지 못하므로 그 타당성이 문제될 수 있다.

반응형
Posted by CCIBOMB
경찰학(警察學)2019. 4. 9. 21:49
반응형

사례2.

 

도로공사 영업점 중에서 경부고속도로 칠곡영업소가 관할하는 구역은 교통사고 발생률이 가장 높은 곳이다. 소장은 왜 교통사고가 많이 발생하는 가를 알기 위하여 고민하던 중 그 지점을 통과하는 차량의 속도가 다른 지점보다 높은 것이 아닌가 하는 의문을 갖게 되었다. 그는 자기 관할지점을 통과하는 차량의 속도를 측정하면서 전국 고속도로의 차량의 평균 통과속도를 날짜별로 정리하였다. 칠곡지점을 통과하는 차량의 속도가 전국 고속도로의 속도보다 높다면 제한속도를 낮출 것을 경찰청장에게 건의할 예정이다. 과연 칠곡영업소장은 경찰청장에게 제한속도를 낮춰줄 것을 건의할 수 있는가? 95%신뢰수준에서 검증할 것

 

 

<문제의 소재>

문제 2에서는 칠곡 영업소가 관할하는 구역에서의 평균속도와 전국 고속도로의 평균 차량 통과 속도가 95% 신뢰수준에서 유의한 차이가 있는지를 확인하고, 칠 곡 영업소의 평균속도가 높다면 그 제한속도를 낮추고자 건의하려는 것이다.

두 표본 모두 모분산을 모르고 독립적이므로 독립 표본 T 검정을 실시하여 두 표본 이 나타내는 칠곡영업소가 관할하는 지역과 전국 고속도로의 평균속도의 차이가 있는지 알아볼 것이다.

 

<검정의 원리>

T 검정은 기본적으로 등간 이상의 척도를 대상으로 집단간 평균값에 차이가 있는지 여부를 판단하는 통계적 검정방법이다. 연속형 변수인 속도를 대상으로, 칠곡영업소와 전국 집단간 차이를 묻고 있으므로 적당한 검정방법이라 할 수 있다. 또한 독립변수 내의 두개의 집단의 평균의 차이가 유의미한지를 검정할 때 사용하는 독립 표본 T검정을 실시하면 될 것이다.

 

 

 

<문제의 해결>

<표 2-1>은 집단 통계량으로 독립 변수인 칠곡영업소와 전국평균속도가 각각 24개이며, 각 지역별 평균속도는 약 103km/h로 비슷한 것을 보여준다. 그 밖에도 표준편차와 표준오차가 얼마인지도 보여준다.

 

 

<표 2-2>은 기준지역에 따른 평균속도에 관한 독립 표본 T 검정의 결과이다. Levene의 F 검정은 두 집단의 분산이 동일할 확률을 알려준다. 소집단인 경우 두 집단의 분산이 동일한지 다른지에 따라서 T 검정 방법이 달라진다.

두 집단의 분 산이 동일하다는 가설의 유의도(P) = 0.541 > 0.05 이므로 두 집단의 분산이 동일하 다는 가설을 채택되고, 따라서 등분산이 가정된 <표 2-2> 중 위의 결과를 보아야 한다.

이 때 T 값은 -.125이며, 자유도(df)는 46, 양방향 검정의 유의도는 0.901로, 0.05보다 매우 크므로, 칠곡영업소와 전국도로의 평균속도에는 차이가 없을 것이 라는 귀무가설이 채택된다.

 

 

또한, 칠곡영업소의 평균속도는 95% 신뢰수준에서 평균속도가 100km/h 보다 높다고 할 수 있는지, 95% 신뢰수준에서 검증해 보자면, 모분산을 모르고 표본의 크기가 작으므로 T-분포를 이용해야 한다.

 

 

위 분석표에서 보듯이 표본의 자유도는 23 (24-1) 이고 추정한 모평균은 103.2917 이며 95% 신뢰구간은 100.2328 ≦μ≦ 106.3506 이다. 이것을 해석하면 칠곡영업소의 평균속도는 95% 신뢰수준에서 100.2328 과 106.3506 사이에 존재하고 따라서 95% 신뢰수준에서 칠곡영업소의 평균속도는 100km/h 보다 높다고 할 수 있다.

 

<결론>

칠곡영업소와 전국도로 평균속도간에는 차이가 없으므로 경찰청장에게 제한속도를 낮춰달라는 건의를 할 수 없으며, 교통사고율을 낮추기 위한 다른 타당한 대책을 마련해야 할 것이다. 또한 칠곡영업소의 관할 구역 내 차량의 평균 통과 속도는 95% 신뢰수준에서 100km/h 이상이라고 할 수 있다.

반응형
Posted by CCIBOMB
경찰학(警察學)2010. 11. 3. 10:31
반응형

 

 

도로교통상의 속도초과, 신호무시 등 법규를 위반하거나 교통사고를 야기한 사람에 대해서는 법령에 규정된 바에 따라 처벌이 주어지는데, 이러한 처벌은 행정제재와 형사제재로 구분할 수 있다.

 

교통범죄에 대한 형사제재의 특별 및 일반예방효과에 대한 부정적 견해에 따라 자유형 위주의 엄벌주의보다는 범죄예방효과가 높은 다른 형사제재수단으로 대체할 필요가 제기되었다. 이에 따라 재범 방지 및 재사회화를 위한 방안의 하나로 수강명령이나 사회봉사명령을 부과하는 사례가 증가하고 있다.

행정제재로는 운전면허 정지 및 운전면허 취소가 부과되고 있고, 법규위반이나 교통사고 야기로 인하여 운전면허 행정처분을 받은 사람에게는 특별한 교통안전교육이 실시되고 있다. 운전면허 행정처분은 처분 대상자 수가 점차 감소하는 추세를 보이고 있으며, 교통안전교육은 교육 프로그램이 더욱 증가, 세분화하고 있다.

 

이중에서도 특히 음주운전자에 대한 교통안전교육의 효과성에 대해 검토해보며, 이러한 교통안전교육의 실시가 과연 재범을 예방하고 이를 통하여 교통안전 증진을 실현하는데 적합한가 하는 문제를 판단해보고자 한다.

이러한 문제에 대한 합리적인 대안을 강구하기 위해서는 음주운전자에 대한 교통안전교육이 실질적으로 얼마나 재범을 방지하는 효과가 있는가에 대한 실증적 분석이 필요하고, 이러한 분석을 통대로 하여 운전자 제재수단의 효과적 운영방안이 강구되어야 한다. 외국의 경우 이러한 효과성에 대한 조사, 연구가 이루어져왔으나, 우리나라의 경우 전무한 실정이다.

 

이러한 배경에서 본 연구의 목적은, 음주운전자의 교통안전교육이 재범 여부에 영향을 미치는지, 재범을 하더라도 그 기간에 영향을 미치는지 등을 종합하여 음주운전자 교통안전교육의 효과성을 종합적으로 검토하여 그 대안 등을 제시하고자 한다.

 

반응형
Posted by CCIBOMB
경찰학(警察學)2010. 11. 3. 10:28
반응형

 

ccibomb.tistory.com.교통안전규제론.pdf

 

사례1.

경찰청장은 고속도로의 속도를 현실화시킬 의향을 가지고 있다. 그의 고민은 속도를 현실화시키면 교통사고가 증가하지 않을까 하는 것이다. 그는 교통국장에게 지시를 하여 여러 나라의 고속도로 제한속도와 교통사고 발생율 간의 관계를 살펴보라고 하였다. 제한속도가 높아도 교통사고발생비율이 그다지 높지 않으면 원활한 물류를 위하여 고속도로의 제한속도를 현실화시킬 생각이었다. 교통국장은 여러 나라의 제한속도와 사고율을 정리하여 다음과 같은 자료를 경찰청장에게 제시하면서 자신의 의견을 피력하였다. 여러분이 교통국장라면 제한속도를 현실화시킨다는 경찰청장의 의견에 동의를 할 것인지 아닌 지를 서술할 것.


 <문제의 소재> 

고속도로의 X변수(제한속도)가 고속도로의 Y변수(사고비율)에 영향을 어느정도 미치는지를 통계적으로 분석하여, 고속도로의 제한속도를 현실화시키고자 한다. 

먼저, 상관분석을 통해 고속도로의 제한속도와 사고비율 간의 상관관계를 알아 본 후, 그 상관관계를 인정할 수 있다면 회귀분석을 실시할 것이다. 즉 이변량 상 관분석을 해야 하며, Pearson 상관계수의 값이 그 상관성을 어느 정도 인정할 수 있는 값이 나온다면, 이어서 두 개의 변수를 회귀분석을 실시하여 두 변수간의 통계적으로 정확한 상관관계를 밝혀내고자 한다. 

이를 통해, 고속도로의 제한속도 를 현실화 시킬 것인지 결정할 수 있는 근거를 마련할 수 있을 것이다. 


<검정의 원리> 

상관분석은 기본적으로 두개의 연속 변수간에 어떤 관련성이 있는지를 조사하 는 방법이다. 두변수는 서로 독립적인 관계로부터 서로 상관된 관계일 수 있으며 이때 두 변수간의 관계의 강도를 상관관계(Correlation, Correlation coefficient)라 한다. 상관관계의 정도를 파악하는 상관계수(Correlation coefficient)는 두 변수간 의 연관된 정도를 나타낼 뿐 인과관계를 설명하는 것은 아니다. 두 변수간에 원 인과 결과의 인과관계가 있는지에 대한 것은 회귀분석을 통해 인과관계의 방향, 정도와 수학적 모델을 확인해 볼 수 있다. 

회귀분석은 독립변수(고속도로 제한속도)가 종속변수(사고비율)에 미치는 영향 력이 얼마나 되는가를 알아보기 위해 사용한다. 관찰된 연속형 변수들에 대해 독 립변수와 종속변수 사이의 인과관계에 따른 수학적 모델인 선형적 관계식을 구하 여 어떤 독립변수가 주어졌을 때 이에 따른 종속변수를 예측한다. 또한 이 수학 적 모델이 얼마나 잘 설명하고 있는지를 판별하기 위한 적합도를 측정하는 분석 방법이다. 




<문제의 해결> 

아래의 <표 1-1>은 기술통계량으로서 고속도로 제한속도와 사고비율별 표본 개수, 평균, 표준 편차의 정보를 알 수 있다. 



문제 1의 데이터를 상관분석 한 결과가 아래의 <표 1-2>와 같다 고속도로의 제한속도와 제한속도의 상관계수가 1인 것은 두 변량이 완벽하게 일치하기 때문이며 이는 무의미하다. 그 옆을 보면, 고속도로 제한속도에 대한 사고비율의 Pearson 상관계수의 값이 0.721 라고 나타나며, 이 상관계수는 0.01 수준(양쪽)에서 유의하다고 하였으므로 99% 신뢰수준을 갖는다. Pearson 상관계수의 값은 -1과 1 사이의 값을 갖는데 1에 가까울수록 양의 상관관계를 갖는다.

 


따라서 어느 정도 상관성(0.721)을 인정(신뢰수준 99%)할 수 있으므로, 회귀분석을 실시하여 그 관계성에 대해 좀 더 선형적 회귀식을 도출해보고자 한다. 

귀무가설 : 기울기가 0이다. 선형 회귀모형이 존재하지 않는다. 

대립가설 : 기우릭가 0이 아니다. 선형 회귀모형이 존재한다.  



<표 1-3>에서 R은 독립변수, 종속변수 간의 적률 상관 관계(Pearson r)로 0.721이라는 높은 상관관계를 보여주고 있다. R 제곱은 결정계수로 독립변수에 의해 설명되는 종속변수의 비율로서 0과 1 사이의 값을 갖는다. 수정된 R 제곱 값은 자유도를 고려해 모집단의 결정 계수를 추정할 때 사용되며, 문제 1의 데이터에서는 0.488로서 고속도로 제한속도와 사고비율 간의 약간의 상관관계가 있음을 알 수 있다. 오차들의 독립성 검정을 위한 Durbin-Watson 분석 결과는 1.970으로서 각 관측값의 분산들 간의 독립성에 큰 문제가 없는 것으로 해석할 수 있다. 



 단순 회귀 분석 모형의 통계적 유의성 검정은 <표 1-4>를 통해 확인 할 수 있다. 여기서 F 분석은 모집단의 회귀선의 기울기가 0이라는 가설에 대한 검정이다. 유의도 P = 0.001 < 0.05 이므로 귀무가설은 기각되고, 기울기가 0이 아니라는 대립가설이 채택된다. 즉, 선형 회귀모형이 존재한다. 


 

 추정된 회귀계수에 대한 자료는 <표 1-5>에 나타나 있다. 여기서 회귀식을 추정해 보면, 사고비율(Y.%)=제한속도(X.km/h)*0.113 + 24.850 의 값을 가진다. 이 때 유의확률은 0.001 즉 99.9% 의 신뢰수준을 갖는다. 


<결론> 

통계분석 결과, 고속도로 제한속도와 사고비율은 약간의 상관관계를 인정할 수 있으며, 회귀분석 결과 중 수정된 R 제곱 값을 통해 0.488 가량으로 고속도로 제한속도가 사고비율에 영향을 미친다고 볼 수 있다. 

또한 위에서 도출된 회귀식에 따라 제한속도를 10km 상향시, 1.13%의 사고비율이 증가한다고 볼 수 있다. 경찰청장이 고속도로의 제한속도를 현실화하겠다는 정책의 요지는, 고속도로 제한속도를 상향조정하더라도 사고비율이 높아지지 않을 경우 제한속도를 상향 조정하겠다는 의미이다. 

고속도로 제한속도와 사고비율은 그 연관성이 약 50% 정도에 이르며 그 회귀식의 기울기가 작기는 하나 엄연히 양의 상관과계를 갖는 것으로 나타나며, 교통사고는 재산 및 생명의 피해도 야기시킬 수 있는 중대한 사항이므로 고속도로 제한속도의 상향 조정시 얻을 수 있는 경제적 이익 및 차량 소통의 원활한 정도와 비교할 수 있는 성질이 아니라고 판단된다.

제한속도 이외에 사고비율에 영향을 끼치는 다른 요인들에 대해서도 조사를 실시하여 다중회귀분석을 통한 심층적인 분석이 요구된다. 현재의 데이터만으로는 경찰청장의 고속도로 제한속도 현실화 정책에 동의할 수 없겠다.

반응형
Posted by CCIBOMB