-미국 40개 도시의 오염자료를 사용해서 각 변수간의 matrix plot을 보고 느낀점을 기술하시오.
[코드]
"airpoll" <-
structure(.Data = list("Rainfall" = c(36., 35., 44., 47., 43., 53., 43., 45., 36., 36., 52., 33., 40., 35., 37., 35., 36., 15., 31., 30., 31., 31.,
42., 43., 46., 39., 35., 43., 11., 30., 50., 60., 30., 25., 45., 46., 54., 42., 42., 36., 37., 42., 41.,
44., 32., 34., 10., 18., 13., 35., 45., 38., 31., 40., 41., 28., 45., 45., 42., 38.)
, "Education" = c(11.4, 11., 9.8000000000000007, 11.1, 9.5999999999999996, 10.199999999999999, 12.1, 10.6, 10.5, 10.699999999999999,
<중 략>
미국 40개 도시의 공기오염을 일으키는 주요 원인으로 Rainfall(강수량), Education(교육), Popden, Nonwhite, NOX(질소산화물), SO2(이산화황), Mortality(사망률) 7개 변수가 있다. 각 변수끼리 상관관계를 나타낸 matrix plot을 살펴보면 변수 SO2(이산화황)와 Mortality(사망률) 변수 사이의 양의 상관관계가 있음이 보이며 NOX(질소산화물)변수와 Mortality(사망률)을 나타내는 변수 사이에는 약한 양의 상관관계가 있음이 보여 진다.
즉, 이산화황의 오염이 심해진 상태로 사망률도 높아지면 미국 내의 공기오염도도 높아진다고 볼 수 있고, 같은 의미로 NOX(질소산화물)와 사망률 사이의 연관 관계에 있어서도 질소산화물의 농도가 커지면 사망률도 높아지는데 이런 양의 관계가 미국 도시의 공기 오염에 상당한 영향을 끼친다고 볼 수 있겠다.
<이하생략>