[머리말]

잠시 사용하고 있는 아이폰을 들여다보니 검지로 몇 번을 넘겨야 다 볼 수 있을 만큼의 애플리케이션(이하 앱)이 깔려 있다. 물론 그중에 적지 않은 앱은 일상생활에서 그다지 유용하지 않지만 몇몇 앱은 생활에 없어서는 안 될 정도로 자주 이용하고 있고 큰 도움도 받고 있다. 아무 래도 낯선 길을 찾아갈 때 필요한 내비게이션도 앱을 활용 중이고, 간단 한 금융 거래나 이메일의 확인, 날씨 정보의 습득 등도 비록 앞에 커다 란 맥북(Macbook)이 있다고 할지라도 앱을 더욱 자주 활용하여 왔다. 이렇게 자주 앱을 활용하고 있지만 정작 이 앱을 만든 사람은 누구이며, 앱 제작의 공학적인 과정은 어떻게 되며, 앱의 수익 구조는 어떤지 등과 같은 질문을 던져본 적은 거의 없는 듯하다.

저자에게 궁금했던 것은 오로지 적절한 앱을 적절한 타이밍에 원하는 바대로 활용하는 것이었기 때문이다. 이는 전공과도 무관하지 않으리라 생각된다. 컴퓨터 공학이나 소프트웨어 관련 전공자는 당연히 앱의 제작 과정이나 제작 방식에도 관심을 가질 수밖에 없다. 하지만 고등교육에서 이런 과정을 배워본적이 없는 사람에게 앱은 그저 제 삶의 편리함을 증진시키기 위한 수단 일 뿐이다.
가끔 사회과학도에게 계량분석에 관한 이해와 활용은 일반 소비자가 앱을 활용하는 것과 비슷하다는 생각을 한다. 

우리는 사회 현상을 이해 하기 위한 도구로 혹은 미래를 예측하기 위한 수단으로 계량분석을 활용 하는 것이지 통계학 자체의 찬란한 미래를 위하여 계량분석을 배우고 활용하지 않기 때문이다. 하지만 그렇다고 할지라도 계량분석에 대한 올바른 이해는 강조하고 또 강조해도 지나침이 없다. 통계 전공자가 아니기에 더욱 그렇다. 앱도 마찬가지라 생각한다. 저자가 가지고 있는 앱 중에 작곡 관련 앱이 있다.

유료 앱이어서 결제를 하고 아이폰에 깔긴 했지만 활용은 거의 하지 못하고 있다. 물론 매뉴얼이 없는 것은 아니지만 음악 용어에 대한 충분한 지식이 없어서인지 잘 이해가 가지 않는 부분이 많고 시간을 내서 이를 다 찾아볼 여력이 되지 않아 가끔은 사용하고 싶고 본전 생각도 나지만 여전히 깔아만 놓고 있다. 앱도 올바른 사용 방법을 모르면 무용지물이듯이 계량분석도 어떤 상황에서 어떤 방식으로 활용하고 어떻게 해석하는지를 제대로 이해하지 못하면 무용지물일 것이다. 더욱이 깊은 이해 없이 계량분석을 사용하면 결론을 도출할 때 자칫 큰 오류를 범할 우려가 있다.  이제 처음으로 계량분석을 배우고자 하는 사회과학 전공 학생과 계량분석을 R과 함께 해보고 싶은데 적절한 교재나 매뉴얼을 찾지 못한 연구자에게 이 책 R을 활용한 계량분석 강의 노트』를 내놓는다.개인적으로 졸작임을 부인할 수 없지만 이 책은 나름대로 다음과 같은 몇 가지 특징이 있는데, 이러한 특징 때문에 처음 시작하는 사람에게 오히려 적지 않은 이점이 될 수도 있다는 생각이 든다.
첫째, 최대한 수리적인 설명을 지양하고 적용에 초점을 맞추었다는 것이다. 이 책은 통계학 교재와 통계 패키지 매뉴얼의 중간 어디쯤의 정체성을 가지고 있다. 사회과학을 전공한다면 통계학 교재를 보다가 그 많은 수학 연산 부호 사이에서 길을 잃어본 적이 있으리라 생각된다. 또 통계 패키지의 활용을 위하여 매뉴얼을 따라해 보다 원하는 결과를 도출하였음에도 불구하고 해석을 못하여 네이버 ‘지식인’에 물어본 적도 있을 것이다. 이 책은 수리적인 설명보다 개념적 설명에 충실하고 있고 각 분석 방법을 적절히 적용하여 해석하는 데 도움을 주는 데에 더 큰 의미를 두고 집필되었다. 개념적 설명을 마친 후에는 R을 활용하는 데 부족함이 없도록 R 활용 분석 과정을 연습할 수 있도록 꾸몄다. 
둘째, 초보자에게 도움을 주고자 집필되었음에도 불구하고 요인분석과 군집분석 등이 소개되어 있다. 학부 수준의 교재에서 요인분석과 군집분석의 소개는 매우 이례적이라 생각된다. 하지만 최근 정부의 공공 데이터 개방과 함께 데이터(혹은 빅데이터) 분석 능력의 중요성이 부각 되고 있다. 사회과학 전공자 역시 계량적인 사고와 함께 분석 능력을 보유하고 있다면 더욱 훌륭한 인재로 인식될 가능성이 큰 사회에 우리는 살고 있는 것이다. 이 두 분석은 빅데이터 분석에 매우 중요한 기능을 담당한다고 생각한다. 비록 매우 초보적인 개념적 설명과 함께 R에서 연습을 한 것이지만 큰 도움이 되리라 믿어 의심치 않는다.
셋째, 간단한 시연 강의가 유튜브(Youtube)에 게재되었으므로 윤성사 홈페이지에서 다운로드한 데이터와 함께 직접 독자가 따라서 연습을 해 볼 수 있다는 점 역시 이 책의 장점이다. 물론 모든 내용을 영상으로 제작하지는 않았다.

특히 각 장의 개념적 설명은 책의 내용으로 대신할 것이다. 이를 이해한 상태에서 간단한 분석의 절차를 함께 해보는 방식으로 시연이 진행되었다. 비록 좋지 않은 목소리이지만 조금만 참아준다면 R을 활용하는 데 더욱 큰 도움을 받을 수 있을 것이다.
넷째, R Studio를 활용하였으므로 더욱 쉬운 R에 대한 이해가 가능 하다는 점이다. 저자가 비록 맥북을 사용하지만 기본적인 인터페이스는 모두 동일하다고 생각한다. R Studio를 활용하면 R을 더욱 쉽고 빠르 게 활용할 수 있다. 데이터의 구조 설명과 함께 R Studio를 같이 연습해 보면 빠르게 R을 이용하는 방법을 체득할 수 있으리라 확신한다.
저자는 통계 전공자가 아니지만 계량분석을 활용한 연구 논문을 주로 써오고 있다. 아직 부족한 실력이기에 연구를 게재하는 과정에서 선배 교수님들과 연구자 분들의 질책도 많이 받아왔다. 이 책도 성과물의 종착역이 아니라 생각하고, 비판은 비판대로 수용하여 이 책을 더욱 업그레이드해 나갈 예정이다. 내용 중 오류가 있거나 잘못된 설명이 있으면 이는 전적으로 저자의 책임이며, 추후 출판 과정에서 수정할 것이므 로 가감 없는 조언을 부탁드린다.
끝으로 이 책의 출판 과정에 큰 도움을 주고 아낌없이 후원해 주신 윤성사 정재훈 대표님께 감사의 말씀을 드린다. 홀로서기하고 첫 작업 일텐데 폐만 끼치지 않으면 하는 바람이다. 윤성사와 함께하는 편집진에게도 감사의 마음을 전한다. 최고의 팀이었다. 그리고 늘 외조와 내조를 아끼지 않는 사랑하는 아내와 삶의 최고 윤활유인 사랑하는 아들 유주에게 자주 함께하지 못한 가장의 미안한 마음을 전한다. 그리고 사랑의 마음도 전한다. 마지막으로 졸저를 집필할 수 있는 지혜와 여건을 허락하신 살아계신 하나님께 찬양과 영광을 드린다.
2017년 2월 아들이 신나게 떠들고 있는 안성의 한 아파트에서
최  유  진     

[차례] 

Chapter 1_ 계량분석의 이해
  1_ 계량분석이란?   
  2_ 분석의 단위와 시간의 차원 
    1) 분석의 단위   
    2) 시간의 차원
  3_ 변수의 이해
    1) 명목변수
    2) 서열변수
    3) 등간변수
    4) 비율변수
    5) 변수의 선택
  4_ 연구의 목적과 연구 질문
  5_ 인과관계의 이해
    1) 원인, 결과 그리고 인과관계
    2) 인과관계가 설정되려면?
    3) 인과관계와 변수: 독립변수와 종속변수
    4) 상관관계

Chapter 2_ 기술통계량 구하기
  1_ 기술통계란?
  2_ 중앙을 의미하는 값 구하기
    1) 평균
    2) 중위수
    3) 중위수와 평균의 관계
    4) 최빈값
  3_ 퍼짐 정도(산포도) 구하기
    1) 사분위수 범위
    2) 분산과 표준편차
  4_ 분포의 이해
    1) 정규분포
    2) 표준정규분포와 표준화
  5_ R 활용 기술통계량 구하기
    1) R과 R Studio 다운로드하여 실행하기
    2) 새로운 폴더 만들기와 워킹 디렉토리 지정
    3) 파일 불러오기
    4) 기술통계량 구하기
    5) 상자그림 그리기
    6) 히스토그램 그리기

Chapter 3_ 가설검정의 이해
  1_ 가설검정의 의의
    1) 가설과 가설검정의 개념
    2) 가설의 구비 조건
    3) 가설의 유형
    4) 양측 검정과 단측 검정
  2_ 모집단과 표본추출
    1) 모집단과 표본추출의 의의
    2) 표본추출의 방법
    3) 표본의 크기
  3_ 가설검정의 일반적 절차
    1) 개요
    2) 가설의 설정
    3) 검정 방법의 결정
    4) 유의수준과 유의확률의 결정
    5) 검정통계량의 계산
  4_ 가설검정의 오류
    1) 제1종 오류와 제2종 오류
    2) 적용

Chapter 4_ t검정
  1_ t검정이란?
  2_ t분포의 이해와 t검정의 유형
    1) t분포
    2) t분포의 유형
  3_ R 활용 일표본 t검정
    1) 단일표본 t검정
    2) 가설의 설정
    3) R 활용 단일표본 t검정
  4_ R 활용 독립표본 t검정
    1) 독립표본 t검정
    2) 가설의 설정
    3) R 활용 독립표본 t검정
  5_ R 활용 대응표본 t검정
    1) 대응표본 t검정
    2) 가설의 설정
    3) R 활용 대응표본 t검정

Chapter 5_ 분산분석
  1_ 분산분석이란?
    1) 의미
    2) 유형
  2_ 분산분석의 주요 내용
    1) 분산분석의 가정
    2) 분산분석의 기본 원리와 검정통계량
    3) 가설의 설정과 사후검정
  3_ R 활용 분산분석
    1) R 활용 일원분산분석
    2) R 활용 이원분산분석

Chapter 6_ 교차분석
  1_ 교차분석이란?
    1) 의미
    2) 카이제곱 분포
  2_ 검정통계량의 도출과 가설의 설정
    1) 검정통계량의 도출
    2) 가설의 설정
  3_ R 활용 교차분석

Chapter 7_ 상관관계분석
  1_ 상관관계분석이란?
    1) 개념
    2) 기본 가정
  2_ 상관계수의 이해
    1) 상관계수의 계산
    2) 상관계수의 의미
    3) 가설의 설정
  3_ R 활용 상관관계분석

Chapter 8_ 요인분석
  1_ 요인분석이란?
  2_ 요인분석의 원리
    1) 요인분석의 개념적 이해
    2) 요인분석의 목적
    3) 요인분석의 유형
    4) 요인적재량과 고유값의 이해
    5) 요인회전의 이해
  3_ R 활용 요인분석

Chapter 9_ 군집분석
  1_ 군집분석이란?
  2_ 군집분석의 유형
    1) K 평균 군집분석
    2) 계층적 군집분석
  3_ R 활용 군집분석

Chapter 10_ 단순회귀분석
  1_ 회귀분석이란?
  2_ 회귀분석의 기본 가정
  3_ 단순회귀모형 추정
    1) 단순회귀분석의 추정 방정식
    2) 검정통계량과 가설의 설정
    3) F검정
    4) 결정계수와 조정된 결정계수
  4_ 단순회귀분석의 다양한 응용
    1) 독립변수가 더미변수인 경우
    2) 로그 모형
    3) 절편이 없는 모형
  5_ R 활용 단순회귀분석

Chapter 11_ 다중회귀분석
  1_ 다중회귀분석의 유용성
  2_ 다중회귀분석의 모형
    1) 다중회귀 방정식
    2) 다항회귀 방정식
  3_ 다중공선성
    1) 다중공선성
    2) 다중공선성의 진단
    3) 다중공선성이 발견되면?
  4_ R 활용 다중회귀분석

Chapter 12_ 비모수검정 방법
  1_ 비모수검정이란?
  2_ 비모수검정 방법의 유형과 기본 개념
    1) 유형
    2) Kolmogorov-Smirnov test
    3) Wilcoxon Rank-Sum test
    4) Wilcoxon Signed-Rank test
    5) Kruskal-Wallis test
    6) 스피어만의 순위 상관관계분석
  3_ R 활용 비모수검정 방법
    1) Kolmogorov-Smirnov test
    2) Wilcoxon Rank-Sum test
    3) Wilcoxon Signed-Rank test
    4) Kruskal-Wallis test
    5) 스피어만의 순위 상관관계분석

[저자약력]

최 유 진
崔 維 眞
Eugene Choi

학력
중앙대학교 행정학과 졸
중앙대학교 일반대학원 행정학 석사
클리블랜드주립대학교(Cleveland State University) 도시행정학 박사

경력
전)한국행정연구원 수석연구원 및 부연구위원
현)강남대학교 공공인재학과 조교수

주요 저서 및 연구 논문 ·
지방자치의 이해(신조사) ·
도시어메니티의 지역경제 활성화 효과 분석: 우리나라 기초지방자치단체를 중심으로(2017. 2) ·
사회적 기업의 지역 내 확산 요인 분석(2016. 11)
환경정책과 지역경제 활성화: 기초지방자치단체의 주요 환경조례를 중심으로(2015. 9)
Urban amenities as determinants of selecting a logo type in Korea:   
the multinomial logit approach with the bootstrap sample(ssci. 2012. 2)
등 지역경제와 도시정책 분야 다수의 논문