<머리말>

  “상식 있는 시민이 되기 위해 글을 읽고 쓸 줄 아는 능력이 필수적인 것처럼 언젠가는 통계적 지식이 그렇게 되리라”라는 웰스(Herbert G. Wells)의 말처럼, 오늘날 모든 전문 분야나 학문 연구에서 자신의 주장을 통계학적으로 표현할 수 있는 기술은 필수적으로 요구되는 능력임에 틀림없다. 특히, 4차 산업혁명 시대에 빅데이터와 인공지능 등이 사회의 화두로 등장하면서 그 기본인 통계학은 어느 때보다도 중요하게 여겨지고 있다.

  통계학의 어원은 state-istics로, 국가에게 필요한 인구와 경제에 대한 정보의 수집에 관한 학문을 의미한다. statistics라는 영어 단어의 뜻을 사전에서 살펴보면 두 가지 의미를 지닌다는 것을 알 수 있다. 이 단어를 복수형으로 취급하는 경우 수나 숫자로 된 사실·자료나 통계(표)를 의미하는 반면, 단수형으로 취급하는 경우 통계학을 뜻한다. 따라서 통계학이란 수나 숫자로 구성된 통계 자료를 수집해 정리·요약하고 해석하는 학문이라 할 수 있다.

  물가상승률, 실업률, 오늘의 기온, 대통령 인기도, 이자율 등 수와 숫자로 구성된 자료는 우리 현대인의 일상생활에서 합리적 의사결정을 위해 없어서는 안 될 필요불가결한 정보가 됐다. 일상생활에서뿐만 아니라 정치, 시사 및 학술토론에서도 자신의 주장을 좀 더 확고히 뒷받침하기 위해 통계적 자료가 널리 활용되고 있다.

  통계적 자료의 유용성은 많은 전문분야에서도 두드러진다. 정책입안가뿐만 아니라 경제학자, 재정전문가들은 신뢰성 있는 양질의 경제 및 재정에 관한 정부 통계자료를 근거로 합리적 결정을 내린다. 의사들은 의학학술 잡지에 등장하는 통계 자료를 분석해 자신의 환자들에게 가장 효과적인 치료 방법을 선택할 수 있다. 정치가들은 여론조사 통계를 참조하고, 경영인들은 소비자의 선호가 반영된 마케팅 조사자료를 토대로 의사결정을 내린다. 행정가들은 정부 통계를 기반으로 정책을 수립하고 집행하며 평가한다. 이와 같이 통계학은 경제, 경영, 행정 부문 등 사회과학과 자연과학의 다양한 분야에서 널리 응용되는 분석의 과학적 방법에 관한 학문이라 할 수 있다.

  이 책의 목적은 사회과학도들이 중요한 연구문제나 정책문제에 대한 간명한 해답을 제시하고자 수집된 통계 자료를 효과적으로 정리·요약하고 타당하게 자료를 분석할 수 있는 능력을 함양하는 데 있다. 좀 더 실용적으로 통계학 지식을 실제 분야에서 사용 가능할 수 있는 역량을 배양시키고자 노력했다.

  그리고 이 책은 2010년 출간되었던 『사회과학통계입문: 이론과 응용』에서 제주대학교 황은진 교수와 서울여자대학교 이성윤 교수가 참여해 현대 통계학과 데이터 분석에서 그 중요성이 점차 강조되고 있는 빅데이터에 대한 내용과 함께 책표지와 판권에 있는 QR코드를 스캔해 실습 데이터를 다운받아 R 프로그램을 활용한 실습내용을 다룸으로써 사회과학 분야에서 기초통계를 이해하는데 도움이 되고자 했다.

  흔쾌히 이 책의 출판을 허락해 주시고 열과 성을 다해 준비해 주신 도서출판 윤성사의 정재훈 대표님과 관계자 여러분께도 고마움의 마음을 전하고 싶다.

  이 책은 많은 분의 도움과 함께 한 긴 여정의 산물이다. 그럼에도 불구하고 이 책에 있는 오류는 모두 저자들의 책임이다.

2024년 1월

저자 일동

 

<차례>

제1장 통계학이란? 

제1절 통계학의 정의 

제2절 모집단과 표본 그리고 모수와 통계량 

제3절 자료의 유형: 변수·측정·척도 그리고 자료 

제4절 통계학의 구분 

제5절 사회과학 연구에서 통계의 역할 

제6절 통계학의 역사 

제7절 통계학과 컴퓨터 통계 프로그램 

주요 용어와 공식 

[R 프로그램 활용] R 프로그램의 소개 

 

제2장 도표에 의한 자료의 정리·요약 

제1절 질적 자료 

 1 도수분포표 

 2 막대도표 

 3 원형그림 

 4 분할표 

제2절 양적 자료 

 1 도수분포표 

 2 히스토그램 

 3 도수다각형 

 4 누적백분율곡선 

 5 줄기-잎 그림 

 6 점산도 

주요 용어와 공식 

[R 프로그램 활용] 도표에 의한 자료의 정리·요약 

 

제3장 특성값 산출에 의한 자료분포의 특성 분석

제1절 양적 자료 

 1 집중도 

 2 산포도 

 3 분포의 모양 

제2절 질적 자료 

 1 백분율과 비율 

 2 질적 변이계수 

주요 용어와 공식 

[R 프로그램 활용] 특성값 산출에 의한 자료분포의 특성 분석 

 

제4장 확률의 기초 

제1절 확률의 의미과 유형 

제2절 확률의 기초 개념 

제3절 사건과 집합 

 1 집합의 개념과 사건과의 관계 

 2 집합연산과 사건 

제4절 확률의 공리 

제5절 확률의 계산 법칙 

 1 확률의 덧셈 법칙 

 2 확률의 곱셈 법칙 

제6절 베이즈 정리 

주요 용어와 공식 

 

제5장 확률분포 

제1절 확률변수(이산형, 연속형) 

제2절 확률분포(이산, 연속) 

 1 이산형 확률분포 

 2 연속형 확률분포 

 3 이산형 확률분포와 연속형 확률분포의 특성 비교 

제3절 확률변수와 수학적 기댓값과 분산 

 1 이산형 확률변수의 기댓값과 분산 

 2 연속형 확률변수의 기댓값과 분산 

 3 확률변수 기댓값의 일반적 특성 

제4절 두 확률변수의 결합확률분포와 연관도 

 1 결합확률분포와 주변확률분포 

 2 공분산과 상관계수 

주요 용어와 공식 

 

제6장 이산형 확률분포

제1절 이항분포 

 1 이항분포의 개념 

 2 이항분포의 확률밀도함수와 확률의 계산 

 3 이항분포의 특성 

제2절 포아송분포 

 1 포아송분포의 개념 

 2 포아송분포의 확률밀도함수와 확률의 계산 

 3 포아송분포의 특성 

제3절 이항분포와 포아송분포의 관계 

주요 용어와 공식 

[R 프로그램 활용] 이항확률함수의 기댓값과 분산 

[R 프로그램 활용] 포아송 확률밀도함수의 기댓값과 분산 

 

제7장 연속형 확률분포 

제1절 확률밀도함수 

제2절 균일확률분포 

제3절 정규분포 

 1 정규분포의 의미 

 2 표준정규분포 

 3 정규분포의 확률 계산 

주요 용어와 공식 

 

제8장 표본추출 

제1절 표본추출의 의미 

제2절 표본추출오차와 비표본추출오차 

 1 표본추출오차 

 2 비표본추출오차 

제3절 표본추출 방법 

 1 확률표본추출 

 2 비확률표본추출 

주요 용어와 공식 

 

제9장 표본분포 

제1절 표본분포의 의미 

제2절 평균의 표본분포 

 1 평균의 표본분포의 평균, 표준편차, 표준오차 

 2 모집단의 분포와 평균의 표본분포 

제3절 표본 비율의 표본분포 

 1 표본 비율의 표본분포의 평균과 표준편차 

 2 표본 비율의 표본분포의 형태 

주요 용어와 공식 

 

제10장 추정 

제1절 점 추정 

제2절 구간 추정 

 1 σ가 알려져 있는 경우 

 2 σ가 알려져 있지 않은 경우 

 3 표본 크기의 결정 

제3절 두 모집단 평균 차이에 관한 추정 

 1 두 모집단 평균 차이에 대한 추정: σ1, σ2가 알려져 있는 경우 

 2 두 모집단 평균 차이에 대한 추정: σ1, σ2가 알려져 있지 않은 경우 

제4절 모집단 비율에 관한 추정 

 1 단일모집단 비율에 관한 구간 추정 

 2 모집단 비율의 구간 추정을 위한 표본 크기의 결정 

주요 용어와 공식 

 

제11장 가설검정 

제1절 가설검정의 기초 

 1 가설검정의 의의 

 2 가설검정의 오류: α-오류와 β-오류 및 유의 수준 

 3 가설검정의 순서 

제2절 한 모집단 모평균에 대한 가설검정 

 1 모집단의 분산을 알고 있을 때 

 2 모집단의 분산을 모를 때 

제3절 한 모집단 비율에 대한 가설검정 

 1 단측검정 

 2 양측검정 

제4절 두 모집단 평균에 관한 가설검정 

 1 두 모집단 평균의 차에 관한 가설검정 

 2 짝을 이룬 표본의 차이에 관한 가설검정 

제5절 두 모집단 비율의 차이에 관한 가설검정 

주요 용어와 공식 

[R 프로그램 활용] t 검정 

 

제12장 분산분석 

제1절 분산분석의 의의 

 1 분산분석의 용어 

 2 분산분석의 종류 

 3 분산분석의 기본 가정 

제2절 일원분산분석 

 1 모집단 분산에 대한 집단 간 추정값 

 2 모집단 분산에 대한 집단 내 추정값 

 3 분산 추정값의 비교: F 검정 

 4 분산분석표의 작성 

 5 개별집단 평균 차에 대한 사후검정 

제3절 이원분산분석 

1 무작위 블록설계 분석 

2 2요인 이원분산분석 

주요 용어와 공식 

[R 프로그램 활용] R: 분산분석 

 

제13장 상관분석 

제1절 상관분석의 의의 

제2절 상관 관계와 상관계수 

제3절 상관분석의 과정 

제4절 표본상관계수와 유의성 검정 

 1 ρ = 0 검정 

 2 ρ = ρ0 검정 

 3 ρ1 = ρ2 검정 

제5절 표본상관계수의 신뢰구간 추정 

제6절 중상관분석 

제7절 편상관분석 

주요 용어와 공식 

[R 프로그램 활용] R: 상관분석 

 

제14장 회귀분석 

제1절 회귀분석의 기초 

제2절 단순회귀분석 

 1 회귀모형과 회귀식 

 2 최소자승법에 의한 추정량 

 3 최소자승법의 기본 가정 

 4 회귀분석 결과의 적정성 평가 

 5 추정과 예측을 위한 추정회귀식 활용 

제3절 다중회귀분석 

 1 다중회귀분석의 개념 

 2 다중회귀분석에서 최소자승법에 의한 추정량 

 3 다중결정계수 

 4 다중회귀분석의 가정 

 5 다중회귀분석의 유의성 검증 

 6 추정 및 예측을 위한 추정회귀식 활용 

주요 용어와 공식 

[R 프로그램 활용] R: 회귀분석 

 

제15장 빅데이터와 통계 

제1절 빅데이터란 무엇인가? 

 1 빅데이터의 속성 

 2 빅데이터의 통계학적 특징 

제2절 빅데이터 분석 기술 

주요 용어와 공식 

[R 프로그램 활용] R: 텍스트 분석 

 

<저자 소개>

이 은 국

연세대학교 정법대학 행정학과(행정학사)

연세대학교 대학원 행정학과(행정학석사)

미국 University of Chicago 정치학과(정치학박사)

현재 연세대학교 사회과학대학 행정학과 명예교수

 

황 은 진

서울여자대학교 사회과학대학 행정학과(행정학사)

연세대학교 대학원 행정학과(행정학석사)

미국 Arizona State University 행정학과(정책학석사)

미국 University of Georgia 행정학과(행정학박사)

현재 제주대학교 사회과학대학 행정학과 조교수

 

이 성 윤

서울대학교 농업생명과학대학 농업자원경제학과(경제학사)

서울대학교 대학원 행정학과(행정학석사)

미국 Rutgers, the State University of New Jersey, Newark, 행정학과(행정학석사)

미국 State University of New York (SUNY) at Abany, 행정학과(행정학박사)

현재 서울여자대학교 사회과학대학 행정학과 조교수

 

노 승 용

연세대학교 사회과학대학 행정학과(행정학사)

연세대학교 대학원 행정학과(행정학석사)

미국 University of Southern California, School of Public Administration(행정학석사)

미국 Rutgers, the State University of New Jersey, Newark, 행정학과(행정학박사)

현재 서울여자대학교 사회과학대학 행정학과 교수