차트 Charts | ||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <colbgcolor=#4d4d4d><colcolor=#fff> 일반 그래프 | 그림그래프 · 막대그래프 · 선 그래프 |
비율 그래프 | 원 그래프 · 띠 그래프 | |
기타 | 카토그램 · 상자 수염 그림 · 줄기와 잎 그림 | }}}}}}}}} |
통계학 Statistics | |||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <colbgcolor=#4d4d4d><colcolor=#fff> 수리통계학 | 기반 | 실해석학 (측도론) · 선형대수학 · 이산수학 |
확률론 | 사건 · 가능성 · 확률 변수 · 확률 분포 (표본 분포 · 정규 분포 · 이항 분포 · 푸아송 분포 · 카이제곱분포 · t분포 · Z분포 · F-분포 · 결합확률분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙 (무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙 | ||
통계량 | 평균 (산술 평균 · 기하 평균 · 조화 평균 · 멱평균 · 대수 평균) · 기댓값 · 편차 (절대 편차 · 표준 편차) · 분산 (공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도 | ||
추론통계학 | 가설 · 변인 · 추정량 · 점추정 · 신뢰 구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도 | ||
통계적 방법 | 회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석 (요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습 (군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타 분석 · 모델링 (구조방정식) | ||
기술통계학 · 자료 시각화 | 도표 (그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점 | }}}}}}}}} |
線 graph / (polygonal) line chart
1. 개요
선 그래프 또는 꺾은선그래프는 수량을 점으로 표시하고 그 점들을 선분으로 이어 그린 그래프를 말한다.시간에 따라 뭔가가 지속적으로 변화하는 것을 기록할 때 굉장히 유용하다. 조사하지 않은 중간의 값도 대략 예측할 수 있다는 장점이 있다.
숫자로만 적으면 지속적으로 변화하는 것의 흐름을 정확히 파악하기가 어렵기 때문에 이런 상황에서 꺾은선그래프가 유용하다. 학교에서는 2009개정 교육과정 기준으로 초등학교 4학년에서 처음 배우며 지리에서 등장하는 월별 평균기온과 강수량 그래프에서 주로 월 평균기온에 해당하는 그래프이다.
불필요한 부분을 생략하고 자세히 그래프를 그릴 때는 물결선을 긋는다.
선 그래프는 연속적 자료를 다루거나 통시적 자료를 다룰 경우, 동일하거나 일련의 관찰대상의 추이를 비교할 경우, 추세 (trend)를 관찰할 경우에 쓰이는 그래프이다. 이 역시 시각적으로 좋은 모양새를 만드는 것이 중요해서, 만일 제대로 못 하면 말 그대로 그래프가 바닥을 뚫고 내려 가는 (…) 참사가 벌어진다.
파생형이 정말 많은 그래프이다. 통시적인 시계열 연구와 결합할 경우에는 순서도 (run chart), 흐름도 (flow chart) 등의 변형으로 나타난다. 범위 정보를 같이 제공할 경우에는 팬 차트 (fan chart)라고 불린다. 주식시장에서 보이는 그래프는 스파크라인 (sparkline)의 변형이다. 일반인들에게 익숙할 다른 변종으로는 레이더도표 (radar plot)가 있는데, 이는 원형에 유사한 다각형의 모양으로 표현하는 꺾은선그래프이다. 보통 한 관찰대상에 대한 여러 평가항목들이 있을 때 쓰는데, 코에이 사의 삼국지 시리즈의 인물 스탯 표기방식 덕분에 익숙할 것이다.
2. 그리는 법
좌표평면을 그리고 점을 찍은 뒤 점을 선분으로 긋는다. 단, 보통 실제 좌표평면처럼 x, y축을 표시하거나 모눈종이 모양으로 표현하지는 않는다.항목별로 시점에 따른 값을 꺾은선그래프로 나타낸다고 했을 때, 항목의 개수를 a, 시점의 개수를 b라고 하자. 각 항목별로 시점에 따른 꺾은선을 그려야 하므로 일련의 '꺾은선'의 개수는 항목의 수와 같다. 또한 각 항목별로 b개의 점을 찍은 후 그 점들을 서로 연결하는 (b-1)개의 선분을 그려야 하며, 항목의 개수가 a이므로 모든 점의 개수는 ab, 모든 선분의 개수는 a(b-1)이다.
좌표평면의 x축(가로축)에는 시점을 나열하며, y축(세로축)에는 값을 일정 간격으로 나열한다. 시점을 나열할 때 1분기, 2분기, ... 하는 식으로 (숫자+글자) 형태로 나타낼 수도 있지만, 1월 1일, 1월 2일, ... 하는 것처럼 일정 간격의 날짜 및 시간으로 나타낼 수도 있다. 세로축의 경우 모든 항목의 모든 시점에 대한 자료를 나타내야 하므로 전체 항목의 최댓값을 고려하여 최댓값을 결정해야 하는데, 최댓값이 딱 떨어지는 수가 아닐 때는 그보다 약간 큰 '딱 떨어지는 수'로 결정할 수 있다. 예를 들어 최댓값이 459일 때, 이보다 약간 큰 500을 최댓값으로 결정한 후 세로축의 눈금을 50 단위로 잡을 수 있다. 최솟값 역시 마찬가지로 고려하여 경우에 따라 0 외의 값으로 설정할 수도 있다.
2.1. Microsoft Office에서
Microsoft Excel에서 그릴 수 있다. 데이터를 마우스로 긁은 후 "삽입 → 세로 막대형, 꺾은선형, 원형"을 선택하면 막대 그래프, 선 그래프, 원 그래프를 그릴 수 있다.삽입 - 차트 - 꺾은선형 메뉴에서 원하는 종류의 차트를 고른 후 삽입하면 된다. 표식(점)이 없는 꺾은선그래프도 지원하며, 3차원 꺾은선그래프도 그릴 수 있다. 전체 비율을 100%로 하여 각 항목의 비율을 꺾은선으로 나타내는 100% 기준 누적 꺾은선형 차트도 제공한다. Microsoft PowerPoint에서는 2016 버전 기준으로 계열이 3개, 항목이 4개인 그래프가 기본적으로 만들어진다.
비슷한 형태의 '영역형'[1] 그래프도 그릴 수 있다.
2.2. LibreOffice에서
캘크(Calc)에서 데이터를 마우스로 긁은 후 "삽입 → 차트 → 열, 선, 원형"을 선택하면 막대 그래프, 선 그래프, 원 그래프를 그릴 수 있다.3. 함수의 그래프와의 관계
X의 값에 Y를 대응시킨다는 함수의 정의를 생각하면, 꺾은선그래프 역시 특정 시점에 대해 어떤 값을 대응시킨 것을 그래프로 나타낸 것이라고 할 수 있으므로 함수의 그래프와 어느 정도 비슷하다.함수 y=f(x)의 그래프와 유사한 꺾은선그래프를 그릴 수 있다. 가로축을 x의 값으로, 세로축을 y의 값으로 정한 다음 x의 값에 따른 y의 값을 꺾은선그래프로 나타내면 함수의 그래프와 유사한 그래프가 된다. y=ax+b 꼴로 표현되는 선형 함수(상수함수 포함)이면 함수의 그래프를 정확히 표현할 수 있지만, 그렇지 않은 경우에는 근사적으로밖에 표현할 수 없으며, 가로축의 간격을 줄이면 줄일수록 함수의 그래프에 가까워진다.
단, y=f(x)가 모든 점에서 미분가능한 비선형 함수인 경우, 그것을 꺾은선그래프로 나타낸 것을 새로운 함수 g(x)라고 하면 f(x)는 미분가능하지만 g(x)는 꺾이는 점에서 미분가능하지 않다는 결정적인 차이점이 있다.
4. 꺾은선그래프 아랫부분의 넓이
여기서 꺾은선그래프 아랫부분의 넓이는 꺾은선그래프를 이루는 각 점과 그 점을 가로축에 사영시킨 점을 연결한 무수히 많은 선분들이 이루는 영역의 넓이로 정의한다.꺾은선그래프 아랫부분의 넓이는 각 시점을 t1, t2, ..., tk, 시점 x에 따른 값을 f(x), 시점 사이의 간격을 d라고 할 때 이다. t1 바로 왼쪽의 시점을 t0, tk 바로 오른쪽의 시점을 tk+1라 하고 f(t0)=f(tk+1)=0이라고 할 때, t0과 tk+1까지 추가한 꺾은선그래프를 가정해 보자. 이 꺾은선그래프의 각 tn(1≤n≤k)에 해당하는 가로축상의 점과 이에 대응되는 그래프 위의 점을 연결한 선분을 밑변으로 하는 삼각형을 2개씩 만들 수 있고, 이 삼각형의 넓이는 로 서로 같으므로 두 삼각형의 넓이의 합은 d×f(tn)이다. 이것을 1≤n≤k인 모든 n에 대하여 합한 다음 남는 부분의 넓이인 를 제외하면 위 공식이 유도된다. 단, 이 방법은 각 시점에서의 값이 모두 음이 아닐 때만 가능하다.
5. 해석
- 그래프가 시점 t1과 t2 사이에서 오른쪽 위로 향하면 (t1에서의 값) < (t2에서의 값)임을 의미하고, 반대로 오른쪽 아래로 향하면 (t1에서의 값) > (t2에서의 값)임을 의미한다. 오른쪽 위/오른쪽 아래로 향하지 않고 가로줄 모양이면, (t1에서의 값) = (t2에서의 값)임을 의미한다. 하지만 이것만으로는 그 시점 사이의 상세한 변화를 알 수 없다. 예를 들어 t1과 t2 사이에서 오른쪽 위로 향하는 그래프라고 해도, 그 두 시점 사이의 시점 t3, t4,(t3이 먼저)에 대하여 (t3에서의 값) > (t4에서의 값)일 수 있다.
- 여러 항목이 존재하는 그래프의 경우 교점이 생길 수 있는데, 이것은 대부분 교점을 이루는 두 항목의 값의 크기 관계가 역전된다는 것을 의미한다. 예를 들어 두 항목 A, B가 있을 때, 교점 왼쪽에서 (A의 값) > (B의 값)이지만 오른쪽에서 (A의 값) < (B의 값)인 경우, B의 값이 교점에 해당하는 시점에서 A의 값을 추월한 것이다.
- 예외도 있다. 예를 들어 교점 왼쪽과 오른쪽에서 모두 (A의 값) > (B의 값)이고 교점에서만 (A의 값) = (B의 값)인 경우, 교점에 해당하는 시점에만 A와 B의 값이 서로 같아졌을 뿐 크기 관계가 역전되지는 않은 것이다.
- 시점 t1, t2일 때의 값을 이용하여 그 사이의 값을 추정할 수 있다. 예를 들어 t1일 때의 값이 20, t2일 때의 값이 30이면 t1과 t2의 정확한 중간점에서의 값은 25로 추정할 수 있다. 하지만 이것은 값의 변화가 연속적일 때, 특히 선형에 가까울수록 정확하며, 이산적이거나, 불연속점이 있거나, 복잡하게 변하는 경우 정확도가 떨어질 수 있다.
6. 방사형 그래프
위 그림과 같이 일반적인 꺾은선그래프의 가로축에 해당하는 부분을 다각형의 둘레로, 세로축에 해당하는 부분을 중심에서 다각형의 꼭짓점을 향하는 선분 또는 직선으로 표현한 정다각형 모양의 그래프이며, 꺾은선으로 나타나므로 일종의 꺾은선그래프로 볼 수 있다. 가로축에서 항목(주로 시점)을 나타내는 부분이 최댓값 쪽이라는 것과 일정한 값을 나타내는 선분을 연결하면 다각형이 된다는 것이 일반적인 꺾은선그래프와의 큰 차이점이다. 심리 검사 결과 등을 나타내는 그래프로 많이 활용된다.
7. 기타
주가를 나타낼 때 '봉 차트'와 함께 가장 많이 쓰인다. 주로 1일 이내의 주가 변화를 나타낼 때 꺾은선그래프가 많이 쓰이는 편이다. 주가를 나타낼 때의 꺾은선그래프는 전날의 마감가를 기준선으로 하여 마감가보다 주가가 상승했을 때는 빨간색으로, 주가가 하락했을 때는 파란색으로 표시한다.환율의 경우는 마감 시간 없이 계속 변동되기 때문에 장기간의 환율도 꺾은선그래프로 나타낸다.
꺾은선그래프의 양쪽 축의 값 기준을 서로 다르게 할 수도 있다. 예를 들어 왼쪽 축은 기온(최대 35, 최소 -10), 오른쪽 축은 강수량(최대 500, 최소 0)으로 하여 각각에 대한 그래프를 작성하는 식. 물론 이 때 어느 그래프가 어디에 해당하는지는 표시해야 한다. Microsoft Office에서는 보조 축을 지정하여 이렇게 만들 수 있다.
도수분포를 다각형으로 나타낸 도수분포다각형도 일종의 꺾은선그래프라고 할 수 있다. 단, 이 때 가로축은 시점이 아니라 값의 범위이다.
최댓값과 최솟값을 어떻게 설정하느냐에 따라 같은 내용이라도 변화의 폭이 큰 것처럼, 또는 작은 것처럼 보이게 할 수 있다. 당장 이 문서의 맨 위에 있는 그래프가 이에 해당한다.
막대그래프를 일렬로 이어붙인 형태 그래프를 선그래프라고 부르는 경우도 있다.
'꺾은'은 순우리말, 선(線)은 한자, 그래프(graph)는 영어다. 하나의 단어가 3개국에서 유래한 단어가 합성되어 만들어졌다.
[1] 꺾은선그래프에서 점을 없애고 선 아래의 공간을 영역으로 표시한 그래프다.