나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2024-04-21 00:19:41

빅데이터분석기사

컴퓨터 분야 자격 제도
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1px -11px"
<colbgcolor=#f5f5f5,#333> 국가기술자격 기술사 정보관리기술사 컴퓨터시스템응용기술사 정보통신기술사
기사 정보처리기사 정보보안기사 전자계산기조직응용기사 전자계산기기사
빅데이터분석기사 로봇소프트웨어개발기사 임베디드기사 정보통신기사
산업기사 정보처리산업기사 정보보안산업기사 사무자동화산업기사
컴퓨터응용가공산업기사 전자계산기제어산업기사 정보통신산업기사
기능사 정보처리기능사 정보기기운용기능사 전자계산기기능사
컴퓨터응용선반기능사 컴퓨터응용밀링기능사 전자캐드기능사
컴퓨터그래픽스운용기능사 웹디자인기능사 전자출판기능사
서비스분야
국가기술자격
전자상거래관리사
전자상거래운용사
컴퓨터활용능력
(1급/2급)
멀티미디어콘텐츠
제작전문가

(산업기사급)
게임국가기술자격
(기획/그래픽/프로그래밍)
(기사급)
전산회계운용사 한글속기 워드프로세서 사회조사분석사
국가공인
민간자격
전산세무회계 ERP정보관리사 AT 자격시험 IT+정보활용능력인증
네트워크관리사1) PC정비사 리눅스마스터 SQLD
SQLP RFID GL/SL e-Test ITQ
GTQ/GTQi2) DIAT PC활용능력평가 PC Master(정비사)
IEQ 데이터아키텍처 데이터분석 전문가/준전문가(ADP/ADsP) SW테스트전문가3)
국가등록
민간자격
SW코딩자격 AIFB 문서실무사 COS Pro
한글플러스 엑셀플러스 파워포인트플러스 CAS활용능력
디지털영상편집 수사속기 코딩활용능력
국제자격 ICDL MOS OCJP OCP
SCEA CC
(Cisco Certificated)
CISA CISSP
PMP ACE Test
※ 부분공인민간자격은 공인민간자격에만 기재하고 따로 주석을 첨부함.
1) 네트워크관리사는 2급만 국가공인자격임. (1급은 등록민간자격)
2) GTQ 및 GTQi는 1급/2급만 국가공인자격임. (GTQ/GTQi 3급 및 GTQid는 등록민간자격)
3) SW테스트전문가는 일반등급만 국가공인자격임. (고급은 등록민간자격)
}}}}}}}}}
빅데이터분석기사
빅데이터分析技士
Engineer Big Data Analysis
중분류 211. 정보기술
관련부처 과학기술정보통신부
통계청
시행기관 한국데이터산업진흥원
1. 개요2. 상세
2.1. 신설2.2. 기본정보2.3. 시험정보
2.3.1. 응시자격 2.3.2. 합격기준 및 기타2.3.3. 필기
2.3.3.1. 빅데이터 분석 기획2.3.3.2. 빅데이터 탐색2.3.3.3. 빅데이터 모델링2.3.3.4. 빅데이터 결과 해석
2.3.4. 실기
2.3.4.1. 제공환경2.3.4.2. 검정과목
3. 논란 및 사건사고4. 기타5. 공부 요령6. 둘러보기

1. 개요

자격시험 소개 사이트

대한민국기사자격증. 2019년에 창설되었다. 유사자격증인 ADP, ADsP와 통합되는 안과 별개로 추진되는 안이 논의되었으나 결국 별개의 자격증으로 확정되었다. ADP, ADsP, 빅데이터분석기사 모두 한국데이터산업진흥원에서 주관한다는 점과 출제 기준에서 상당한 공통점을 보이나 난이도의 차이가 있다. 공식적이진 않지만 일반적으로 ADsP < 빅데이터분석기사 < ADP 순으로 인식된다. 따라서 빅분기를 취득한 경우 ADsP를 따는 것은 그다지 권장되지 않는다. ADP를 따기 위해서거나, 자격증은 다다익선이라고 생각하는 사람의 경우는 따도 무관하며 시험범위도 상당히 겹쳐 빅분기 합격자라면 어렵지 않게 합격가능하다.

빅데이터분석기사 시험은 2021년 4월 17일 첫 시험을 치렀고, 1년에 2회 실시한다. 이 자격의 주관은 과학기술정보통신부통계청이며, 자격증에는 과학기술정보통신부장관통계청장이 적혀 나온다. 자격증은 상장형과 카드형 실물자격증으로 발급된다. 카드형은 2023년부터 발급이 가능해졌으며 발급비용으로 약 6천원 정도를 받는다. 발급까지는 약 2주 정도 소요된다.

2. 상세

2.1. 신설

[ 공고문 보기 ]
파일:20200131_101351_671.jpg

수탁기관 심의결과 2020년 1월 28일부로 2020년 12월 31일까지 약 1년간 한국데이터산업진흥원이[1] 빅데이터 분석기사 수탁기관으로 지정되었다. 관련 공지에 따르면 주무부처가 수탁기관 변경을 요청하지 않으면 자동 연장된다고 써있는 것으로 보아 계속 한국데이터산업진흥원이 수탁업무를 수행할 것으로 보인다.

2.2. 기본정보

2.3. 시험정보

2.3.1. 응시자격 [3]

다음 중 하나에 해당하는 사람 (※ 졸업증명서 및 경력증명서 제출 필요)

2.3.2. 합격기준 및 기타

2.3.3. 필기

구분 과목명 배점
1과목 빅데이터 분석기획 25
2과목 빅데이터 탐색 25
3과목 빅데이터 모델링 25
4과목 빅데이터 결과 해석 25

시험 방식은 객관식, 각 과목당 20문제로 구성되어 있다. 시험 시간은 총 120분이다. 과목당 8문제 이상을 맞혀야 하며, 한 과목이라도 8문제 미만으로 맞힐 경우 총점이 평균 60점 이상이라도 과락으로 불합격이다. 문제는 공개하지 않으며, 시험장에서 시험지를 걷어간다. 현행 기사 제도에서는 유일한 필기 비공개 시험이다. [4][5] 최초 시행된 2021년 제2회 필기시험에서는 예상보다 통계 관련 문제가 많이 나와 수험생들을 멘붕에 빠트렸다. 합격률이 한 자릿수가 아니냐는 의견도 나왔으나 필기 합격률은 40%대로 꽤 높은 편이다.
2.3.3.1. 빅데이터 분석 기획
주요항목 세부항목 세세항목
빅데이터의 이해 빅데이터 개요 및 활용 빅데이터의 특징
빅데이터의 가치
데이터 산업의 이해
빅데이터 조직 및 인력
빅데이터 기술 및 제도 빅데이터 플랫폼
빅데이터와 인공지능
개인정보 법·제도
개인정보 활용
데이터 분석 계획 분석 방안 수립 분석 로드맵 설정
분석 문제 정의
데이터 분석 방안
분석 작업 계획 데이터 확보 계획
분석 절차 및 작업 계획
데이터 수집 및 저장 계획 데이터 수집 및 전환 데이터 수집
데이터 유형 및 속성 파악
데이터 변환
데이터 비식별화
데이터 품질 검증
데이터 적재 및 저장 데이터 적재
데이터 저장
2.3.3.2. 빅데이터 탐색
주요항목 세부항목 세세항목
데이터 전처리 데이터 정제 데이터 정제
데이터 결측값 처리
데이터 이상값 처리
분석 변수 처리 변수 선택
차원축소
파생변수 생성
변수 변환
불균형 데이터 처리
데이터 탐색 데이터 탐색 기초 데이터 탐색 개요
상관관계 분석
기초통계량 추출 및 이해
시각적 데이터 탐색
고급 데이터 탐색 시공간 데이터 탐색
다변량 데이터 탐색
비정형 데이터 탐색
통계기법 이해 기술통계 데이터요약
표본추출
확률분포
표본분포
추론통계 점추정
구간추정
가설검정
2.3.3.3. 빅데이터 모델링
주요항목 세부항목 세세항목
분석모형 설계 분석절차 수립 분석모형 선정
분석모형 정의
분석모형 구축 절차
분석 환경 구축 분석 도구 선정
데이터 분할
분석기법 적용 분석기법 회귀분석
로지스틱 회귀분석
의사결정나무
인공신경망
서포트벡터머신
연관성분석
군집분석
고급 분석기법 범주형 자료 분석
다변량 분석
시계열 분석
베이지안 기법
딥러닝 분석
비정형 데이터 분석
앙상블 분석
비모수 통계
2.3.3.4. 빅데이터 결과 해석
주요항목 세부항목 세세항목
분석모형 평가 및 개선 분석모형 평가 평가 지표
분석모형 진단
교차 검증
모수 유의성 검정
적합도 검정
분석모형 개선 과대적합 방지
매개변수 최적화
분석모형 융합
최종모형 선정
분석결과 해석 및 활용 분석결과 해석 분석모형 해석
비즈니스 기여도 평가
분석결과 시각화 시공간 시각화
관계 시각화
비교 시각화
인포그래픽
분석결과 활용 분석모형 전개
분석결과 활용 시나리오 개발
분석모형 모니터링
분석모형 리모델링

2.3.4. 실기

실기 프로그램은 R(프로그래밍 언어) 또는 Python 중에서 수험자가 직접 선택하여 응시 가능하다. 시험 시간은 180분.

제5회 실기시험까지 단답형 10문제(각 3점씩)와 데이터 전처리 능력을 보는 작업형1 3문제(각 10점씩), 제공되는 데이터를 전처리하여 예측 모델링을 수행하는 작업형2 1문제(40점)가 출제되었으나, 제6회 실기시험부터는 단답형 10문제가 없어지고 가설검정 능력을 평가하는 작업형3 2문제(30점)가 출제된다. 총점 60점을 넘으면 합격한다.

실제 6회 시험에서는 작업형3 문제가 3문제 출제되었고, 출간된 교재나 강의에서 다루는 범위가 아닌 회귀 문제도 나왔다.
문제 오류로 인해서 전원 정답처리된 문제가 2문제 가량 있었는데, 시험 유형 자체가 자리를 잡지 못하고 매번 유형이 바뀌고 있는 점이 수험생들에게는 난이도 떡상의 요인이 될 것으로 보인다.

작업형3 문제를 풀기 위해서는 통계학 개론 수준의 내용은 알고 있어야 하는 만큼 철저한 코딩 준비가 필요하다.

7회 시험에서는 작업형 1과 작업형 2는 무난하게 나왔고 이전 기출과 비슷한 난이도로 출제된 것으로 보인다.
작업형 3 문제에서는 파이썬 기준 scipy 라이브러리 안에 있는 stats 모듈로는 도저히 풀수 없는 문제들만 나왔고, statsmodels 모듈을 알아야 풀 수 있는 문제만 출제되었다. 출제 기조가 statsmodels 모듈만을 활용할 수 있어야 문제를 풀 수 있는 방향으로 변모하였다.
2.3.4.1. 제공환경
클라우드 기반 코딩 플랫폼이 제공된다. 특징이라면 시각화 패키지가 제공되지 않는다. Jupyter Notebook처럼 셀 혹은 줄 단위로 실행시킬 수 없고, 전체 코드를 한 번에 실행해야 한다. 또한 자동완성 기능도 제공되지 않으므로 유의할 것. 즉 코드를 완벽하게 외워야 한다.[6]코드 실행시간은 최대 1분이며, 1분을 넘기면 자동 실행취소된다. 아래 링크의 환경을 참고.
2.3.4.2. 검정과목
검정과목은 1개로 '빅데이터 분석 실무'이며 주요 항목은 아래와 같다.

3. 논란 및 사건사고

- 작업형2 채점오류 사태: 실기 작업형2 1문제 같은 경우 응시자들의 점수가 만점(40점)과 0점이라는 극단적인 분포로 갈라져 있으며, 파이썬으로 코드를 제출한 경우가 만점이 많고 R로 코드를 제출한 경우가 0점이 많은 것으로 나타났다. 이는 시스템 오류 때문인 것으로 밝혀졌고, 이에 대해 당시 긴급공지가 올라왔다. 진흥원 측에서는 전수조사를 실시한 결과를 수험자 개별로 문자를 발송하여 변동 여부를 통보하였으며, 사전사후 검사결과를 비교할 수 있도록 공개할 것임을 공지하였고 실기 재검토 결과를 안내하였다. 관련공지1 관련공지2 진흥원에 직접 방문하여 코드 확인을 한 사례가 존재한다. 방문 후기 이 글에서처럼 코드 실행 시간의 1분 준수 여부가 매우 큰 제약점으로 작용하였으며, 향후 시험을 준비하는 수험생들이 반드시 염두에 두어야 할 사항이다. 무능원이라는 말이 돌 정도로 여러 가지 측면에서 주관기관 대응이 미흡한 점이 눈에 띄며, 빅분기 역시 큐넷으로 이관하는 것이 좋겠다는 의견이 수험생들 사이에서 전반적으로 돌고 있다.
이 채점 번복 사태는 2021년 국정감사에도 소환됐다. [국감2021] 불합격→합격 489명··· K-DATA, 허술한 시험관리 논란 채점 프로그램의 오류 때문으로 드러났으며, 2000여 명 중 489명이 불합격에서 합격으로, 19명이 합격에서 불합격으로 합격여부가 번복됐다.

4. 기타

종목 개발 연구에 따르면 ADsPADP 사이의 수준이다.

2020년에 정보처리기사가 개정되어 난이도가 올라가자 정보처리기사를 징검다리 삼아 다른 기사 응시자격을 갖추려던 비전공자들이 전자계산기조직응용기사나 빅데이터분석기사를 대신 보겠다고 하기도 했다. 하지만 빅데이터 분야가 상당한 통계학 지식을 요구하는지라 비전공자가 접근하기엔 어려울 것으로 보인다.

시험마다 다르긴 하나, 매 시험 응시자는 약 6천명이며, 최종합격자는 2천명 정도인 듯하다. 4회 시험까지는 필기 합격률이 50%가 안 되었으나 5회부터는 60% 정도로 올라왔고, 대신에 실기시험 합격률이 약 60%에서 50%정도로 하락했다.

5. 공부 요령

역사가 오래되지 않은데다 문제를 공개하지 않다보니 응시자들의 기억에 의존하여 문제가 복원된 것이 전부여서 준비하는 것이 영 순탄치 않은 시험이다. 게다가 위 사건사고에서 보다시피 출제오류나 문항오류도 빈번해 수험생들의 원성이 자자하다. 출제경향도 시험에 따라 들쑥날쑥하다는 평가가 있었으나, 점점 안정화되고 있다는 평도 있다.

필기시험은 기출복원문제를 구해서 여러번 보되, 최소 한 번은 교재를 훑어보는 게 좋다. 48문제를 맞출 수 있도록 한다.
실기시험은 구름이라는 IDE 환경에서 실시하는데, 코랩이나 주피터 노트북에서 연습을 하다가 시험장에서 처음 써보면 구리고 안 되는 게 많아서 매우 당황스러울 수 있다. 사전에 시험환경 체험 페이지를 이용하여 연습해보는 것을 권장한다.

팁이라면, 1분 내 코드가 반드시 동작되어야 하므로 길고 복잡한 코드는 추천되지 않는다. 사실상 합격 유무를 가르는 40점짜리 작업형2에서 하이퍼 파라미터 등을 튜닝하기 위해 복잡한 코드를 쓰는 것보다 전처리 후 단순히 모델 두세 개 정도를 디폴트 값으로 돌려보고 가장 모델링 점수가 좋은 것으로 제출하는 것이 좋다.

6. 둘러보기

🏬 사회과학 조사·연구 방법론 둘러보기
{{{#!wiki style="margin: 0px -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -2px -11px"
<colbgcolor=#C1F3FF>📝 서론<colbgcolor=#F7FFFF,#191919>사회과학 · 과학적 방법 · 사회조사 · 연구 · 가설 · 이론(이론적 조망) · 연구윤리
🔍 조사방법론 I변인 · 정의 · 상관관계와 인과관계 · 실험(실험설계 · 통제 · 통제집단과 실험집단) · 사례연구
자료 · 자료수집(면접법 · 초점집단면접법 · 질문지법 · 관찰법) · 코딩
📈 조사방법론 II표본조사 · 지표 · 측정 · 신뢰도와 타당도 · 지수 · 척도
📊 사회통계통계적 방법 · 기술통계학 · 확률 및 분포 · 추론통계학 · SPSS · 분석기법(분산분석 · 회귀분석)
👔 공인 자격증사회조사분석사 · 빅데이터분석기사 · 국가공인 데이터분석 전문가
📂 메타 문서연구방법론 관련 정보
상기 문서들은 한국통계진흥원 및 한국산업인력공단의 출제범위에 의거하여 엄격히 망라되어 있으며, 동 기관의 과목별 구분·명명에 의거하여 조사방법론은 2파트로 구분됨
}}}}}}}}} ||



[1] ADP, ADsP, SQLP, SQLD 등의 데이터 관련 자격증 시험을 주관[2] 본디 기사 시험 응시 자격은 관련 학과 학사 학위(또는 취득 예정자), 또는 현업에서 일정 기간 이상의 종사를 요구한다. 그러나 "국가기술자격의 종목별 관련학과 고시"(#)에서 '정보기술' 분야에 포함되는 정보관리기술사, 컴퓨터시스템응용기술사, 전자계산기조직응용기사, 정보처리기사, 정보보안기사, 빅데이터분석기사, 사무자동화산업기사, 정보처리산업기사, 정보보안산업기사의 8개 자격은 모든 학과가 응시 가능하다. 즉, 4년제 대학교만 졸업하면 관련 학과를 졸업했다고 인정한다는 의미이다.[3] 국가기술자격법 시행령 별표4의2[4] 타 기사시험도 인터넷에서는 공개하지 않으나, 문제지를 회수하지 않아 각종 웹사이트에서 시험문제가 공유된다.[5] 2021년까지 정보보안기사도 비공개였지만 2022년 KCA 한국방송통신전파진흥원으로 이관되면서 공개되었다.[6] help나 dir 등은 사용가능함.[7] 즉 빅분기는 사실상 2회시험이 초대 시험이다.[8] 연도별 월평균을 구하는 문제였다.[9] 7회부터는 답안제출 방식도 변경되었으며, 메모장도 시스템에 내장된 메모장만 쓸 수 있도록 변경됐다.

분류