빅데이터 분석기사는 데이터 분석 분야를 준비하고 계신 분들중 대부분의 분들이 준비하는 자격증입니다. 이 글에서는 비전공자에 노베이스 실력이어도 빅데이터 분석기사(빅분기) 실기에 합격할 수 있는 저의 팁과 후기를 말씀드리겠습니다.
빅데이터 분석기사 실기
소위 '빅분기'라고 불리는 빅데이터 분석기사 자격증은 필기와 실기로 나누어져 있습니다. ADSP, SQLD와 함께 정말 많은 분들이 도전하시는 자격증이고 그중에서도 실기가 있고 '기사'라는 이름이 붙어 있기에 효용성이 높은 자격증 중 하나입니다.
이 글에서는 필기보다는 실기를 주제로 말씀드릴 생각입니다.
생각보다 빅분기 실기에서 몇 번씩 재시험을 보거나 포기하시는 분들이 많은 것 같습니다. 시간이 부족하다고 시험을 보기도 전에 다음 시험을 기약하시는 분들도 있고요. 그도 그럴 것이 빅분기라는 시험 자체가 비전공자나 노베이스 분들이 갑자기 도전하기엔 어려운 부분들이 있기 때문입니다.
기본적으로 데이터 분석의 흐름도 알아야 하고 코딩도 할 수 있어야 합격할 수 있으니까요.
저도 완전 비전공자는 아니지만 비슷한 처지에 있었고, 심지어 시험이 일주일 정도 남은 상황에서 공부를 시작했기에(실제 공부 시간은 약 3) 더 막막한 심정이었습니다. 솔직히 다음 시험을 봐야겠다는 생각도 하고 있었죠.
하지만 지금 공부를 다 마치고 합격을 한 입장에서 보면 빅분기 실기는 일주일 정도만 있어도, 노베이스여도 충분히 합격할 수 있는 자격증이라는 생각을 가지고 있습니다.
이제부터 그 이유와 방법에 대해 자세히 설명해 드리겠습니다.
내용에 들어가기에 앞서 제가 공부한 자료들에 대해 말씀드리겠습니다.
1. 데이터 마님 사이트
데이터 마님은 빅데이터 분석기사나 ADP 자격증의 실기를 준비하시는 분들이 정말 많이 애용하시는 사이트입니다. 기출 문제, 연습 문제, 기본 문제 등을 풀 수 있으며 많은 문제의 동영상 강의도 있어서 제 개인적으로는 빅데이터 분석기사 실기를 준비하시는 분이라면 꼭 친해져야 하는 사이트라고 생각합니다. 구글에 '데이터 마님'을 검색하셔서 이용하시면 됩니다. 모든 컨텐츠가 무료입니다.
2. 빅분기 실기 3일 합격 전자책
사실 제가 다음 시험을 준비하지 않고 이번 시험을 준비할 수 있도록 마음을 잡게 해준 책입니다. 시험 일주일 정도 남았을 때 거의 포기한 심정으로 '빅분기 실기 벼락치기' 등을 검색하다가 발견한 책인데요. 해당 책 내용에 납득하여 다시 마음을 다잡고 공부를 시작하게 되었습니다. 이 포스팅 또한 해당 책 내용을 적극 반영하여 공부한 저의 수기라고 이해해 주시면 될 것 같습니다.
빅데이터분석기사(빅분기) 실기는 어떤 시험?
인터넷에 검색하면 깔끔하게 정리돼 있는 내용들은 검색을 하셔서 확인하시는 것을 추천합니다.
저는 빅분기 실기를 합격하기 위해서 파악해야 하는 빅데이터분석기사 실기의 본질에 대해서 말씀해 드리려고 합니다.
우선 빅분기 실기는 총 3과목으로 나누어져 있습니다.
1과목은 '판다스(파이썬)을 활용한 데이터 전처리'
2과목은 '머신러닝 모델 구축 및 활용'
3과목은 '통계'
이렇게 이해하시면 됩니다. 가장 중요한 것은 '어떻게 시험에 합격할 수 있지?' 즉 시험을 이해하고 전략을 짜는 것입니다. 전략부터 간단히 소개해 드리면 '2과목은 완벽하게 이해 및 암기하여 만점을 받고, 3과목에서 무조건 알아야 하는 내용들을 파악해 얻어야 하는 점수를 얻고, 1과목에서 추가 점수를 받자'입니다.
각 과목의 내용과 상세한 공부법은 아래에서 자세하게 보도록 하고 전반적인 내용을 말씀드리자면, 빅분기 실기는 1과목 30점, 2과목 40점, 3과목 30점으로 구성되어 있고, 과락 없이 총점 60점만 넘기면 되는 시험입니다.
즉 완벽하게 준비해서 100점부터 실점을 최소화해야 하는 시험이 아닌, 0점부터 시작하여 확보해야 하는, 확보하기 용이한 점수들을 차근차근 쌓아가야 하는 시험이라는 것이죠.
다행히도 빅분기 실기는 그러기에 굉장히 좋은 시험입니다. 많은 문제들이 기출 문제를 답습하고 있으며, 적어도 80%의 내용은 이전 기출을 분석하고 특정한 내용들을 공부하면 맞출 수 있도록 출제됩니다. 그러니 그러한 내용들에 시간을 투자한다면 누구든 합격할 수 있는 시험인 것입니다.
이제 과목별로 어떤 내용이 나오는지 간단하게 살펴보고 어떻게 공부하면 좋을지 말씀해 드리도록 하겠습니다.
1과목 공부법 : 데이터 핸들링 (판다스)
장담하는데 1과목이 가장 까다로운 과목입니다. '2과목 코드 외우는 거 귀찮고 힘들어.', '3과목 통계 아무것도 몰라서 버려야 하나...'라는 분들이 많습니다. 하지만 빅데이터분석기사 실기의 유일한 장애물은 1과목이라고 해도 과언이 아닙니다.
1과목은 데이터를 핸들링하는 기술을 전반적으로 요구합니다. 데이터를 이렇게 저렇게 자르고 붙이고 뽑아내고 정리하는 등인데요. 이게 어려운 이유는 2과목, 3과목과 다르게 무엇이 나올지 딱 정해져 있지 않고, 모호하다는 것입니다.
2과목은 머신러닝 모델을 돌리기만(전처리 포함) 하면 되고, 3과목은 사실 공부해야 할 것이 많긴 하지만 기출에서 지속적으로 출제되는 부분이 있어서 확보할 수 있는 최소한의 점수가 있습니다. 하지만 1과목은 외워야 할 코드, 원리, 함수 등이 많지만 무엇이 나올지 확정하기가 어렵죠.
그래서 1과목은 너무 많은 양을 공부하기보다는 그래도 중요한 문제들 위주로 공부를 하시고, 여러 번 연습하시는 것이 더 좋습니다. 많은 문제를 풀어봤자 시험장 가서 연습이 부족해 기억이 안 나거나 에러가 계속 나면 어차피 무용지물입니다.
저는 '데이터 마님 전처리 100제' 정도의 문제만 풀어보시고 확실히 자기 것으로 만드시는 것을 추천합니다.
최근 기출인 빅데이터 분석기사 9회 실기 시험에서 1과목이 어렵게 나와서 논란이었는데요. 솔직히 저 100제 정도만 제대로 공부해 놓으셨으면 적어도 세 문제 중 두 문제는 쉽게 맞힐 수 있는 수준이었습니다.
만약에 100제를 완벽히 내 것으로 만드셨는데도 시간이 남거나 여유가있으신 분들은 그때 추가적으로 다른 문제를 푸는 연습을 하시는 것이 맞습니다.
생각보다 시험장에 가면 1과목에서 막히는 경우가 많습니다. 대부분의 분들이 연습이 부족해서 그렇지 함수나 원리를 몰라서 틀리는 경우는 적습니다.
2과목 공부법 : 머신 러닝 모델 구축
2과목은 나오는 패턴이 정해져 있습니다. 지금까지 9번의 시험이 치러졌지만, 한 번도 변수가 없었습니다. 회귀 혹은 분류 모델을 만들고 문제에서 주어진 데이터의 타겟 값을 예측하면 됩니다. 즉, 데이터를 전처리하고 모델을 구축 및 학습한 이후에 테스트 데이터를 예측하고 결과를 저장 및 제출하는 전체적인 코드를 이해하시고 시험장에서 그대로 적용할 수 있도록 많이 연습하시면 끝입니다.
회귀, 분류 모델 코드를 처음 접하시면 굉장히 당황하실 겁니다. 노베이스 분들은 생각보다 긴 코드와 생소한 문법에 포기하고 싶으신 분들이 많을 거예요. 저도 다른 강의와 실습 자료들을 보며 '너무 방대한 것 아닌가?'라는 생각이 들었었는데요.
우선 마음가짐을 이렇게 잡아보세요. '2과목 코드를 이해하고 외우고 연습하는 과정만 제대로 하셔도 시험 합격이 절반 이상 보장 된다.'라고요. 저희가 확보해야 하는 점수 60점 중 2과목은 무려 40점이나 차지합니다. 또한 별다른 부분 점수 없이 모델의 성능으로 점수가 부여되기에 실수만 하지 않는다면 거의 40점이 확실하게 나온다고 생각하시면 됩니다. 그러니 '이것만 제대로 해놓으면 거의 합격이다.'라는 생각으로 코드를 공부하시고 외우시길 바랍니다.
또 저는 앞서 언급한 '빅분기 실기 3일 합격'이라는 글의 코드를 외워서 갔는데요. 다른 컨텐츠에서는 아무래도 여러 가지 시도와 방법론들을 하나의 코드에 담기에 코드가 매우 길고 지저분해서 정말 외우기 빡세다는 생각이 들었는데요. 해당 전자책에서의 코드는 빼야할 것은 모두 빼고 오로지 40점 만점을 받을 수 있는 핵심적인 내용의 코드가 정리되어 있어서 시험 준비 하는 데에 큰 도움이 되었습니다. 이렇게 코드를 정리할 수 있는 능력이 있다면 시험 준비가 용이할 것 같아요.
3과목 공부법 : 통계
어떤 분들은 자꾸 통계를 버리려고 하시는데요. 만약 노베이스라면 1과목보다 3과목 통계를 더 우선적으로 공부해 주셔야 합니다.
그 이유는 앞서 말씀드린 대로 1과목은 뭐가 나올지 모르지만 3과목은 자주 나오는 내용이 정해져 있기 때문입니다.
바로 OLS를 이용한 선형 회귀와 Logit을 이용한 로지스틱 회귀입니다.
3과목에서는 통계는 4번의 기출문제밖에 없습니다. 매번 2문제씩 출제되기 때문에 크게 보면 총 8문제가 출제되었죠. 그중 약 7문제가 저 두 문제에서 나왔습니다.
그러니 당연하게도 저 두 주제에 대해서만 집중적으로 공부해 주시면 최소 15점 정도는 먹고 들어갈 수 있습니다.
게다가 공부해야 할 양이 적고 코드의 길이 또한 짧아서 시간 투자 대비 얻을 수 있는 점수가 많다고 할 수 있습니다.
저도 전자책에 있는 개념과 코드만 공부해서 시험에서 25점의 점수를 확보했습니다. 2과목에서 40점, 3과목에서 25점을 받아서 사실상 이미 최소한으로 확보한 점수에서 합격이 결정 됐죠. 여기에 1과목은 보너스 점수처럼 얻어 여유 있게 합격하였습니다.
다시 정리하자면 빅분기 실기는 점수를 0점에서 쌓아가는 시험입니다. 2과목 코드를 이해하고 완벽히 외워서 40점에 가까운 점수를 얻고, 3과목에서 확보해야 할 점수를 확보하고, 1과목에서 추가 점수를 획득한다면 여유롭게 합격할 수 있는 점수대가 나옵니다.
댓글