동기부여? 동기부여? 동기부여?
왜 해야지? 왜 해야지? 왜 해야지?
답을 찾을수 없다. 그래서 '빅데이터 경진대회' 참여 및 상금 획득으로 했다.
학습계획
항목 | 내용 |
학습목적 | - 2025년/2026년 빅데이터 경진대회 도전 (상금 일천만원이하 확보) - 안산시/경기도 경진대회 |
학습목표 | 80점/100만점 |
자가진단 | 문제가 무엇인지 알고있다. 그러나 R함수로 못 푼다. |
학습방법 | - 주말 영상 청취 - 주중 R 함수 실습 - 암기 및 반복 |
학습자료 | - 동영상 3파트 ( 총20시간, 통계청 통계인재개발원) - NCS 자료 및 관련 서적 - 구글 제미니 |
학습기간 | 05.24() ~ 06.20(금) |
시험일 | 06월 21일(토) 10:00 |
위기요인 | 시간제약 ** 컨설팅 역량교육(5일) 및 컨설팅 시작(6월) ** 슬기로운 직생 배정 |
문제분석 및 자가진단
문제유형 | 내용 | 점수 |
![]() |
데이터전처리 1) 정규화 변환 2) 0.5 큰값 추출 |
30 |
![]() |
Machine Learning 1) 성별예측 모델(train) 2) 성별예측 결과(test) 3) CSV 파일 저장 및 제출 4)제출형식 준수 |
40 |
![]() ![]() |
통계분석 1) 이산변수 독립성검증 2) 로지스틱 회귀분석 3) Odds ratio 구하기 |
30 |
- 문제는 3개유형 9개 문제
- 문제별 첫번째 틀리면 두번째도 틀린다.
- '시각화' 은 없다.
- 텍스트마이닝은 없다
- 40점 과목에 집중해야한다. (** 틀리면 THE END.)
'문제가 무엇을 구해야하는지를 알고 있으나 R함수로 풀수 없다.'
과목 | 세부분류 | 내용 | 자가진단 |
데이터전처리 | 데이터셋 읽기 및 출력 데이터셋 추출 및 조합 변환 (정규화, 표준화) 특이값 처리 NA 처리 기준값 이상 처리 |
설명할수있다. 그러나 R로 못푼다. | |
머신러닝 | 분류모델 | KNN Naive Bayes Logistic Regression ANN Decision tree SVM Ensemble |
|
분류검증 | confusion matrix | ||
예측모델 | Simple linear regression ANN Regression tree SVM Ensemble |
||
예측검증 | Sum of Square | ||
자율 | k-means PCA |
||
통계 | 가설검정 이산변수 독립성검정 교차표 분산분석 상관분석 회귀분석 |
학습자료
항목 | 내용 |
영상 | - 데이터 전처리(2025, 3시간) - R을 활용한 통계분석(2025, 12시간) - 노코딩으로 배우는 머신러닝(2025, 5시간) ** 통계청 통계인재개발원 무료 이러닝 |
디지털교재 | NCS 빅데이터 분석 ** www.ncs.go.kr |
참고서적 | - 데이터과학입문자를 위한 R - R 통계분석 - R 데이터분석 - 경영경제통계학 |
도구 | - R 4.5 - 시험환경 체험 - 구글 제니미 - 구글 칼렌더 |
학습전략
- 머심러닝 문제 40점 100% 확보
- R함수 암기, 반복과 복기
실행계획서
구글 캘린더에 학습량 배분!
주말에 영상 학습 그리고 주중에 R함수 실습순으로 반복!
장소에 상관없이 R함수 실습!
'목적'을 늘 기억하자! '일천만원' ~~^^
도전! GO! GO!

'학습 및 사례' 카테고리의 다른 글
[빅데이터분석기사 실기 3탄] 학습실행 - 머신러닝, Prediction or Regression (0) | 2025.05.27 |
---|---|
[빅데이터분석기사 실기 2탄] 학습실행 - 머신러닝, Classification (0) | 2025.05.25 |
[직접생산확인] 2025년 실태조사원 역량교육 - 학습계획, 학습방법 및 시험결과 (0) | 2025.05.18 |
[직접생산확인] 공장없는 공장주소로 인한 '배정업체 반납' 사례 (0) | 2025.05.12 |
어떤 요인을 변경시키면 성공 확률이 높아질까? - 경기도주식회사 평가참여 사례 (0) | 2025.04.18 |