[후기]
9월 2일자로 서일대학교에서 ADP 실기 시험을 봤습니다.
통계공부를 더 해야겠다는 결심과 함께 4시간이 결코 길지 않은 시간임을 느꼈습니다. 시간을 재면서 시험 준비를 해야 실전에서 차분하게 데이터를 해석하고 여러 모델을 적용할 수 있겠더라고요. 기본 전처리나 EDA에서 시간을 단축시켜야 하기 때문에 다른 자료를 보지 않고 수행할 수 있는 정도로 pandas library 를 많이 알고 능숙하게 사용할 줄 알아야 합니다. 다른 공부와 병행하여 ADP 실기 준비에만 투자한 시간이 3주가 되지 않았기 때문에 아쉬움을 느끼기보다 당연한 결과라는 생각이 듭니다.
[기계학습]
1-1. 데이터 전처리 및 EDA
1-2. 전처리가 필요한 이유
2-1. 회귀분석에 있어서 만족해야 하는 것을 검증하시오.
2-2. 차원축소가 필요한지 검증하시오.
3-1.세가지 알고리즘 모델을 선정하고 각 모델의 장단점을 서술하시오
3-2. 각 모델을 적용한 후 RMSE 를 구하고 비교하시오
3-3. 선정한 모델을 바탕으로 K Fold validation을 적용하고 그 결과에 대해 설명하시오
4-1. 새로운 데이터(accident.csv) 에서 요일 컬럼을 추가하여 요일을 나타내시오.
4-2. 사고 내용과 다른 각 컬럼과의 관계를 파악하시오
4-3. Logistic Regression과 모델(기억이 나지 않음) 적용하여 비교하시오
4-4.SMOTE를 사용하여 모델을 만들고 결과를 설명하시오
[통계분석]
5. 지역1, 지역2, 지역3, 공장 A, 공장 B, 공장 C가 있을 때 생산량과 수요량이 주어지고, 각 표의 값에는 비용이 적혀 있다. 지역 간 공장 간 운반이 불가능하다고 할 때, 최소 비용으로 생산(운반?)하는 계획을 수립하시오.
6.headset.csv 데이터(headset 3종류, 연령대 3종류, 컬럼 하나(기억이 잘 나지 않음)로 이루어진) 에서 검정통계량과 유의확률을 구하시오
7-1.다섯 가족 중 세 가족 이상이 네명이상의 딸을 가질 확률을 구하시오(딸을 가질 확률 : 0.5)
7-2. 대푯값을 구하시오
자세하게 기억이 나지 않습니다. 그래도 복기한 내용이 도움이 되셨으면 좋겠습니다.
다음 시험은 기필코 만족스럽게 시험을 치르고 나오겠습니다