'챗GPT와 랭체인을 활용한 LLM 기반 AI 앱 개발 과정'에서 수행한 미니 프로젝트
- 목표
- 성별/연령별/학력별 운동 미참여 이유 분석
- 데이터 시각화
- 사용 기술
- Python, Pandas, Plotly
- 목표
- 서울시 구별 CCTV 설치 수 분석
- CCTV 인구수 비율 계산
- 산점도 및 라인 플롯 시각화
- 사용 기술
- Python, Pandas, Matplotlib
- 목표
- 구별 치킨집 수 분석
- 다양한 시각화 방법 적용
- 시각화 방법
- 막대 그래프
- 트리맵
- 사용 기술
- Python, Pandas, Matplotlib, Squarify
- 크롤링 대상
- 멜론, 지니, 벅스
- 크롤링 내용
- 1-100위 곡 정보 (사이트명, 순위, 타이틀, 가수)
- 사용 기술
- Selenium
- ChromeWebDriver
- Python, Pandas
- 크롤링 대상
- 유튜브 채널 구독자 수 기준 순위와 정보가 담긴 '유튜브 랭크' 사이트
- 크롤링 내용
- 1-1000위 유튜브 채널 정보 (순위, 채널명, 카테고리, 구독자 수, view 수, 영상 수)
- 사용 기술
- Selenium
- ChromeWebDriver
- Python, Pandas, Matplotlib, Seaborn
- 사용 기술
- Flask, python, html
- task
- 1 : username을 입력받아 조건에 따라 대문자, 소문자로 변환하기
- 2 : 숫자를 입력받아 구구단 출력하기
- 사용 기술
- Flask, python, html
- 서버 기능
- 파일 업로드 / 다운로드 / 삭제
- 사용 기술
- Python, Graphviz
- task
- 비플페이 앱 내부 속성들로 ERD(Entity-Relationship Diagram) 그래프 생성하기
- 목표
- MongoDB의 GridFS를 활용
- 이미지 파일을 저장, 수정, 삭제 및 출력할 수 있는 Python 프로그램 작성
- 사용 기술
- Python, MongoDB, pymongo(MongoDB연결), gridfs(파일 저장 및 관리), Pillow(이미지 출력)
- 목표
- 의료 데이터를 활용하여 심부전(Heart Failure) 예측 모델 개발
- 탐색적 데이터 분석(EDA) 및 데이터 시각화 수행
- 머신러닝 분류 모델을 학습하고 성능 비교 (Logistic Regression, Random Forest, XGBoost 등)
- SMOTE 및 임계값 조정을 통한 모델 최적화
- 사용 기술
- Python, Pandas, Matplotlib, Seaborn (데이터 분석 & 시각화)
- Scikit-learn (머신러닝 모델 학습 및 평가)
- XGBoost (고성능 분류 모델 활용)
- Imbalanced-learn (SMOTE를 통한 클래스 불균형 처리)
- RandomizedSearchCV (하이퍼파라미터 튜닝)
-
목표
- 교육 데이터를 활용하여 학생 성적(Class) 예측 모델 개발
- 탐색적 데이터 분석(EDA) 및 데이터 시각화를 통해 학습 행동 패턴 분석
- 머신러닝 분류 모델을 학습하고 성능 비교 (Logistic Regression, Random Forest, XGBoost, ANN 등)
- 하이퍼파라미터 튜닝을 통한 모델 최적화 및 성능 향상
- 주요 Feature Importance 분석을 통해 성적 예측의 핵심 요인 파악
-
사용 기술
- Python, Pandas, Matplotlib, Seaborn (데이터 분석 & 시각화)
- Scikit-learn (머신러닝 모델 학습 및 평가)
- XGBoost (고성능 트리 기반 분류 모델)
- TensorFlow/Keras (딥러닝 기반 ANN 모델 구축)
- GridSearchCV & RandomizedSearchCV (하이퍼파라미터 튜닝)
-
주요 인사이트
- 학생의 학습 참여(
raisedhands,VisITedResources)와 성적(Class)의 상관관계가 높음 - 결석 횟수(
StudentAbsenceDays)가 많을수록 성적이 낮아질 가능성이 큼 - 랜덤 포레스트가 가장 높은 성능을 기록했으며, 학습 행동 패턴을 반영하는 모델로 적합
- 학생의 학습 참여(