Skip to content

danidanicarrotcarrot/SeSAC_MP

Repository files navigation

🌿 SeSAC_MP

'챗GPT와 랭체인을 활용한 LLM 기반 AI 앱 개발 과정'에서 수행한 미니 프로젝트

  • 목표
    • 성별/연령별/학력별 운동 미참여 이유 분석
    • 데이터 시각화
  • 사용 기술
    • Python, Pandas, Plotly
  • 목표
    • 서울시 구별 CCTV 설치 수 분석
    • CCTV 인구수 비율 계산
    • 산점도 및 라인 플롯 시각화
  • 사용 기술
    • Python, Pandas, Matplotlib
  • 목표
    • 구별 치킨집 수 분석
    • 다양한 시각화 방법 적용
  • 시각화 방법
    • 막대 그래프
    • 트리맵
  • 사용 기술
    • Python, Pandas, Matplotlib, Squarify
  • 크롤링 대상
    • 멜론, 지니, 벅스
  • 크롤링 내용
    • 1-100위 곡 정보 (사이트명, 순위, 타이틀, 가수)
  • 사용 기술
    • Selenium
    • ChromeWebDriver
    • Python, Pandas
  • 크롤링 대상
    • 유튜브 채널 구독자 수 기준 순위와 정보가 담긴 '유튜브 랭크' 사이트
  • 크롤링 내용
    • 1-1000위 유튜브 채널 정보 (순위, 채널명, 카테고리, 구독자 수, view 수, 영상 수)
  • 사용 기술
    • Selenium
    • ChromeWebDriver
    • Python, Pandas, Matplotlib, Seaborn
  • 사용 기술
    • Flask, python, html
  • task
    • 1 : username을 입력받아 조건에 따라 대문자, 소문자로 변환하기
    • 2 : 숫자를 입력받아 구구단 출력하기
  • 사용 기술
    • Flask, python, html
  • 서버 기능
    • 파일 업로드 / 다운로드 / 삭제
  • 사용 기술
    • Python, Graphviz
  • task
    • 비플페이 앱 내부 속성들로 ERD(Entity-Relationship Diagram) 그래프 생성하기
  • 목표
    • MongoDB의 GridFS를 활용
    • 이미지 파일을 저장, 수정, 삭제 및 출력할 수 있는 Python 프로그램 작성
  • 사용 기술
    • Python, MongoDB, pymongo(MongoDB연결), gridfs(파일 저장 및 관리), Pillow(이미지 출력)
  • 목표
    • 의료 데이터를 활용하여 심부전(Heart Failure) 예측 모델 개발
    • 탐색적 데이터 분석(EDA) 및 데이터 시각화 수행
    • 머신러닝 분류 모델을 학습하고 성능 비교 (Logistic Regression, Random Forest, XGBoost 등)
    • SMOTE 및 임계값 조정을 통한 모델 최적화
  • 사용 기술
    • Python, Pandas, Matplotlib, Seaborn (데이터 분석 & 시각화)
    • Scikit-learn (머신러닝 모델 학습 및 평가)
    • XGBoost (고성능 분류 모델 활용)
    • Imbalanced-learn (SMOTE를 통한 클래스 불균형 처리)
    • RandomizedSearchCV (하이퍼파라미터 튜닝)
  • 목표

    • 교육 데이터를 활용하여 학생 성적(Class) 예측 모델 개발
    • 탐색적 데이터 분석(EDA) 및 데이터 시각화를 통해 학습 행동 패턴 분석
    • 머신러닝 분류 모델을 학습하고 성능 비교 (Logistic Regression, Random Forest, XGBoost, ANN 등)
    • 하이퍼파라미터 튜닝을 통한 모델 최적화 및 성능 향상
    • 주요 Feature Importance 분석을 통해 성적 예측의 핵심 요인 파악
  • 사용 기술

    • Python, Pandas, Matplotlib, Seaborn (데이터 분석 & 시각화)
    • Scikit-learn (머신러닝 모델 학습 및 평가)
    • XGBoost (고성능 트리 기반 분류 모델)
    • TensorFlow/Keras (딥러닝 기반 ANN 모델 구축)
    • GridSearchCV & RandomizedSearchCV (하이퍼파라미터 튜닝)
  • 주요 인사이트

    • 학생의 학습 참여(raisedhands, VisITedResources)와 성적(Class)의 상관관계가 높음
    • 결석 횟수(StudentAbsenceDays)가 많을수록 성적이 낮아질 가능성이 큼
    • 랜덤 포레스트가 가장 높은 성능을 기록했으며, 학습 행동 패턴을 반영하는 모델로 적합

About

'챗GPT와 랭체인을 활용한 LLM 기반 AI 앱 개발 과정'에서 수행한 미니 프로젝트

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages