task12

kc_bert topic modeling

Introduction

PyTorch Trainer와 Pretrain된 KcBERT 기반 ratsgo-nlp 실습코드를 AI-hub에서 제공해주는 요약문 및 레포트 생성 데이터를 이용해 Finetuning하고 문서 형식을 분류해주는 서비스

폴더 구성

documents : 추론할 때 쓰이는 txt 파일 문서
report : train data와 validation data json 파일이 있는 폴더, Tokenizer 저장
train_result_csv : 학습이 완료된 후, 각 에폭마다 loss, accuracy 값을 csv 파일을 저장하는 폴더
plots : 학습이 완료된 후, loss, accuracy 그래프 png 파일을 저장하는 폴더
model : 학습이 진행된 체크포인트 저장 폴더, 저장한 체크포인트는 추후 추론에 활용
src : 수정한 ratsnlp 패키지가 다운로드되는 폴더

파일 구성

classification_finetuning.ipynb : 입력 전처리 작업, 체크포인트 모델 만드는 코드 (train, validation)
doc_cls_deploy_finetuning.ipynb : 추론 서비스 코드
Summary.pdf : task12에 대한 내용 개요

트리 구조

task12-main
└── task12-main
    ├── .gitignore
    ├── classification_finetuning.ipynb
    ├── documents
    │   ├── briefing.txt #보도자료
    │   ├── edit.txt #사설
    │   ├── history.txt #역사 기록물
    │   ├── koreabank.txt #연설문
    │   ├── meeting.txt #회의록
    │   ├── meeting2.txt #회의록
    │   ├── meeting3.txt #보고서(AI 허브 데이터)
    │   ├── minute1.txt #회의록(AI 허브 데이터)
    │   ├── news.txt #뉴스
    │   ├── news2.txt #사설
    │   ├── test05.txt #사설
    │   ├── ti.txt #문학작품
    │   └── untitled.txt #뉴스
    ├── doc_cls_deploy_finetuning.ipynb
    ├── LICENSE
    ├── model
    │   ├── epoch=@-val_loss=@@@ckpt
    │   └── lightning_logs
    ├── plots
    │   ├── test07_acc_batch512_seq256_epoch79_lr5e-05.png
    │   └── test07_loss_batch512_seq256_epoch79_lr5e-05.png
    ├── README.md
    ├── report
    │   ├── data_frame.ipynb
    │   ├── test.json
    │   └── train.json
    ├── requirements.txt
    ├── setup.py
    ├── src
    │   ├── ratsnlp
    │   │   ├── nlpbook
    │   │   │   ├── classification
    │   │   │   │   ├── arguments.py
    │   │   │   │   ├── corpus.py
    │   │   │   │   ├── deploy.py
    │   │   │   │   ├── task.py
    │   │   │   │   ├── __init__.py
    │   │   │   │   └── __pycache__
    │   │   │   ├── data_utils.py
    │   │   │   ├── metrics.py
    │   │   │   ├── trainer.py
    │   │   │   ├── utils.py
    │   │   │   └── __init__.py
    │   │   └── __init__.py
    │   ├── readme.md
    │   └── requirements.txt
    ├── summary.pdf
    └── train_result_csv
        └── loss_acc_info_batch512_seq256_epoch79_lr5e-05_test07.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

task12

Introduction

폴더 구성

파일 구성

트리 구조

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
documents		documents
model		model
plots		plots
report		report
src		src
train_result_csv		train_result_csv
LICENSE		LICENSE
README.md		README.md
Summary.pdf		Summary.pdf
classification_finetuning.ipynb		classification_finetuning.ipynb
doc_cls_deploy_finetuning.ipynb		doc_cls_deploy_finetuning.ipynb
requirements.txt		requirements.txt
setup.py		setup.py

Folders and files

Latest commit

History

Repository files navigation

task12

Introduction

폴더 구성

파일 구성

트리 구조

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages