Skip to content

minuum/NLP1

Folders and files

NameName
Last commit message
Last commit date

Latest commit

ย 

History

12 Commits
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 

Repository files navigation

Ab2Ti: T5์™€ Dynamic Context Gates (DCG)๋ฅผ ํ™œ์šฉํ•œ ๋…ผ๋ฌธ ์ดˆ๋ก-์ œ๋ชฉ ์ƒ์„ฑ ํ”„๋กœ์ ํŠธ

์ด ํ”„๋กœ์ ํŠธ๋Š” T5(Text-to-Text Transfer Transformer) ๋ชจ๋ธ์„ ํ™•์žฅํ•˜์—ฌ Dynamic Context Gates(DCG)๋ฅผ ์ ์šฉํ•œ ์ž์—ฐ์–ด ์ƒ์„ฑ ์‹คํ—˜์„ ๋‹ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ฃผ์š” ์‘์šฉ ์‚ฌ๋ก€๋กœ๋Š” ArXiv ๋…ผ๋ฌธ ์ดˆ๋ก์œผ๋กœ๋ถ€ํ„ฐ ๋…ผ๋ฌธ ์ œ๋ชฉ์„ ์ƒ์„ฑํ•˜๋Š” ์ž‘์—…(Abstract to Title, Ab2Ti)์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค.

ํ”„๋กœ์ ํŠธ ๊ฐœ์š”

๋ชฉ์  ๋ฐ ๋™๊ธฐ

ํ•™์ˆ  ๋…ผ๋ฌธ ์ž‘์„ฑ ์‹œ ์ดˆ๋ก(Abstract)์€ ์™„์„ฑ๋˜์—ˆ์œผ๋‚˜ ์ ์ ˆํ•œ ์ œ๋ชฉ์„ ์ฐพ๊ธฐ ์–ด๋ ค์šด ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ๋ณธ ํ”„๋กœ์ ํŠธ๋Š” ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋…ผ๋ฌธ ์ดˆ๋ก์—์„œ ํ•ต์‹ฌ ๋‚ด์šฉ์„ ํŒŒ์•…ํ•˜๊ณ  ์ ์ ˆํ•œ ์ œ๋ชฉ์„ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด:

  1. ์—ฐ๊ตฌ์ž๋“ค์ด ๋…ผ๋ฌธ ์ œ๋ชฉ ์ž‘์„ฑ์— ์†Œ์š”๋˜๋Š” ์‹œ๊ฐ„๊ณผ ๋…ธ๋ ฅ์„ ์ ˆ์•ฝ
  2. ์ดˆ๋ก์˜ ํ•ต์‹ฌ ๋‚ด์šฉ์„ ํšจ๊ณผ์ ์œผ๋กœ ๋ฐ˜์˜ํ•˜๋Š” ์ œ๋ชฉ ์ƒ์„ฑ
  3. ๋‹ค์–‘ํ•œ ํ•™์ˆ  ๋ถ„์•ผ์— ๋ฒ”์šฉ์ ์œผ๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ ๊ฐœ๋ฐœ

๊ธฐ์ˆ ์  ์ ‘๊ทผ

๊ธฐ๋ณธ T5 ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด Dynamic Context Gates(DCG) ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋„์ž…ํ–ˆ์Šต๋‹ˆ๋‹ค. DCG๋Š” ์†Œ์Šค ์ปจํ…์ŠคํŠธ(์ธ์ฝ”๋”)์™€ ํƒ€๊ฒŸ ์ปจํ…์ŠคํŠธ(๋””์ฝ”๋”) ์‚ฌ์ด์˜ ์ •๋ณด ํ๋ฆ„์„ ๋™์ ์œผ๋กœ ์ œ์–ดํ•˜์—ฌ ์ž์—ฐ์–ด ์ƒ์„ฑ์˜ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด Transformer ๋ชจ๋ธ์˜ ์ž๊ธฐ ์ฃผ์˜(self-attention)์™€ ๊ต์ฐจ ์ฃผ์˜(cross-attention) ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋ณด์™„ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ์…‹

ArXiv ๋…ผ๋ฌธ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ดˆ๋ก์—์„œ ์ œ๋ชฉ์„ ์ƒ์„ฑํ•˜๋Š” ์‹คํ—˜์„ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ์…‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค:

  • ์›๋ณธ ๋ฐ์ดํ„ฐ: Kaggle ArXiv ๋ฐ์ดํ„ฐ์…‹
  • ์ €์žฅ ๊ฒฝ๋กœ:
    • arxiv_data/arxiv-metadata-oai-snapshot.json (์›๋ณธ ๋ฐ์ดํ„ฐ)
    • data/arxiv_papers.json (์ „์ฒ˜๋ฆฌ๋œ ๋ฐ์ดํ„ฐ)

์ฐธ๊ณ : ์›๋ณธ ๋ฐ์ดํ„ฐ์…‹์€ ํฌ๊ธฐ๊ฐ€ 4GB ์ด์ƒ์œผ๋กœ, GitHub์˜ ํŒŒ์ผ ํฌ๊ธฐ ์ œํ•œ(100MB)์„ ์ดˆ๊ณผํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์œ„ Kaggle ๋งํฌ์—์„œ ์ง์ ‘ ๋‹ค์šด๋กœ๋“œํ•˜์—ฌ ์‚ฌ์šฉํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ์…‹ ํŠน์ง•

  • 170๋งŒ ๊ฐœ ์ด์ƒ์˜ STEM(๊ณผํ•™, ๊ธฐ์ˆ , ๊ณตํ•™, ์ˆ˜ํ•™) ๋ถ„์•ผ ๋…ผ๋ฌธ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ
  • 1991๋…„๋ถ€ํ„ฐ ํ˜„์žฌ๊นŒ์ง€์˜ ArXiv ๋…ผ๋ฌธ ์ •๋ณด ํฌํ•จ
  • ๊ฐ ๋…ผ๋ฌธ๋ณ„๋กœ title, abstract, authors, categories ๋“ฑ์˜ ์ •๋ณด ์ œ๊ณต

ํ”„๋กœ์ ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ

  1. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ „์ฒ˜๋ฆฌ:

    • ArXiv ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ์—์„œ ์ดˆ๋ก๊ณผ ์ œ๋ชฉ ์Œ์„ ์ถ”์ถœ
    • ํ…์ŠคํŠธ ์ •์ œ ๋ฐ ํ† ํฐํ™”
    • ํ›ˆ๋ จ/๊ฒ€์ฆ/ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹ ๋ถ„ํ• 
  2. ๋ชจ๋ธ ๊ฐœ๋ฐœ:

    • ๊ธฐ๋ณธ T5 ๋ชจ๋ธ ๊ตฌํ˜„
    • DCG ๋ฉ”์ปค๋‹ˆ์ฆ˜ ์„ค๊ณ„ ๋ฐ ํ†ตํ•ฉ
    • ๋‘ ๊ฐ€์ง€ ๋ฒ„์ „์˜ DCG ๊ตฌํ˜„ (ํ–ฅ์ƒ๋œ ๋ฒ„์ „๊ณผ ๋‹จ์ˆœํ™”๋œ ๋ฒ„์ „)
  3. ๋ชจ๋ธ ํ•™์Šต:

    • ๋‹ค์–‘ํ•œ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ์„ค์ •์œผ๋กœ ์‹คํ—˜
    • ๊ฒŒ์ดํŠธ ์ •๊ทœํ™” ๋ฐ ์ ์‘์  ์ž„๊ณ„๊ฐ’ ์ ์šฉ
    • ์ ์ง„์  DCG ํ™œ์„ฑํ™”๋ฅผ ํ†ตํ•œ ์•ˆ์ •์  ํ•™์Šต
  4. ํ‰๊ฐ€ ๋ฐ ๋ถ„์„:

    • ROUGE, BLEU ๋“ฑ์˜ ๋ฉ”ํŠธ๋ฆญ์„ ํ†ตํ•œ ์ •๋Ÿ‰์  ํ‰๊ฐ€
    • ์ƒ์„ฑ๋œ ์ œ๋ชฉ์˜ ์ •์„ฑ์  ๋ถ„์„
    • ์ผ๋ฐ˜ T5์™€ DCG ์ ์šฉ ๋ชจ๋ธ ๊ฐ„์˜ ์„ฑ๋Šฅ ๋น„๊ต

๋””๋ ‰ํ† ๋ฆฌ ๊ตฌ์กฐ

NLP1/
โ”œโ”€โ”€ __pycache__/          # ํŒŒ์ด์ฌ ์บ์‹œ ํŒŒ์ผ
โ”œโ”€โ”€ .vscode/              # VSCode ์„ค์ •
โ”œโ”€โ”€ arxiv_data/           # ArXiv ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ
โ”œโ”€โ”€ common/               # ๊ณตํ†ต ์œ ํ‹ธ๋ฆฌํ‹ฐ ๋ฐ ๋ชจ๋ธ ์ปดํฌ๋„ŒํŠธ
โ”œโ”€โ”€ data/                 # ํ•™์Šต ๋ฐ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹
โ”œโ”€โ”€ exp_code/             # ์‹คํ—˜ ์ฝ”๋“œ
โ”‚   โ”œโ”€โ”€ dcg_train_2.py    # ํ–ฅ์ƒ๋œ DCG ๋ชจ๋ธ ํ•™์Šต ์ฝ”๋“œ
โ”‚   โ”œโ”€โ”€ rp_dcg_train_3.py # ๋‹จ์ˆœํ™”๋œ DCG ๋ชจ๋ธ ํ•™์Šต ์ฝ”๋“œ
โ”‚   โ””โ”€โ”€ ...               # ๊ธฐํƒ€ ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ํ•™์Šต ์ฝ”๋“œ
โ”œโ”€โ”€ notebooks/            # ์ฃผ์ฐจ๋ณ„ ์‹ค์Šต ๋…ธํŠธ๋ถ
โ”œโ”€โ”€ pdf/                  # ์ˆ˜์—… ์ž๋ฃŒ ๋ฐ ๋ฐœํ‘œ ์ž๋ฃŒ
โ”œโ”€โ”€ source/               # ์†Œ์Šค ์ฝ”๋“œ
โ”œโ”€โ”€ test_markdown/        # ๋งˆํฌ๋‹ค์šด ํ…Œ์ŠคํŠธ ํŒŒ์ผ
โ”œโ”€โ”€ text-to-text-transfer-transformer/ # T5 ๊ธฐ๋ณธ ์ฝ”๋“œ๋ฒ ์ด์Šค
โ””โ”€โ”€ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ1 ์ค‘๊ฐ„์ฃผ์ œ๋ฐœํ‘œ_250409/ # ๋ฐœํ‘œ ์ž๋ฃŒ

ํ•ต์‹ฌ ๋ชจ๋ธ: DCG(Dynamic Context Gates)

1. DCG์˜ ๊ธฐ๋ณธ ๊ฐœ๋…

DCG(Dynamic Context Gates)๋Š” ์†Œ์Šค ์ปจํ…์ŠคํŠธ(์ธ์ฝ”๋”)์™€ ํƒ€๊ฒŸ ์ปจํ…์ŠคํŠธ(๋””์ฝ”๋”) ์‚ฌ์ด์˜ ์ •๋ณด ํ๋ฆ„์„ ๋™์ ์œผ๋กœ ์ œ์–ดํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์ž…๋‹ˆ๋‹ค. ์›๋ž˜ Tu et al.(2017)์ด RNN ๊ธฐ๋ฐ˜ ๊ธฐ๊ณ„ ๋ฒˆ์—ญ์—์„œ ์ œ์•ˆํ–ˆ๋˜ ๊ฐœ๋…์„ Transformer ๊ธฐ๋ฐ˜ T5 ๋ชจ๋ธ์— ์ ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ์•„์ด๋””์–ด:

  • ์†Œ์Šค์™€ ํƒ€๊ฒŸ ์ปจํ…์ŠคํŠธ ๊ท ํ˜• ์กฐ์ ˆ
  • ๊ฒŒ์ดํŒ… ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•œ ์ปจํ…์ŠคํŠธ ์„ ํƒ์  ํ™œ์šฉ
  • ๋‚ด์šฉ์–ด(content words) ์ค‘์‹ฌ์˜ ์ •๋ณด ํ๋ฆ„ ๊ฐ•ํ™”

2. DCG ๊ตฌํ˜„ ๋ฐฉ์‹

2.1 ๋™์  ๊ฒŒ์ดํŠธ ๊ณ„์‚ฐ

gate = sigmoid([c; ht] ยท W + b)
  • c: ์ธ์ฝ”๋” ์ปจํ…์ŠคํŠธ ๋ฒกํ„ฐ
  • ht: ๋””์ฝ”๋” ํ˜„์žฌ ํžˆ๋“  ์Šคํ…Œ์ดํŠธ
  • W, b: ํ•™์Šต ๊ฐ€๋Šฅํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ

2.2 ์ปจํ…์ŠคํŠธ ์œตํ•ฉ

c't = gate * c + (1 - gate) * ht
  • c't: ์œตํ•ฉ๋œ ์ปจํ…์ŠคํŠธ (๋‹ค์Œ ๋ ˆ์ด์–ด ์ž…๋ ฅ)

2.3 ๊ตฌํ˜„ ์ ‘๊ทผ๋ฒ•

ํ”„๋กœ์ ํŠธ์—๋Š” ๋‘ ๊ฐ€์ง€ ์ฃผ์š” DCG ๊ตฌํ˜„์ด ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค:

A. ํ–ฅ์ƒ๋œ DCG (dcg_train_2.py)
  • ๋‹ค์ค‘ ๋””์ฝ”๋” ๋ ˆ์ด์–ด์— DCG ์ ์šฉ (์ „๋žต์  ์œ„์น˜: ๋ ˆ์ด์–ด 0, 2, 4)
  • ๋ฉ€ํ‹ฐํ—ค๋“œ ์–ดํ…์…˜ ๊ธฐ๋ฐ˜ ๊ฒŒ์ดํŒ…
  • ๋‚ด์šฉ์–ด ํŽธํ–ฅ ๋ฉ”์ปค๋‹ˆ์ฆ˜
  • ์œ„์น˜ ์ธ์‹ ๊ฒŒ์ดํŒ…
  • ์ ์‘ํ˜• ์ž„๊ณ„๊ฐ’ ํ•™์Šต
B. ๋‹จ์ˆœํ™”๋œ DCG (rp_dcg_train_3.py)
  • ๋‹จ์ผ ๋””์ฝ”๋” ๋ ˆ์ด์–ด์—๋งŒ DCG ์ ์šฉ (๋งˆ์ง€๋ง‰ ๋ ˆ์ด์–ด)
  • ๋‹จ์ˆœํ™”๋œ ๊ฒŒ์ดํŠธ ๋ฉ”์ปค๋‹ˆ์ฆ˜
  • ์ ์ง„์  DCG ํ™œ์„ฑํ™”๋กœ ์•ˆ์ •์ ์ธ ํ•™์Šต
  • ๊ฒฝ๋Ÿ‰ํ™”๋œ ์•„ํ‚คํ…์ฒ˜

๋ชจ๋ธ ๊ตฌ์„ฑ

๊ธฐ๋ณธ ์„ค์ •

  • ๋ชจ๋ธ: t5-small
  • ๋ฐฐ์น˜ ํฌ๊ธฐ: 8
  • ํ•™์Šต๋ฅ : 3e-5
  • ์—ํญ: 5
  • ์ž…๋ ฅ ๊ธธ์ด: 512 (์ดˆ๋ก)
  • ์ถœ๋ ฅ ๊ธธ์ด: 128 (์ œ๋ชฉ)
  • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ: 9000๊ฐœ ์ƒ˜ํ”Œ
  • ๊ฒ€์ฆ/ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ: ๊ฐ 1000๊ฐœ ์ƒ˜ํ”Œ

์‹คํ–‰ ๋ฐฉ๋ฒ•

๋ฐ์ดํ„ฐ ์ค€๋น„

# Kaggle์—์„œ ArXiv ๋ฐ์ดํ„ฐ์…‹ ๋‹ค์šด๋กœ๋“œ
kaggle datasets download -d Cornell-University/arxiv
# ๋‹ค์šด๋กœ๋“œํ•œ ํŒŒ์ผ์„ arxiv_data ๋””๋ ‰ํ† ๋ฆฌ์— ์••์ถ• ํ•ด์ œ
mkdir -p arxiv_data
unzip arxiv.zip -d arxiv_data

๋ชจ๋ธ ํ•™์Šต

ํ–ฅ์ƒ๋œ DCG ๋ชจ๋ธ ํ•™์Šต:

python exp_code/dcg_train_2.py

๋‹จ์ˆœํ™”๋œ DCG ๋ชจ๋ธ ํ•™์Šต:

python exp_code/rp_dcg_train_3.py

๋ชจ๋ธ ํ‰๊ฐ€

python exp_code/dcg_eval_2.py
python exp_code/rp_dcg_eval_3.py

์‹คํ—˜ ๊ฒฐ๊ณผ

์„ฑ๋Šฅ ๋น„๊ต

๋ชจ๋ธ ROUGE-1 ROUGE-2 ROUGE-L BERT Score F1
Base T5 0.383 0.213 0.348 0.843
AdvancedDCG T5 0.242 0.094 0.204 0.787
SimpleDCG T5 0.389 0.214 0.353 0.844

๊ฒฐ๊ณผ ๋ถ„์„

  • SimpleDCG T5๊ฐ€ ๋ชจ๋“  ํ‰๊ฐ€ ์ง€ํ‘œ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
  • ๋‹จ์ˆœํ™”๋œ DCG ๋ชจ๋ธ์ด ๊ธฐ๋ณธ T5๋ณด๋‹ค ROUGE-1, ROUGE-2, ROUGE-L, BERT Score ๋ชจ๋‘์—์„œ ์†Œํญ ํ–ฅ์ƒ๋œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
  • ํ–ฅ์ƒ๋œ DCG ๋ชจ๋ธ(AdvancedDCG)์€ ์˜คํžˆ๋ ค ์„ฑ๋Šฅ์ด ์ €ํ•˜๋˜์—ˆ๋Š”๋ฐ, ์ด๋Š” ๋ณต์žกํ•œ ๊ฒŒ์ดํŠธ ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ์˜คํžˆ๋ ค ํ•™์Šต์„ ๋ฐฉํ•ดํ–ˆ์„ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๊ธธ์ด ๋ถ„์„ ๊ฒฐ๊ณผ, Base T5๋Š” ํ‰๊ท  ์ œ๋ชฉ ๊ธธ์ด๊ฐ€ 8.1 ๋‹จ์–ด, SimpleDCG T5๋Š” 8.4 ๋‹จ์–ด๋กœ ์‹ค์ œ ๋…ผ๋ฌธ ์ œ๋ชฉ๊ณผ ์œ ์‚ฌํ•œ ๊ธธ์ด๋ฅผ ์ƒ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๊ฒฐ๋ก 

  • RNN ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์—์„œ๋งŒ ์ ์šฉ๋˜๋˜ DCG๋ฅผ Transformer ๊ธฐ๋ฐ˜ T5 ๋ชจ๋ธ์— ์„ฑ๊ณต์ ์œผ๋กœ ์ ์šฉ
  • ๋‹จ์ˆœํ™”๋œ DCG ๊ตฌํ˜„์ด ๊ฐ€์žฅ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ž„ (BLEU ์ ์ˆ˜: 0.087, ROUGE-1: 0.389)
  • ๋ณธ ์—ฐ๊ตฌ๋Š” ๋…ผ๋ฌธ ์ดˆ๋ก์—์„œ ์ œ๋ชฉ ์ƒ์„ฑ์ด๋ผ๋Š” ํŠน์ • ํƒœ์Šคํฌ์—์„œ DCG ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ํšจ๊ณผ๋ฅผ ์ž…์ฆ
  • DCG๋Š” ํŠนํžˆ '๋‚ด์šฉ ์ถฉ์‹ค์„ฑ(content faithfulness)'์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐ ํšจ๊ณผ์ ์ž„

ํ–ฅํ›„ ๊ฐœ์„  ๋ฐฉํ–ฅ

์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ธก๋ฉด

  1. ๊ฒŒ์ดํŠธ ์œตํ•ฉ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๊ฐœ์„ : ์‰ฌ์šด ๋ฐ์ดํ„ฐ ๋ถ€ํ„ฐ ํ•™์Šตํ•˜๋Š” curriculum learning ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ ์šฉ
  2. ์ปค๋ฆฌํ˜๋Ÿผ ๋Ÿฌ๋‹ ์ ์šฉ: ๋ณต์žก๋„๊ฐ€ ๋‚ฎ์€ ์ดˆ๋ก-์ œ๋ชฉ ์Œ๋ถ€ํ„ฐ ์ ์ง„์ ์œผ๋กœ ํ•™์Šต

ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ ์ถ”๊ฐ€

  1. ํ•™์Šต ์ค‘ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ ๋ณด์™„: BERT-Score, METEOR Score ๋“ฑ ์ถ”๊ฐ€ ํ‰๊ฐ€ ์ง€ํ‘œ ๋„์ž…
  2. ์ •์„ฑ์  ํ‰๊ฐ€ ํ™•๋Œ€: ์ธ๊ฐ„ ํ‰๊ฐ€์ž๋ฅผ ํ†ตํ•œ ์ œ๋ชฉ์˜ ํ’ˆ์งˆ ํ‰๊ฐ€

์ฐธ๊ณ  ์ž๋ฃŒ

GitHub ์ €์žฅ์†Œ

https://github.com/minuum/NLP1

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors