π Present-Data-Generation/
βββ dataset/
β βββ images/ # ν¬λ‘€λ§ μ΄λ―Έμ§ μ μ₯ μμΉ (κ° product_idλ‘ ν΄λ μμ±, μμ main μ΄λ―Έμ§μ detail μ΄λ―Έμ§ μ‘΄μ¬)
β βββ products.csv # μ΅μ’
λ°μ΄ν°μ
βββ kakao_crawling.py # μΉ΄μΉ΄μ€ν‘ μ λ¬ΌνκΈ° ν¬λ‘€λ§ μ½λ (ν΄λΉ URL νμ΄μ§μμ μμ nκ°, n'κ°μ νμ΄μ§ νμ)
βββ kakao_crawling_category.py # μΉ΄μΉ΄μ€ν‘ μ λ¬ΌνκΈ° μΉ΄ν
μ½λ¦¬ νλͺ©λ³ nκ° ν¬λ‘€λ§
βββ product_visualizer_web.py # μν λ°μ΄ν° streamlit μ΄μ© μΉ μκ°ν
βββ generate_description.py # products.csv νμΌμ description νΌμ²λ₯Ό μΆκ°ν csv νμΌ μμ± (gpt api μ΄μ© μμ±μ±)
βββ requirements.txt # νμ΄μ¬ μ€μΉ ν¨ν€μ§
- λ£¨νΈ ν΄λμ dataset μμΆν΄μ νμ¬ μμΉ
streamlit run product_visualizer_web.py
# http://localhost:8501μ μ μ# κ°μνκ²½ μμ± (Linux/MacOS)
python3.11 -m venv env
# (Window)
py -3.11 -m venv env
# μμ‘΄μ± μ€μΉ
pip install -r requirements.txt.env νμΌ λ£¨νΈμ μμ±:
OPENAI_API_KEY=your_openai_api_key_here- prompts/description_generate_prompt.txt νμΌμ μλ ν둬ννΈ μμ
- μμ λ‘κ² few-shot κ°μκ² μΆκ°
- λ¨, 'μνλͺ : {name}'κ³Ό 'μΉ΄ν κ³ λ¦¬: {category}'λ 건λ€μ§ λ§κΈ°
python generate_description.py(μ°Έκ³ : generate_description.py μ½λμμ START λ³μλ csv νμΌμμ μμ±μ μμν μΈλ±μ€μ μμΉ, ENDλ STARTλΆν° λͺ κ°λ₯Ό ν μ§μ΄λ μμ ννΈμ λ§κ² μ‘°μ )