Skip to content

Latest commit

 

History

History
41 lines (33 loc) · 4.47 KB

File metadata and controls

41 lines (33 loc) · 4.47 KB

AutoAuthor 개발 일지: 데이터 기반 SEO 최적화 여정

본 문서는 AutoAuthor의 키워드 분석 파이프라인이 단순 프록시 기반 스코어링에서 고정밀 멀티 플랫폼 데이터 엔진으로 진화한 과정을 기록합니다.


1. 초기 문제점: "데이터의 불확실성"

  • 기존 방식: 구글 자동완성 제안 수(프록시)와 네이버 블로그 문서량만으로 점수 산출.
  • 문제: 구글 제안 수는 실제 검색량을 반영하지 못하며, 네이버와 구글의 데이터가 섞여 정확한 시장 규모 파악이 불가능했음.

2. 해결 단계 1: 네이버 검색광고 API 통합

  • 시도: 실제 월간 검색량을 가져오기 위해 네이버 검색광고 API 도입.
  • 난관: 다어절 키워드(예: '프로젝트 헤일메리') 입력 시 검색 결과가 0으로 나오는 API 제약 발견.
  • 해결: 시드 키워드(콘텐츠 제목)는 공백을 제거하여 시장규모(Market Size) 측정용으로 1회만 호출하고, 롱테일 키워드는 블로그 문서량(공급)으로 나누어 포화율을 산출하는 하이브리드 로직 구축.

3. 해결 단계 2: 유튜브 데이터 API v3 통합 및 멀티 플랫폼 비전

  • 철학의 변화: "어디서나 잘 통하는 키워드"는 없다. 플랫폼별로 수요와 공급이 다르다는 사실에 주목.
  • 구축: 유튜브 API를 통해 상위 영상의 평균 조회수(수요)와 영상 수(공급)를 실시간 측정.
  • 임팩트: 네이버 블로그에서는 경쟁이 심한 키워드(★★)도 유튜브에서는 조회수 대비 영상이 적은 황금 키워드(★★★)임을 데이터로 증명함.

4. 최종 진화: 플랫폼별 포화율(Saturation Rate) 알고리즘

  • 알고리즘: 공급(문서/영상수) ÷ 수요(검색량/조회수) = 포화율
  • 결과: 사용자가 어떤 주제를 선택하든, 해당 플랫폼 시장 내에서의 상대적인 기회 점수를 정교하게 산출하여 등급(★★★) 부여.

AutoAuthor는 이제 단순한 툴을 넘어, 제작자가 "어느 플랫폼에 어떤 내용을 담아야 최고의 성과를 낼지" 결정하게 돕는 전략적 파이티어링 엔진입니다.

5. 최종 확장: API 할당량 한계 돌파와 지연 평가(Lazy Evaluation) 아키텍처

  • 새로운 위기 (API Quota Exhausted):
    • 투-트랙(에버그린+트렌디) 알고리즘 도입으로 인해 키워드 당 유튜브 검색 API 호출량이 2배로 증가함.
    • 영화 1편(키워드 30개) 분석 시 약 6,000 유닛을 소모하여, 구글의 일일 무료 제공량(10,000 유닛)이 영화 2편 만에 고갈되는 403 Forbidden 에러 발생. (결과값이 모두 0으로 출력되는 치명적 버그 야기)
    • 부가적으로, 유튜브 API의 publishedAfter 파라미터가 요구하는 엄격한 RFC 3339 규격(Z 접미사)을 파이썬의 표준 +00:00 포맷이 위반하여 거부당하는 버그 발견.
  • 로직 정교화 (알고리즘 보정):
    • 구글 트렌드 가중치 편입으로 '총 수요(분모)'가 수백만 단위로 커지면서, 기존 5%의 포화도 허들이 너무 관대해져 대부분의 키워드가 별 3개(★★★)를 받는 변별력 상실 문제 발생.
    • 해결: 추천도 허들을 기존 5%에서 0.5%로 10배 이상 대폭 상향(Tightening)하여 황금 키워드의 희소성과 정확도를 극대화. 날짜 파싱 버그 완벽 패치.
  • 아키텍처 혁신 (2-Pass Lazy Evaluation):
    • 시도: 무지성 API 병렬 호출 방식 폐기.
    • 구현: 1단계로 비용이 들지 않는 네이버/카카오 블로그 문서량만 30개 전체 조회 → 수요와 대비시켜 포화도 랭킹을 매김 → 2단계로 가장 '블루오션'인 상위 5개의 키워드만 슬라이싱하여 유튜브 API에 '지연 요청(Lazy Fetch)'하는 2-Pass 알고리즘 도입.
    • 임팩트: API 비용을 무려 83% 절감하면서도 가장 영양가 있는 황금 키워드의 유튜브 데이터는 완벽히 획득. 하루 최대 10편 이상의 영화 트렌드를 거뜬히 소화할 수 있는 강력한 코어 완성.
  • 가치 창출 (Synergy Content Engine):
    • 개별 키워드 기획을 넘어 여러 작품을 '메가 테마'로 묶어 내부 링크(Internal Linking)를 강제하는 '연계 시너지 기획안' AI 허브 모듈 추가. 이는 1인 마케터의 블로그 체류 시간과 애드센스 수익을 직접적으로 펌핑하는 최고급 병기가 됨.