Skip to content

InsightView Space 고도화 1: 정보 수집 자동화 구조 만들기

InsightView Space는 여러 출처에서 정보를 수집하고, AI로 정리한 뒤, WordPress에 글로 발행하는 자동화 프로젝트입니다.

처음에는 단순히 글을 자동으로 만들어주는 도구처럼 생각할 수 있습니다. 하지만 실제로 코드를 살펴보면 이 프로젝트의 핵심은 글쓰기보다 “자료를 어떻게 모으고, 어떤 기준으로 정리하고, 어디까지 자동화할 것인가”에 있습니다.

이 프로젝트가 하려는 일

현재 구조는 크게 아래 흐름으로 구성되어 있습니다.

  1. 복지, 정책, 지원사업, RSS, 뉴스성 자료를 수집한다.
  2. 유튜브 자료가 필요하면 영상과 자막을 가져온다.
  3. 이미지를 웹에 맞게 최적화하고 WordPress에 업로드한다.
  4. AI가 자료를 바탕으로 글 초안을 생성한다.
  5. WordPress에 글을 발행한다.

즉 단순한 글쓰기 자동화가 아니라, 정보 수집부터 발행까지 이어지는 콘텐츠 파이프라인입니다.

처음 자동화에서 생길 수 있는 문제

자동화는 편하지만, 그대로 믿으면 위험한 부분도 있습니다.

  • 수집한 정보가 최신 정보인지 확인해야 합니다.
  • 출처가 서로 다를 때 내용이 충돌할 수 있습니다.
  • AI가 글을 자연스럽게 만들더라도 사실관계가 틀릴 수 있습니다.
  • 자동 발행을 너무 쉽게 열어두면 품질 관리가 어려워질 수 있습니다.

그래서 이 프로젝트의 고도화 방향은 “더 빨리 자동 발행하기”가 아니라 “검토 가능한 자동화로 만들기”가 되어야 한다고 생각했습니다.

현재 구조에서 보이는 장점

현재 스크립트에는 이미 여러 기능이 들어가 있습니다.

  • 복지/정책 API 수집
  • 정부 및 공공 RSS 스캔
  • 유튜브 키워드 추출과 자막 활용
  • 이미지 압축과 WordPress 업로드
  • AI 기반 최종 블로그 글 생성
  • WordPress 발행 함수

이 정도면 단순 실험을 넘어 실제 운영 자동화의 뼈대가 갖춰진 상태입니다.

왜 고도화가 필요한가

기능이 많아질수록 한 파일 안에 모든 로직이 모이면 유지보수가 어려워집니다. 어떤 단계에서 문제가 생겼는지 찾기도 어렵고, 일부 기능만 따로 테스트하기도 힘듭니다.

예를 들어 글이 이상하게 나왔을 때 원인은 여러 가지일 수 있습니다.

  • 처음 수집한 자료가 부족했을 수도 있고
  • 키워드 매칭이 너무 넓었을 수도 있고
  • 유튜브 자막 추출이 실패했을 수도 있고
  • AI 프롬프트가 너무 일반적이었을 수도 있고
  • WordPress 발행 직전 검토 단계가 없었을 수도 있습니다.

그래서 각 단계를 나누어 기록하고, 실패 지점을 추적할 수 있게 만드는 것이 중요합니다.

개선 방향

앞으로는 아래 방향으로 고도화하려고 합니다.

  • 수집, 분석, 글 생성, 이미지 처리, 발행 단계를 기능별로 분리하기
  • 각 단계마다 로그를 남기기
  • AI가 생성한 글을 바로 발행하지 않고 검토 상태로 저장하기
  • 출처 링크와 수집 시간을 글 안에 명확히 남기기
  • 중복 글감과 낮은 품질의 자료를 걸러내기

이번 기록에서 배운 점

자동화는 사람을 완전히 빼는 것이 아니라, 사람이 더 중요한 판단에 집중하도록 반복 작업을 줄이는 방향이어야 합니다.

InsightView Space도 마찬가지입니다. 자료 수집과 초안 생성은 AI와 코드가 도와줄 수 있지만, 최종적으로 어떤 글을 발행할지, 그 정보가 믿을 만한지는 사람이 확인해야 합니다.

콘텐츠 자동화의 핵심은 많이 발행하는 것이 아니라, 검토 가능한 흐름을 만드는 것이다.