AI 학습을 위한 '공개된 개인정보' 활용 - '생성형 인공지능(AI) 개발·활용을 위한 개인정보 처리 안내서'(개인정보위, 2025.8.)의 가이드
개인정보보호위원회는 2025. 08. 06. 생성형 인공지능(AI)의 개발·활용을 위한 개인정보 처리 기준을 제시하기 위한 목적으로, 생성형 인공지능(AI) 개발·활용을 위한 개인정보 처리 안내서를 발간했다.
위 안내서에서는 AI 학습을 위하여 '공개된 개인정보'를 수집·이용하는 행위에 대하여도 일정한 가이드를 제시하고 있으며, 그 내용은 아래와 같다(안내서 10페이지).
공개된 개인정보의 수집·이용 LLM 등 기초모델을 개발하는 경우에는 대량의 데이터를 스크래핑 방식으로 직접 수집하거나 거대 말뭉치 등을 사용하는 것이 현실적 관행으로 자리잡고 있습니다. 이러한 기초모델이 실제 현실에 관한 광범위한 지식과 적응력을 확보하기 위해서 공개된 개인정보 처리의 필요성이 인정될 수 있으나, 무분별한 스크래핑을 통한 권리침해 우려도 있으므로 적법성·안전성 확보에 특히 주의를 기울여야 합니다. 특정 서비스 매개 없이 인터넷 공간에서 개인정보를 수집하는 경우, 기업·기관과 정보주체 사이에 직접적인 관계가 형성되지 않아 동의·계약과 같은 적법근거를 적용하는 것이 어려울 수 있습니다. 이 경우 실질적으로 고려할 수 있는 적법근거로는 정당한 이익 조항(法제15조제1항제6호)이 있으며, 이를 충족하기 위해서는 ▲목적의 정당성 ▲공개된 개인정보 처리의 필요성 ▲이익형량의 3가지 기준을 검토해야 합니다. 특히, 이익형량 단계에서 정보주체 권리 침해 가능성을 최소화하기 위한 기술적·관리적 안전조치 및 정보주체 권리보장 방안을 마련하는 것이 핵심입니다.
|
위 내용은 실질적으로, 이전에 발표된 「인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서(2024. 7.)」의 내용을 그대로 인용한 것으로 볼 수 있다.
따라서 새로운 기준을 제시한 것이라기 보다는, 이전에 발표한 기준을 유지한 것으로 볼 수 있으며,
결국 결론을 요약하면, "개인정보보호법 제15조 제1항 제6호의 '정당한 이익' 조항에 근거하여 공개된 개인정보를 수집하여 AI 개발에 이용할 수 있으나, 위 '정당한 이익' 조항에 근거하였다고 주장하려면 ▲목적의 정당성 ▲공개된 개인정보 처리의 필요성 ▲이익형량의 3가지 기준을 충족해야 한다."