블로그, 더 나아가 글쓰기의 미래는 어떻게 될 것인가
요즘 상당히 흥미로운 주제이자 사회현상이에요. 작게 보면 블로그, 넓게 보면
글쓰기 전체의 미래가 과연 어떻게 흘러갈 지에 대한 논의는 아직 그렇게 별로
논의되고 있지 않아요. 그렇지만 이는 상당히 중요한 문제에요.
이게 별 거 아닌 거 같지만 인공지능 발전에서 꽤 중요한 문제에요.
아직까지는 GPU 부족으로 인한 하드웨어적 경쟁과 인력 확충에 모두가 집중하고
있지만, 결국 인공지능 발전에서 마지막 최대 관건은 DB 확보일 수 밖에
없어요. 인공지능은 DB를 학습하며 성장해요. 간단히 말해서 인공지능에게 DB란
사람에게 있어서 밥 같은 거에요. DB확보가 제대로 안 된다면 인공지능
발전에도 한계가 올 수 밖에 없어요.
실제로 인공지능의 성장 속도만큼 DB 생산량이 따라가지 못 하고 있으며, 이
문제를 해결하기 위해 합성 데이터를 인공지능에 사용하는 사례가 크게
늘어나고 있어요. 여기에서 합성데이터 Synthetic Data 란 실제 수집된
데이터와 유사하지만 인공적으로 생성된 데이터를 의미해요. 즉, 인공지능이
만든 데이터라고 보면 되요.
그런데 합성데이터를 통한 학습에서 우려되는 부분이 두 가지 있어요.
첫 번째, 합성데이터는 결국 자기 복제이기 때문에 갈 수록 답변은 한 쪽으로
수렴해 매우 비슷해지고 품질이 안 올라가는 현상이 예상되요. LLM이란 결국
확률과 관련 있는데, 자기 복제한 데이터는 비슷한 값이 나오게 되요. 이렇게
비슷비슷한 답이 엄청나게 쌓인다면 확률도 그 비슷한 답 무리가 계속
높아져요. 그러면 품질이 상승하는 게 아니라 정체되고 발전이 제대로 안
이뤄지는 결과가 나타나요.
아주 쉽게 예를 들자면, '철수는 영희를' 뒤에 올 단어에 대한 DB가
'사랑한다'가 90개, '미워한다'가 10개 있다고 해봐요. 이러면 확률적으로
'철수는 영희를' 뒤에 '사랑한다'라는 단어를 자동생성시키는 게 90%의 확률로
맞을 거에요. 그런데 이런 식으로 계속 생산한다면 '사랑한다'가 9990개,
'미워한다'가 10개 꼴이 될 거고, 그러면 '사랑한다'라는 단어를
자동생성시키는 게 99.9%의 확률로 맞을 거에요. 그러면 답변은 거의 무조건
예외없이 '철수는 영희를' 뒤에 '사랑한다'가 나올 거구요.
두 번째, 만약 잘못된 정보가 섞인 채 합성데이터가 생성되어 학습되기
시작하면 잘못된 정보로 인한 오염이 상당히 커져요. 즉 엉뚱한 답을 자꾸
쏟아놓게 되는 쪽으로 갈 수 있어요.
인공지능에 합성데이터를 직접 입력해서 학습시켜보지 않아도 이 정도는
충분히 예측할 수 있어요. 왜냐하면 실제 인터넷 세상에서 흔히 일어나고
목격되는 현상이니까요. 인터넷을 검색해보면 온통 비슷한 글 천지에, 더
나아가 잘못된 정보를 올려놓은 글을 서로 무지성으로 마구 복사해가며 끝없이
복제되어 잘못된 정보가 널리 퍼지고 진실과 분간하기 어려워지는 일이
목격되고 있어요.
블로그 세계로 한정해서 본다면, AI를 이용해서 글을 생성한 후 확인, 검토
같은 거 없이 바로 블로그에 올려서 찍어내는 글이 엄청나게 많이 늘어났어요.
그런 글 중에는 엉터리 글도 꽤 있어요. 그런데 이런 엉터리 글이 검색 상단을
차지하고 있는 웃긴 일이 너무 쉽게 목격되고 있어요. 비슷한 글도 너무
많구요.
즉, 인간이 직접 생산한 DB 확보가 인공지능 발전에 상당히 중요해요.
다양성을 유지하고 잘못된 정보를 바로잡아주는 역할을 하는 건 결국
인간들이니까요.
그렇기 때문에 앞으로도 LLM을 기반으로 인공지능을 개발해갈 거라면
사람들에게 글을 최대한 많이 쓰게 해야 해요. 그리고 SNS, 블로그 등을 통해
인간이 만든 DB확보에도 신경써야 하구요.
어제 저녁이었어요. 뉴스를 쭉 보다가 흥미로운 뉴스를 발견했어요.
이스트에이드, 1세대 블로그 ‘이글루스’ AI전환 베타 테스터 모집
"이글루스? 이거 다시 살아나?"
기사를 잘 읽어봤어요. 상당히 흥미로웠어요. 이글루스AI는 카테고리, 키워드,
말투 등 몇 가지 기본 옵션만 선택하면 AI를 통해 콘텐츠가 자동으로 생성되고,
완성된 글은 바로 개인 블로그에 게시까지 이어지는 서비스를 제공할 계획이며,
이에 대한 베타 테스트를 진행한다고 나와 있었어요. 게다가 참가자는 AI
글쓰기를 직접 체험하고, 글을 완성한 후 실제 블로그 개설까지도 가능하다고
나와 있었어요.
"이거 언제까지야?"
이글루스AI 베타 테스터 모집 기간은 6월 25일부터 7월 18일까지였어요.
그리고 모집 인원은 선착순 100명이었어요. 모집 대상은 누구나 다 참여할 수
있었어요.
"이거 벌써 끝난 거 아냐?"
이글루스AI를 찾아서 접속했어요. 그 다음 한 번 시도해봤어요. 그런데
놀랍게도 7월 3일인데도 되었어요.
'100명이 적당히 100명쯤이라는 거야, 아니면 너무 안 알려져서 사람들이
모르는 거야?'
저는 7월 3일에 참여했는데 되었어요. 6월 25일부터 베타 테스터를 모집했는데
7월 3일까지 100명도 못 채웠다면 참 슬픈 이야기에요. 그런데 실제 100명도 못
채웠을 거 같지는 않았어요. 그보다는 일단 100명이라고만 하고 적당한
선까지는 더 받아주는 것 아닐까 싶었어요.
이글루스AI 블로그 서비스 베타 테스터 신청 방법
먼저 이글루스ai 사이트에 접속해요.
이글루스 ai : https://egloos.ai
여기에서 화면 중앙 하단의 '바로 시작하기'를 클릭해요.
그러면 로그인 창이 떠요. 네이버, 카카오, 구글, 애플 아이디로 가입과
동시에 로그인할 수 있고, 줌 계정을 생성해서 로그인할 수도 있어요.
그 다음에는 이글루스 서비스 가입 절차를 진행해요.
프로필 설정시 알아야할 점은 프로필 사진도 반드시 설정해야만 '만들기'
버튼이 눌려요. 만약 이글루스AI 베타 테스터에 참여할 거라면 프로필 사진으로
사용할 사진이나 그림 한 장을 미리 준비해두세요.
그 다음에는 이글루링크를 설정해야 해요. 간단히 말해서 블로그
주소에요.
이렇게 하면 이글루스AI 블로그 서비스 베타 테스터 참여 신청이 끝나요. 이제
이글루스AI 블로그 서비스 베타 테스트를 하면 되요.
이글루스AI 블로그 서비스 베타 테스트 방법
계정을 생성하고 나면 위와 같은 창이 나와요. 여기에서 오른쪽 하단 파란색
동그라미 버튼을 클릭해요.
그러면 이렇게 작성할 분야를 선택하는 화면이 나와요.
이글루스AI 블로그 서비스 베타 테스트는 작성 분야가 라이프, 푸드, 자동차 -
이렇게 세 종류 있었어요.
저는 라이프를 선택했어요.
위 이미지는 라이프를 선택했을 때 글의 중심 키워드 선택지에요. 다른 푸드,
자동차도 위와 같이 글의 중심 키워드 선택지가 쭉 떠요. 여기에서 자신이
원하는 중심 키워드를 선택하면 되요.
글의 중심 키워드는 2개까지 선택할 수 있었어요.
저는 무난하게 수면건강을 선택해봤어요.
그 다음에는 말투를 선택하는 화면이 나와요. 말투는 ~해요 체, ~했습니다 체,
~했어 체(반말) 중 하나를 고를 수 있어요.
이렇게 작성 분야, 글의 중심 키워드, 말투를 선택하면 자동으로 글이
생성되요.
초안이 생성되면 보관하거나 바로 등록할 수 있어요. 보관하기도 할 수 있고,
글이 마음에 안 든다면 다시 생성할 수도 있어요.
글을 등록하면 위와 같이 글이 바로 블로그에 등록되요.
이글루스AI 블로그 서비스 베타 테스트 후기
1. 생성된 글의 퀄리티
생성된 글의 퀄리티는 꽤 괜찮은 편이었어요. 냉정히 말하자면 요즘
인터넷에서 수익형 블로그라고 글을 양산해서 찍어대는 블로그의 글과 비교했을
때 별 차이 없었어요. 양산형 수익형 블로그가 인공지능처럼 기계적으로 쓰는
건지, 인공지능이 수익형 블로그를 그대로 따라하는 건지 구분이 어려울
지경이었어요.
인공지능을 높게 평가한다면 인공지능이 그만큼 엄청나게 발전했다는 거고,
양산형 수익형 블로그를 있는 그대로 평가한다면 정말 엄청나게 무성의하게
쓴다고 할 수 있어요. 글 첫부분에서 언급한 합성데이터로 인해 발생할 현상에
대한 예측이 근거 없는 상상이 아니라 지금 인간들이 직접 그렇게 만들고 있는
현상임을 다시 한 번 느낄 수 있었어요.
인공지능이 쓴 티가 나는 부분이라면 인공지능이 잘 쓰는 특유의 이모티콘이
여러 개 들어 있었어요. 이 특유의 이모티콘만 없다면 사람이 썼다고
우겨버리면 떨떠름하지만 이런 스타일의 글이 워낙 많아서 뭐라고 반박하기도
애매한 정도였어요.
2. 글 작성 난이도
난이도랄 게 없었어요. 주어진 선택지에서 고르는 거였어요. 무작위로
주어져서 선택하거나 자기가 직접 키워드를 집어넣어서 생성하는 방식이
아니었어요. 게다가 생성되면 블로그에 등록할지 다시 생성할지의 여부만
존재하고 인위적으로 인공지능이 생성한 글을 수정하는 방법은 없었어요.
그러니 난이도 따질 부분이 없었어요.
3. 다양성
베타테스트이기 때문이라 그런지 다양성은 상당히 떨어지는 편이었어요.
이미지는 같은 글의 중심 키워드를 선택하면 거의 반복되시피 했어요. 그
이전에 글 주제 자체가 극히 한정되어서 다양성을 따질 부분이 별로
없었어요.
4. 재미
일반적인 블로그 운영의 재미와는 아예 다른 재미였어요. 일반적인 블로그
운영 재미는 솔직히 느낄 수 없었고, 완전히 다른 종류의 재미였고, 완전히
반대되는 재미였어요.
내가 쓰는 재미가 아니라 내가 읽는 재미
블로그는 기본적으로 글을 작성해서 올리는 개인의 창작 재미를 느끼는 인터넷
서비스에요. 그런데 이글루스AI는 글 쓰는 재미는 아예 없어요. 제시된 작성
분야, 글의 중심 키워드, 말투만 선택하면 글이 자동으로 생성되요. 게다가
생성된 글은 이용자가 수정할 방법이 없었어요. 오직 게시할지 다시 생성할지의
선택지만 존재할 뿐이었어요. 콘텐츠는 크게 기획-생산-검토 및 수정 단계로
이뤄져요. 이 콘텐츠 생성 3단계에서 생산, 검토 및 수정 단계는 이용자가 아예
개입할 수 없어요. 기획도 극히 제한된 부분에서만 가능해요. 그렇기 때문에 글
쓰는 재미는 완전히 없었어요.
그 대신 반대로 읽는 재미는 있었어요. 제시된 작성 분야, 글의 중심 키워드,
말투를 선택하면 글이 자동으로 생성되니 남이 써준 글을 읽는 기분이었어요.
'이런 글을 읽고 싶다'고 생각했을 때 그 글이 자동으로 튀어나오고, 그것을
남들에게 같이 읽자고 하는 기분이었어요.
총평
이대로는 많이 부족하다
재미있기는 하지만 보완해야 하는 점이 많다
요즘 AI 생성 콘텐츠가 증가하고 있어요. 앤스로픽은 LLM 인공지능 클로드를
기반으로 한 블로그 클로드 익스플레인을 선보였어요. 클로드 익스플레인은
클로드 AI가 초안을 작성하면 앤스로픽 개발자들이 프로젝트 경험과 최신
사례를 추가해 포스팅하는 플랫폼이에요. 쉽게 말해서 AI 자동 생성 콘텐츠에
인간이 약간 손대는 형식의 블로그에요.
이쪽이 점차 주목받고 있는 건 사실이에요. 위에서 이야기했지만,
합성데이터를 통한 인공지능의 학습에는 분명히 문제점이 존재하며, 이는
인터넷 세계에서 아주 쉽고 충분하고 많이 관찰되고 있는 현상을 근거로 쉽게
예측할 수 있어요. 그러나 현재 인류의 DB 생산 능력은 인공지능의 학습 능력을
쫓아가기에 역부족이기 때문에 그 대안으로 이야기되고 있는 것이 바로
하이브리드 콘텐츠에요. 인공지능에게 콘텐츠를 생산하라고 시킨 후에 인간의
보정과 수정이 들어간 콘텐츠에요.
하지만 이글루스AI는 베타테스트만 보면 상당히 중요한 '인간의 보정과
수정'이 들어갈 방법이 없었어요. 이러면 이게 무슨 의미가 있는지
의문이었어요. 제시된 작성 분야, 글의 중심 키워드, 말투는 너무 적었구요.
이러면 인간이 합성데이터 생산하라고 버튼만 딸깍딸깍 누르는 거에 불과하고,
그 합성데이터는 결국 인공지능 DB의 자기복제에 가까운 결과물이잖아요.
그 외에도 아쉬운 점, 향후 보완되었으면 좋을 점이 여러 가지 있었어요.
그래서 설문조사 제일 마지막 항목에 글을 아주 한바닥 적었어요. 진심으로 잘
되기를 바라고 있어서요. 아이디어는 꽤 괜찮았지만, '그것만으로 과연?'이라는
생각이 남을 수 밖에 없었어요. 물론 베타 테스트니까 매우 간단한 형태만
제공된 것이 꽤 크겠지만요.
이글루스AI 블로그 서비스 베타 테스트는 흥미롭고 몇 가지 생각해볼 것을
던져줬어요. 잘 되었으면 좋겠어요.












댓글 쓰기