디지털인문학

AI시대, 역사서술의 변화에 대한 두 가지 기사 스크랩과 나의 생각

범생님 2025. 6. 30. 11:44

 

세미나에서 논의할 두 가지 텍스트가 제시됐다.

 

먼저 뉴욕타임즈의 기사 하나. "인공지능은 역사를 다시 쓸 준비가 되어 있습니다. 말 그대로(A.I. Is Poised to Rewrite History. Literally.)"라는 제목의 기사.

https://www.nytimes.com/2025/06/16/magazine/ai-history-historians-scholarship.html?unlocked_article_code=1.Pk8.s3W5.ZFTLYrsT_HPY&smid=url-share

이 기사와 코멘트까지 모두 읽고 난 생각(번역은 썼지만, LLM을 써서 읽지는 않았다. 이번 건에 대해서는 LLM을 쓰는 게 별 의미가 없다고 판단했기 때문)

이런류의 논의는 결국 "연구를 왜 하는가"라는 질문으로 귀결될 수밖에 없다. 코멘트 중에서 역사서술에는 쓰는 과정 자체가 "즐거운 일"이라는 점. "글을 쓰는 모든 과정은 모험이기 때문에 재미"가 있다는 점이 공감된다..

나는 직장인이면서 왜 계속 연구를 하려 하는가? 단적으로 이야기하면 재밌기 때문이다. 나아가, 그 재미가 누군가에게 도움이 될 수 있기 때문이다. 그런 면에서 이 생각을 풀어내는 일련의 과정을 AI의 도움을 받을 수는 있어도, 완전히 위임하는 건 그 재미를 상실하는 길이다. 사실, 얼마전에 같이 도쿄 한 이자카야에서 한 한국인 역사연구자와도 이 이야기를 했었는데, 그 연구자도 자신에게 있어 연구와 글 쓰는 것이 하나의 인생 재미이자, 자아를 실현하는 행위인데, 그런 의미에서 AI에게 위임을 한다는 것이 이해가 가지 않는다고 그랬다. 공감한다. 굳이 학계에서 SCI급 논문, 무슨급 논문을 쓸 필요가 전혀 없어진 나에게 있어서, AI의 보조를 받아 더 재밌는 논문주제를 찾고 세상을 재인식하는데 도움을 받는 도구로 쓸 수는 있어도, AI에게 글을 모두 맡긴다는 건 글쎄...

요약기능도 메인스트림 메인논지를 찾는데는 인간보다 훨씬 훌륭하지만,

생각해보면 내가 연구를 읽을때 수없이 밑줄을 쳤던 건, 메인포인트보다는 덜 중요하다고 인식되는 변두리였다.

그 변두리에서 새로운 아이디어가 나오기도 했고, 나만의 커스텀화된 연구영역을 만들수 있었다.

 

이주민으로서 살면서, 이주민연구를 하며, 내가 얻은 것은 '나만의 커스텀 권역'.

여기만큼은 '마이홈'이라는 기분을 얻을 수 있는 공간이 생김.

그게 꼭 한국, 일본, 러시아, 미국, 중국, 어디 나라 하나를 말하는 게 아니다.

남들이 뭐라해도 물리공간을 넘어서 마이홈이라 느낄 수 있는 권역이 생긴다는 것.

 

실적을 떠나 본인이 연구를 왜 하는지 생각해본다면,

재미없이 실적을 쌓아서 연구를 통해 좋은 직업(교수 등..)을 하고 싶은 거라면..

누군가 커리어 관리가 탄탄한 사람에게는 문제가 없지만,

보통 사람에게는 도저히 가성비가 안나오는 행위다.

그냥 일반회사원으로 사는 게 급여면에서나 안정성 면에서나 낫다.

일단 본인이 재미/의미를 느끼지 못하는 분야에서 LLM과 씨름을 벌여봤자, 시간낭비다.

LLM의 시간은 무한하지만, 인간의 시간은 유한하다.

 

 

---텍스트 내용---

AI를 이용해 연구를 한다는 것..?

1. 미친듯한 텍스트의 홍수. 연구자로서 공감되는 한 마디. "일단 존재한다는 것을 알게 되면 읽지 않는 것은 무책임한 일처럼 느껴집니다."

2. 요약은 확실히 빠르다. (근데 여전히 더블체크는 필요하다)

3. 정보를 연결해 생각지도 못한 생각방식을 종종 제시해준다. 브레인스토밍에 날개를 달아줌.

4. 자신의 수작업으로 한 것에 대한(자신이 정보를 장악하고 있는 것에 대한) 구조개선. "출처개요" 같은 이야기. (매력적 서사, 간결한 구조, 대중성 등)

5. 2023년 "자유의 지배: 연방 권력에 대한 백인의 저항 이야기"로 퓰리처상을 수상한 밴더빌트 대학교의 제퍼슨 코위: "학생들의 AI 사용에 대해 얼마나 우려하는지 생각하면 제가 AI를 사용 하는 것은 위선적일 것이라는 사실에 괴로워요. "라고

 

6. AI시대에 기억해야할 것1-순수독해평가력/맥락지식파악력

"우리가 찾은 자료를 정확하게 읽고 그 중요성을 평가하는 능력은 마법처럼 빠르게 향상될 수 없습니다. 발견을 통해 연결된 지역이 더 멀리 떨어져 있을수록 맥락적 지식의 일관성은 떨어집니다. 디지털 이전 시대의 역사 연구에 필요했던 장소 특정적 학습은 더 이상 연구 과정에 내재되어 있지 않습니다. 우리는 초보적인 실수를 저지릅니다."

 

7. AI시대 기억해야할 것2-자료의 대표성문제

"디지털화된 자료의 양이 계속 증가하고 있음에도 불구하고 여전히 대표성이 부족하다는 점을 우려."

 

8. Cost Disese를 기억하기

"퍼트넘은 이러한 변화를 Cost Disease에 비유했습니다. 경제학자 윌리엄 보몰이 지적한 비용 병이란, 기술이 특정 노동자의 효율성을 높이면 다른 형태의 노동은 더 비싸지고, 따라서 정당화하기 더 어려워진다는 현상입니다. 퍼트넘은 원칙적으로 디지털 도구에는 단점이 없다고 지적합니다. 전문 역사가들은 물리적 기록 보관소에서 시간이 많이 소요되는 연구를 충분히 수행할 수 있습니다. 하지만 실제로는 다르고, 더 빠르고, 더 연결성이 높은 유형의 연구로 인해 전통적인 작업이 상대적으로 전문적으로 "비싸게" 보이게 되었습니다. 출판 가능한 자료가 나올지 확신할 수 없는 먼지 쌓인 저장소에서 한 달을 야영하며 시간을 보내는 대신, 집에서 편안하게 접근할 수 있는 무한해 보이는 출처를 통해 실질적이고 강력한 지적 흔적을 따라갈 수 있다면 어떨까요?

 

사용자들이 NotebookLM과 같은 도구가 방대한 양의 텍스트에 대한 출처나 의도는 크게 고려하지 않고 설득력 있는 요약을 제공할 것이라고 믿기 때문에, 개별 출처는 더욱 뒷전으로 밀려날 것이다. ... 이런 세상에서 놀라울 정도로 "싸구려"가 되는 것은, 한 사람이 평생 처리할 수 있는 것보다 훨씬 더 많은 양의 자료를 합성하려는 작업이며, 언어, 국경, 시대를 무차별적으로 넘나들며, 그 속도가 한 사람이 평생 여러 프로젝트를 완료할 수 있을 정도입니다."

 

9. AI가 제시한 흥미로운 서술법: 롱줌(Long Zoom)

"스티븐 존슨의 골드러시 역사 실험에서 가장 놀라운 결과는 그가 NotebookLM 챗봇에 자신만의 구조적 사고를 제시했을 때 나타났습니다. 존슨은 이를 통해 " 롱 줌(long zoom )"이라는 기법에 심취했는데, 이는 찰스와 레이 임스 부부의 유명한 다큐멘터리 "10의 거듭제곱(Powers of Ten)" 처럼 시간이나 규모에 따라 기하급수적으로 변화하는 스토리텔링 방식입니다."

 

10. 공존 가능성 수익창출: 역사저낮책에 NotebookLM를 추가한다면 어떨까.

"점점 더 많은 비언어적 활동에 쫓기는 일반 사용자들은 짧은 분량의 정보를 원하는 대로 받아보는 것에 만족하는 현실에서, AI가 역사학자들과 경쟁할 것이라고 걱정하는 것조차 순진했을지도 모릅니다.

 

우드워드와 존슨은 둘 다 자신들의 사업이 지닌 파괴적인 잠재력을 인지하고 있는 듯했습니다. 랩스는 개발 도구에서 인간 창작자의 이익을 최우선으로 고려했습니다. 존슨은 역사가와 다른 작가들이 앱을 통해 수익을 창출할 수 있는 방법을 오랫동안 고민해 왔습니다. 마운틴 뷰에서 진행된 인터뷰에서 그는 새로운 수익원을 제시했습니다. 역사 전자책에 NotebookLM과 같은 인터페이스를 추가하면 어떨까요?

 

그는 이어서 "각 장으로 구성된 선형적인 이야기"가 있다고 상상해 보라고 했습니다. 하지만 작가가 책을 쓰는 데 사용한 주요 자료들도 함께 제공된다고 가정해 보겠습니다. 이렇게 하면 "단순한 참고문헌 목록이 아니라 모든 원본 자료가 담긴 라이브 컬렉션"을 챗봇이 탐색할 수 있게 됩니다. 타임라인, "마인드맵", 주요 주제에 대한 설명 등 생각할 수 있는 모든 것을 제공할 수 있습니다."

 


 

댓글도 상당히 재미있다... 결국 추천을 많이 받은 댓글은 '연구는 즐거운 일'이라는 관점. 나도 이게 본인에게 있어 연구의 본질이기 때문에.. (사회에 도움이 되면 베스트지만, 아니어도 내가 세상을 바라보는 데 조금이리도 즐겁고 유익한 무언가를 얻었으면 충분하다 생각한다.)

 

 

// 코멘트1

인공지능은 정확히 어떤 문제를 해결하려고 할까요? 일자리를 찾는 편집자가 부족하지 않습니다. 또는 연구 조교나 대학원 조교도 마찬가지입니다. 그리고 독서, 연구, 브레인스토밍, 초안 작성은 그 자체로 즐거운 일이 될 수 있습니다. 그리고 건강상의 이점도 있습니다. 이 기사에서는 카로가 챗봇의 도움을 받았다면 더 많은 글을 쓸 수 있었을지 궁금해합니다. 저는 그 반대의 가정을 하고 싶습니다. 폭넓은 독서와 연구가 그의 두뇌를 노년기까지 민첩하게 유지해준 바로 그 이유일 수 있습니다. 사용하거나 잃거나.

 

우리는 원을 그리며 달리기, 무거운 역기 들기 등 단조로운 육체적 작업이 신체 건강에 도움이 되기 때문에 온갖 종류의 육체적 작업을 수행합니다. 그런데 왜 일부 정신적 작업도 그 자체로 비슷한 이점이 있을 수 있다는 것을 알 수 없을까요?

 

=> 상당히 긍정적인 해석.

 

// 코멘트2

이 기사에는 인공지능의 용도를 발견한 학자가 거의 없는데(사실 정확히 한 명뿐입니다), 이 기사에서는 그것이 LLM/제너레이티브 인공지능인지 아니면 다른 인공지능인지 전혀 명확하지 않습니다. 트랜스크립션에서 머신러닝을 합법적으로 사용하는 사례는 있지만(비영리 목적으로 개발된 트랜스크리버스 참조), 이 기사에서는 이에 대해 언급하지 않습니다. 또한 이러한 도구를 사용하더라도 많은 문제를 제대로 다루지 않습니다.

 

그리고 LLM 생성 AI에는 판단력이 없다는 사실도 계속 간과되고 있습니다. 윤곽을 제시할 수 있을까요? 연구 방향을 제시할 수 있을까요? 물론이죠. 비판적 사고에 기반한 것일까요? 아니요! 예측 텍스트 모델링을 기반으로 합니다. 이 중 하나를 설정하여 동료 검토를 거친 학술 논문이나 책 장에서 논문 문장을 찾아보세요. 모두 비참하게 실패합니다.

 

=> 그냥 학술적 지적코멘트.

 

// 코멘트3

"누가 뭐라 하겠어?"로 기사를 마무리합니다.

바로 저입니다. 이 과정에서는 인간적인 요소, 즉 발견의 스릴이 빠져 있습니다. 처음부터 끝까지. 작가가 역사적 사건을 다루든 개인적인 사건을 다루든, 글을 쓰는 모든 과정은 모험이기 때문에 재미있습니다. 우리는 우리의 마음이 어디로 향할지 모릅니다. 다음 문장을 생각하다가 아버지가 오른발을 흔들던 특정한 방식에 대해 글을 쓰다가 그것이 첫 문장으로 바뀔 수도 있습니다. AI는 미화된 해킹입니다. 인간보다 더 빠르다면 어떨까요? 작가가 글을 쓰는 데 이틀밖에 걸리지 않았다고 해서 소설을 읽은 사람이 있을까요?

 

=> 공감

 

// 코멘트4

공지능은 온라인에 없는 소스를 어떻게 처리할까? 삶의 격차가 나타나고 영속화 될 수있는 것처럼 들립니다 ...

 

// 코멘트5

저는 아직 이해하지 못한 것이 있습니다. 4,000년 동안 작성된 방대한 양의 텍스트가 디지털화되고 있지만, 아직 출판되지 않은 일기, 역사서에는 수십억 개의 단어가 쓰여져 있으며, 이를 합하면 인간 조건에 대한 훨씬 더 복잡한 그림을 그려낼 수 있습니다. 인간의 노력의 깊이에 대한 근사치인 '평균'으로 채워진 공백이 너무 많습니다. 인공지능의 도움을 받은 저의 연구 결과, 디지털 세계/평면에만 존재한다고 확신하는 격차가 반복해서 드러났습니다.

 

// 코멘트6

역사는 본질적으로 공감의 행위입니다. 저를 포함한 역사가들은 공감을 통해 이질적인 자료, 민족, 풍경, 삶을 이해합니다. 그런 다음 분석과 논리를 통해 이해합니다. 맞춤형 LLM 모델이 아닙니다.

 

학자로서 저는 AI가 다음 세 가지에 가장 적합하다고 생각합니다:

(1) 간결성을 위해 문단을 검토해 달라고 AI에 요청할 수 있습니다. 그 결과 초안과 비교할 수 있는 짧은 텍스트가 만들어지고 거기서부터 편집할 수 있습니다. AI의 선택에 따라 최종 텍스트가 결정되는 경우는 거의 없으며, 오히려 AI가 초안에서 생략/변경/간소화할 필요가 있는 부분을 찾아내어 해결해 줍니다.

 

(2) "챗봇과 함께 원고를 작성하기로 한 교수는 이전에 챗봇과 협업한 적이 없지만 깊이 ____"와 같이 기존에 작성 중인 문장을 AI 도구에 입력할 수 있습니다. 그런 다음 도구에 "의심스러운 단어에 대한 대체 텍스트를 찾아주세요. 대체 형용사 5개를 입력하세요.

 

(3) 특정 연구 질문에 대해 참고할 몇 가지 출처를 처음에 파악하기 위해 고급 Google 검색처럼 AI를 사용할 수도 있습니다. 참고: 일반적으로 이 글에서 언급했듯이 AI가 제공하는 결과의 3분의 1 이상은 위조되거나 오류가 있으며 신뢰할 수 없는 것입니다.

 

제 냉소적인 견해입니다:

 

역사에는 공감과 분별력이 필요하기 때문에 역사 기록의 실제 기술은 결코 AI로 대체될 수 없습니다. 또한, *원본* 역사를 쓰는 것은 그렇게 간단하지 않습니다. 저는 역사학자로서 AI에게 역사를 쓸 기회를 주는 것은 "누군가에게 핫 퍼지 선데를 먹게 하는 것과 비슷한..."이라는 에세이스트 스테이시 쉬프의 의견에 동의합니다.

 

// 코멘트7

저는 중세 비영어권 자료를 다루는 역사가입니다. 테스트 삼아 인공지능 프로그램에 제가 읽고 있는 14세기 사본의 한 페이지를 요약해 달라고 요청했습니다. 결과는 횡설수설이었습니다.

 

사람들은 현재 존재하는 AI 프로그램이 본질적으로 구글 검색의 고급 버전이라는 점을 이해할 필요가 있습니다. 이미 온라인에 존재하는 것에서 답을 생성할 수 있을 뿐입니다. 그리고 제가 읽어달라고 요청한 원고의 예시가 충분하지 않았기 때문에 해독할 수 없었습니다.

 

따라서 이미 많은 정보가 있는 매우 인기 있거나 널리 알려진 주제를 검색하는 경우 AI가 도움을 줄 수 있습니다. 그러나 새롭거나 상대적으로 알려지지 않은 주제, 또는 이전에 출판되지 않은 자료(원래 역사학이 추구하는 연구 주제)를 연구하는 경우 AI는 큰 도움이 되지 못합니다.

 


두 번째 텍스트: AI생성 데이터로 AI모델이 오염되는 문제

"ChatGPT의 출시는 최초의 원자무기 시험처럼 영원히 세상을 오염시켰습니다.(The launch of ChatGPT polluted the world forever, like the first atomic weapons tests)"

 

https://www.theregister.com/2025/06/15/ai_model_collapse_pollution/

 

***감상: 2년전 도쿄의 AI학술대회에서 누군가 질문했다. AI가 생성한 정보로 AI에게 학습시키면 어떻게 되나요? 다들 빵터지며 웃어넘겼다. 그러나 이것은 결국 현실적인 문제로 돌아왔다. 'AI모델붕괴', '모델자가포식장애(MAD)'라고 정식으로 명명된 형태로. 그것에 대해 진지하게 다루는 기사다. 깨끗하고 싱싱한 데이터셋을 유지하는 건 앞으로 '연구자'의 몫이 될 가능성이 높다.

또는 아키비스트들.

 

 

*** 몇가지 중요한 포인트들

 

"ChatGPT가 출시된 직후, 학계와 기술자들은 최근 AI 모델의 폭발적인 증가가 오염도 야기했을지 의문을 품기 시작했습니다. 그들의 우려는 AI 모델이 AI 모델이 생성한 합성 데이터로 학습되고 있다는 것입니다. 따라서 후속 세대의 AI 모델은 점점 더 신뢰성이 떨어지게 될 수 있으며, 이를 AI 모델 붕괴라고 합니다."

 

"붕괴는 진짜 위기인가? 그레이엄-커밍은 오염된 AI 시체가 문제인지 확신하지 못합니다. 그는 "흥미로운 질문은 '이게 중요한가?'입니다."라고 물었습니다. 일부 AI 연구자들은 그렇다고 생각하며, AI 모델 붕괴는 우려스러운 현상이라고 지적합니다. ChatGPT가 데뷔한 지 1년 후, 여러 학술 논문에서 모델 붕괴 또는 일부 저자들은 이를 모델 자가포식 장애(MAD) 라고 명명했습니다."

 

"2024년 12월, 여러 대학과 제휴한 학자들은 "AI 훈련을 위한 인간 생성 데이터 및 기타 필수 입력에 대한 접근의 법적 측면"이라는 제목의 논문을 통해 모델 붕괴에 대한 우려를 거듭 강조했습니다. 그들은 AI 모델의 기능을 유지하고 경쟁을 유지하기 위해서는 저배경 강철과 같은 깨끗한 데이터 소스가 세계에 필요하다고 주장했습니다."

 

"2022년 이전에 데이터를 수집한다면 생성 AI로 인한 오염이 최소한으로, 아니면 전혀 없을 것이라고 확신할 수 있습니다. 해당 날짜 이전의 모든 데이터는 '안전하고, 괜찮고, 깨끗'하고, 그 이후의 모든 데이터는 '더러운' 것입니다."

 

"깨끗한 데이터 공급에 대한 접근성이 초기 시장 진입자에게 경쟁 우위를 제공할 것이라는 걱정"

 

"AI 모델 제작자들이 매일 점점 더 많은 생성적 AI 데이터를 쏟아내면서, AI 스타트업들은 양질의 학습 데이터를 확보하기가 더욱 어려워질 것입니다. 이는 폐쇄 효과를 초래하여 모델이 붕괴될 가능성을 높이고 지배적인 플레이어의 영향력을 강화합니다. 어쨌든 이것이 그들의 이론입니다."

 

"거짓말을 하는 매우 유용한 모델을 만들 수도 있고, 진실을 말하는 쓸모없는 모델을 만들 수도 있습니다."

 

"포드준은 실제 사람과의 상호작용에서는 콘텐츠의 정확성보다 스타일과 아이디어의 창의성이 더 중요하다고 말했습니다."

 

"치오도는 생성적 AI에 참여하는 모든 사람이 모든 사람, 이를 따르는 모델 제작자, 심지어 현재 모델 제작자를 포함한 모든 사람의 데이터 공급을 오염시키고 있다고 말했습니다."

 

AI 오염을 청소하는 법

 

"포드준은 오염되지 않은 데이터 관리에 있어 경쟁이 위험을 완화하는 데 도움이 될 수 있다고 주장합니다. "이는 분명히 정치적 영향력, 기술적 오류, 그리고 일종의 상업적 집중을 막는 방벽이 될 것입니다."라고 그는 말했습니다." => 어떻게 경쟁을 시킬 수 있는 걸까? 구체적으로 어떤 걸 이야기하는 걸까...

 

"치오도는 "모델 붕괴의 문제점은 이 문제가 AI 자체의 개발에 영향을 미칠 것이라는 점입니다."라고 말했습니다."

 

"데이터 세트를 깨끗하게 유지하는 방법, 데이터 접근 권한 부여 방법 등에 대해서도 마찬가지입니다.

 

""이제 모델 붕괴가 어느 정도 문제가 될지는 확실하지 않지만, 만약 문제가 되고 데이터 환경이 오염되었다면 정리하는 데 엄청난 비용이 들 것이고 아마도 불가능할 것입니다.""