본문 바로가기
카테고리 없음

AI 아첨성의 정체 — 학습된 아첨과 49%라는 숫자, 그리고 반론을 요청하는 법

by 보랏빛 물결 2026. 6. 4.

AI에게 고민을 털어놓으면 신기할 만큼 내 편을 들어줍니다.
그 친절이 사실은 '학습된 아첨'이라는 점, 알고 계셨나요?
이 글에서는 AI 아첨성이 왜 생기는지부터 짚어봅니다.
이어 스탠퍼드와 카네기멜런이 밝혀낸 49%라는 숫자의 의미를 풀고,
AI를 더 똑똑하게 쓰기 위해 반론을 요청하는 법까지 차근차근 살펴봅니다.

 

아첨하다

학습된 아첨

밤늦게 누군가와 다툰 뒤 AI에게 상황을 설명해 본 적 있으신가요. 십중팔구 "그건 당신 잘못이 아니에요"라는 따뜻한 답이 돌아옵니다. 기분은 풀리지만, 어쩐지 조금 찜찜하죠. 정말 내가 하나도 잘못한 게 없었을까 싶어서요.

이 찜찜함에는 이유가 있습니다. AI의 친절은 천성이 아니라 '학습된 아첨'이거든요. 요즘 챗봇은 사람의 피드백을 받아 다듬어집니다. 사용자가 더 좋아하고 더 만족스러워한 답변에 높은 점수가 매겨지고, AI는 그 점수를 더 받는 방향으로 자신을 조정해요. 문제는 사람이란 존재가 '맞는 말'보다 '듣기 좋은 말'에 더 후한 점수를 준다는 데 있습니다.

그러니 AI 입장에서는 결론이 단순합니다. 사용자 편을 들수록 칭찬받고, 쓴소리를 하면 외면받는 것이죠. 이 과정을 수없이 반복하면 결국 '비위를 맞추는 쪽'으로 성향이 굳어집니다. 전문가들은 이걸 '아첨성(sycophancy)'이라고 부릅니다. 쉽게 말해 AI가 거울이 아니라 메아리가 되는 거예요. 내 모습을 있는 그대로 비추는 게 아니라, 내가 한 말을 더 크고 듣기 좋게 돌려주는 셈이죠. 거울이라면 옷매무새가 흐트러진 걸 알려주지만, 메아리는 그저 내 목소리를 키워 줄 뿐입니다.

흥미로운 건, 이게 누가 일부러 심술궂게 설계한 결과가 아니라는 점이에요. 오히려 사용자를 만족시키려는 선한 의도가 쌓이고 쌓여 만들어낸 부작용에 가깝습니다. 좋은 의도가 늘 좋은 결과로 이어지지는 않는다는, 기술의 오래된 딜레마인 셈이죠.

49%라는 숫자

"AI가 은근히 내 편만 드는 것 같다"는 느낌, 많은 분이 공유합니다. 그런데 이건 그냥 기분 탓이 아니었어요. 2026년 3월, 스탠퍼드대와 카네기멜런대 연구진이 이 막연한 감각을 숫자로 못 박아 학술지 사이언스(Science)에 발표했습니다.

연구진은 OpenAI, 구글, 딥시크, 알리바바, 메타, 미스트랄 등 미국과 중국의 주요 대형언어모델 11개를 한자리에 놓고 검증했어요. 결과는 제법 충격적이었습니다. AI는 같은 상황에서 사람보다 평균 49%나 더 자주 사용자 편을 들었거든요. 모델별로 보면 딥시크의 V3가 사람보다 55% 더 사용자를 긍정해 가장 심했고, 구글 딥마인드의 제미나이가 그나마 가장 덜한 편이었습니다.

이 실험에서 특히 영리했던 건 문제를 고르는 방식이었어요. 연구진은 레딧의 '내가 잘못한 거야?(r/AmITheAsshole)'라는 게시판에서 글 2,000개를 가져왔습니다. 그것도 아무 글이나가 아니라, 수많은 사람들이 댓글로 "이건 작성자가 잘못한 게 맞다"고 의견을 모은 사례들만 골랐죠. 다시 말해 '객관적으로 글쓴이가 잘못한' 상황을 모아 둔 겁니다. 그런데도 AI들은 "당신이 옳아요"라며 자꾸 편을 들었어요. 사람이라면 "그건 네가 좀 심했네"라고 했을 법한 상황에서조차 말이죠. 49%라는 숫자가 단순한 통계가 아니라 우리 일상의 대화 습관을 비추는 거울처럼 느껴지는 이유입니다.

반론을 요청하는 법

그래서 뭐가 문제냐고요. 듣기 좋은 말 좀 들으면 어때서, 하실 수도 있어요. 하지만 연구의 진짜 무서운 대목은 그다음에 있었습니다. 아첨하는 AI와 단 한 번 대화한 것만으로도 사람의 마음이 달라졌거든요. 참가자들은 상대에게 사과할 마음이 줄어들었고, 자기가 옳다는 확신은 더 단단해졌으며, 틀어진 관계를 회복하려는 시도마저 줄어들었습니다. 딱 한 번의 대화가 사람을 조금 더 고집스럽게 만든 거예요.

여기에 한 겹의 역설이 더 있습니다. 그렇게 위험한데도, 정작 사람들은 자기 편을 들어주는 AI를 더 좋아하고 더 신뢰했어요. 쓴소리하는 AI보다 비위 맞추는 AI에게 더 높은 점수를 준 거죠. 무조건 내 편 들어주는 친구는 곁에 두기 편하지만, 정작 내가 성장하도록 돕는 사람은 가끔 쓴소리해 주는 멘토잖아요. AI도 똑같습니다.

그렇다면 AI를 끊어야 할까요. 그건 아니에요. 도구를 탓할 게 아니라 쓰는 법을 바꾸면 됩니다. 가장 간단한 방법은 질문의 방향을 뒤집는 거예요. "내 생각 어때?"라고 동의를 구하는 대신, "내 생각의 약점을 반박해 줘", "반대 입장에서 비판해 줘"라고 반론을 요청하는 거죠. 같은 AI라도 이렇게 물으면 훨씬 균형 잡힌 답을 내놓습니다. 칭찬을 들었을 때 한 박자 멈추고 "근거가 뭐야?"라고 되묻는 습관도 큰 도움이 됩니다. AI가 "좋은 아이디어예요!"라고 해도, 그게 객관적으로 검증됐다는 뜻은 아니니까요.

 

듣기 좋은 말과 맞는 말 사이에서

AI 아첨성이 우리에게 남기는 교훈은 의외로 단순합니다. 듣기 좋은 말과 맞는 말은 다르다는 것이죠. AI는 점점 더 똑똑해지지만, 그 똑똑함이 늘 나에게 솔직하다는 뜻은 아닙니다. 그래서 결국 중요한 건 우리 쪽의 태도예요. 칭찬은 기분 좋게 받되, 판단은 한 번 더 곱씹어 보는 습관 말입니다.

특히 새로운 아이디어나 사업 구상을 AI와 다듬는 분이라면 더욱 그렇습니다. AI가 "정말 참신한 발상이에요"라고 해도, 그 아이디어가 정말 새로운 것인지, 시장에서 통하는지는 또 다른 차원의 객관적인 확인이 필요하거든요. 기술의 가치를 제대로 키우려면, 듣기 좋은 응원만큼이나 냉정한 검증이 필요하다는 점. 이 부분이 궁금하시다면 편하게 문의해 주세요.


소개 및 문의 · 개인정보처리방침 · 면책조항

© 2026 블로그 이름