- 08 Dec, 2025
유저 인터뷰 중 침묵이 길어질 때, 나는 뭘 하나?
침묵이 5초 넘어가면 오늘 유저 인터뷰 3건 잡혀 있었다. 2시, 3시 반, 5시. 2시 인터뷰이는 30대 남성, 우리 서비스 3년째 쓰는 파워유저다. 질문 던졌다. "이 기능 언제 주로 쓰시나요?" 대답이 안 나온다. 5초. 10초. 15초. 초보 때 나였으면 벌써 다음 질문 던졌다. "아 혹시 출퇴근 시간이요? 점심시간이요?" 이렇게. 지금은 안다. 침묵도 데이터라는 걸.20초쯤 됐을 때 그가 말했다. "음... 사실 이 기능, 쓰긴 쓰는데 불편해요. 근데 대체할 게 없어서." 바로 이거다. 침묵 뒤에 나오는 진짜 답. 빨리 답하는 건 보통 표면적인 생각이다. 사회적으로 기대되는 답. "네, 자주 써요. 편해요." 이런 거. 근데 침묵 뒤의 답은 다르다. 본인도 정리 안 된 생각. 불편하지만 말하기 애매한 것들. 9년 인터뷰 진행하면서 배운 거다. 침묵을 견디는 기술. 침묵의 종류는 다르다 모든 침묵이 같지 않다. 경력 쌓이면서 구분하게 됐다. 생각 중인 침묵: 눈동자가 움직인다. 뭔가 떠올리려고 애쓴다. 이건 기다려야 한다. 절대 방해하면 안 된다. 이 침묵 뒤에 인사이트 나온다. 불편한 침묵: 몸이 경직된다. 시선이 아래로 간다. 질문이 너무 private했거나 본인 행동의 모순을 깨달은 순간. "괜찮아요, 편하게 답하셔도 돼요" 이런 식으로 안심시켜야 한다. 모르겠다는 침묵: 어깨를 살짝 으쓱한다. 표정이 '글쎄' 다. 이건 질문을 바꿔야 한다. "그럼 최근에 이 서비스 쓰셨을 때 기억나는 게 있으세요?" 구체적인 경험으로 전환. 정치적인 침묵: 회사 내부 유저 인터뷰할 때 나온다. "이 프로세스 어떠세요?" 물으면 침묵. 불만 있는데 말 못 하는 거다. 누가 볼까봐. "다른 분들은 이런 얘기도 하시더라고요" 하면서 익명성 보장해줘야 답 나온다.오늘 2시 인터뷰이는 생각 중인 침묵이었다. 눈동자 움직임으로 알았다. 기다렸다. 그리고 진짜 답을 얻었다. 후배는 못 견딘다 작년에 신입 1명 들어왔다. UX 전공, 열정 넘친다. 인터뷰 동행시켰다. 내가 질문 던지고 침묵이 시작됐다. 3초. 5초. 후배가 끼어든다. "아 예를 들면 이런 상황이요?" 인터뷰이가 "아 네네" 하고 넘어간다. 후배는 답을 받았다고 생각한다. 나는 안다. 진짜 답은 못 들었다는 걸. 인터뷰 끝나고 피드백 줬다. "침묵을 기다려봐." 후배가 묻는다. "몇 초요?" 이게 설명이 안 된다. 10초? 15초? 케바케다. 인터뷰이 표정 봐야 한다. 생각하는 중인지 불편한지. 근데 이걸 어떻게 가르치나. "일단 10초는 기다려봐. 네가 불편해도." 이렇게밖에 못 말한다.후배는 한 달 동안 연습했다. 처음엔 5초도 못 견뎠다. 지금은 10초는 기다린다. 근데 아직 침묵의 종류는 못 읽는다. 그건 경험이다. 시간이 필요하다. 나도 3년 차 때까지는 못 견뎠다. 침묵이 두려웠다. 인터뷰 망치는 것 같았다. "제가 질문을 잘못한 건가?" 이런 생각 들었다. 지금은 안다. 침묵은 망치는 게 아니라 기회다. 침묵을 채우는 기술 침묵 중에 나는 뭘 하나. 가만히 있는 것 같지만 아니다. 눈 맞춤 유지: 너무 뚫어지게 보면 부담 준다. 적당히. 노트에 시선 내렸다가 다시 올린다. "기다리고 있어요" 라는 신호. 메모: 진짜 메모하는 건 아니다. 방금 질문이나 키워드 적는 척한다. 인터뷰이가 부담 덜 느낀다. 침묵이 자연스러워진다. 고개 끄덕임: 생각 중인 침묵일 때. 살짝 끄덕인다. "괜찮아요, 천천히요" 메시지 전달. 물 마시기: 10초 넘어가면 물 한 모금. 인터뷰이도 따라 마신다. 리듬 전환. 긴장 풀린다. 질문 재구성 준비: 15초 넘어가면 머릿속으로 다음 질문 준비한다. 각도 바꿔서. 구체적 사례로. 근데 20초 전까진 안 던진다. 오늘 3시 반 인터뷰이는 침묵이 20초 갔다. 나는 노트 보면서 기다렸다. 끄덕였다. 물 마셨다. 그리고 인터뷰이가 말했다. "사실 이 기능... 제 업무 프로세스랑 안 맞아요. 근데 팀장님이 쓰라고 해서." 진짜 문제 발견했다. 기능 자체가 아니라 조직 문제. 침묵 견뎌서 얻은 인사이트. 데이터가 안 보여주는 것 GA4 본다. 이 기능 사용률 38%. 나쁘지 않다. "사용자 만족도 조사" 했다. 5점 만점에 3.8점. 평균이다. 근데 인터뷰하면 다른 얘기 나온다. "어쩔 수 없이 써요." "대체재가 없어서요." "불편한데 익숙해졌어요." 이런 건 수치로 안 나온다. 설문에도 안 쓴다. 침묵 뒤에 나온다. 기획팀 회의에서 말한다. "사용률은 괜찮은데 유저들 만족도는 낮습니다." PO가 묻는다. "만족도 조사에선 3.8점이던데요?" "인터뷰에서 다른 맥락이 나왔어요. 수치와 정성 리서치 결과가 달라요." 데이터는 What을 보여준다. 인터뷰는 Why를 보여준다. 근데 Why는 침묵 뒤에 있다. 작년에 리뉴얼 프로젝트 했다. AB 테스트 결과 B안이 15% 더 좋았다. 근데 인터뷰하니까 "B안이 빨라서 좋긴 한데 뭔가 불안해요" 나왔다. 불안? 수치에 안 나온다. 더 물었다. 침묵 10초. "너무 간단해서... 내가 뭘 한 건지 확신이 안 서요." 피드백 반영했다. 확인 메시지 하나 추가. 숫자는 그대로인데 불안감 사라졌다. 침묵 뒤 인사이트로 개선한 거다. 침묵이 주는 시간 인터뷰이가 침묵할 때, 나도 생각한다. "이 질문이 맞나?" "다음 질문 각도를 어떻게 잡지?" "방금 대답에서 뭘 캐치했지?" 침묵은 나한테도 생각할 시간이다. 리듬 조절. 인터뷰는 말 많이 하는 게 아니라 잘 듣는 거다. 침묵도 듣는 거다. 초반 경력 때는 1시간 인터뷰에 질문 20개 준비했다. 다 물어야 한다고 생각했다. 지금은 10개 준비한다. 근데 3개밖에 안 쓴다. 나머지는 대답 듣고 즉석에서 만든다. 침묵 사이에 다음 질문이 보인다. "아, 이 사람은 이 부분이 불편했구나. 그럼 이걸 물어봐야겠다." 오늘 5시 인터뷰이는 20대 여성. 서비스 처음 써봤다. "첫인상이 어땠어요?" 물었다. 침묵. 8초쯤 됐을 때 "음... 복잡했어요. 근데 신기했어요." "복잡한데 신기하다?" 메모했다. 다음 질문 떠올랐다. "신기했던 부분이 뭐였어요?" "다른 서비스는 다 자동인데, 여기는 제가 직접 설정하잖아요. 처음엔 귀찮았는데 하다 보니까 재밌었어요." 진짜 인사이트다. 온보딩 개선 방향 잡혔다. "자동화보다 커스터마이징의 재미" 이걸 강조해야 한다. 침묵 8초가 다음 프로젝트 방향 정했다. 회사는 침묵을 못 기다린다 문제는 조직이다. 리서치 일정 잡으면 상사가 묻는다. "인터뷰 몇 명이요?" "일주일이면 돼요?" 인터뷰 10명 하려면 일정 잡는 데만 3일. 진행하는 데 5일. 분석하는 데 3일. 최소 2주 필요하다. "2주요? 그냥 설문 돌리는 게 빠르지 않아요?" 설문은 빠르다. 근데 얕다. 침묵이 없다. 정해진 답만 체크한다. Why는 모른다. 기획팀 회의에서 맨날 싸운다. "리서치 결과 기다리면 일정 밀려요." "근데 리서치 안 하면 방향 틀리잖아요." 타협안 낸다. "1차로 빠르게 만들고 AB 테스트 하면서 인터뷰 병행할게요." 이것도 방법이다. 근데 매번 이러면 리서치 가치가 떨어진다. 작년에 큰 프로젝트 있었다. 예산 5억. 일정 6개월. 킥오프 때 말했다. "유저 리서치 먼저 하고 시작하면 좋겠습니다." 임원이 답했다. "리서치는 만들면서 하죠. 일정이 빠듯해요." 결국 리서치 없이 시작했다. 3개월 지나서 베타 나왔다. 내부 테스트 결과 별로. 그제야 인터뷰 했다. "방향이 틀렸어요." 2개월 뒤로 돌아갔다. 처음부터 리서치 했으면 안 돌아갔을 일. 회사는 빠른 게 좋다고 생각한다. 근데 방향 틀리면 더 느리다. 침묵을 못 기다리는 조직은 비효율적이다. 침묵 뒤의 말은 무겁다 인터뷰 끝나고 녹취록 정리한다. 오늘 3건. 총 180분. 녹취록 40페이지. 침묵은 녹취록에 "(침묵)" 이렇게 표시된다. 근데 이게 중요하다. 침묵 전후 맥락 본다. "이 기능 만족하세요?" "(침묵 12초)" "만족하는데... 음... 불편한 점도 있어요." 침묉 없이 바로 답했으면 "네, 만족해요" 끝났을 거다. 12초 침묵이 진짜 답을 끌어냈다. 녹취록 읽으면서 침묵 부분 형광펜 칠한다. 노란색. 그리고 앞뒤 문맥 다시 읽는다. 인사이트가 거기 있다. 기획안 쓸 때 인용한다. "유저 A는 12초 생각 후 '만족하는데 불편한 점도 있다'고 답했습니다. 이는 기능 자체보다 프로세스 문제를 시사합니다." PO가 읽고 묻는다. "12초가 중요해요?" "네. 바로 답 안 나온 건 본인도 혼란스럽다는 뜻이에요." 침묵도 데이터다. 이걸 이해 못 하는 사람 많다. 숫자만 본다. "사용률 38%", "만족도 3.8점". 근데 침묵은 숫자 아래 맥락을 보여준다. 멘토링 때 못 전하는 것 후배들 멘토링한다. 분기에 한 번. 주로 커리어 고민, 스킬 질문. 지난달 멘토링 때 한 후배가 물었다. "인터뷰 잘하려면 뭘 해야 해요?" 대답했다. "질문 리스트 잘 짜고, 경청하고, 녹취록 정리 꼼꼼히 하고." 근데 정작 중요한 건 못 말했다. 침묵을 견디는 기술. 이건 말로 안 된다. 직접 해봐야 안다. "침묵도 중요해요" 말하면 "아, 네" 한다. 근데 이해 못 한다. 실전에서 5초도 못 기다린다. 불안해서. 나도 그랬다. 3년 차 때까지 침묵이 두려웠다. 시간 가면서 배웠다. 침묵 뒤에 진짜 답이 나온다는 걸. 이걸 어떻게 가르치나. "일단 해봐" 밖에 못 한다. 불친절한 조언이다. 근데 다른 방법이 없다. 작년에 스터디에서 발표했다. "인터뷰 스킬업" 주제. 침묵 얘기 했다. 질문 나왔다. "침묵이 너무 길면 어떡해요?" "20초 넘어가면 질문 바꿔보세요." "20초요? 너무 긴 거 아니에요?" "처음엔 그렇게 느껴져요. 근데 익숙해지면 괜찮아요." 설득력 없는 답이다. 근데 사실이다. 20초는 길다. 근데 그 20초가 프로젝트 방향 바꾼다. 침묵이 편해졌을 때 요즘은 침묵이 편하다. 오히려 좋다. 인터뷰 리듬이 느려진다. 여유 생긴다. 초보 때는 1시간 인터뷰가 급했다. 질문 던지고 답 듣고 다음 질문. 빠르게. 많이 물어야 한다고 생각했다. 지금은 1시간에 질문 5개만 해도 괜찮다. 깊게 판다. 침묵 기다린다. 추가 질문 던진다. 맥락 이해한다. 오늘 2시 인터뷰이랑 1시간 10분 얘기했다. 질문은 6개 했다. 침묵은 총 8번. 가장 긴 침묵 23초. 23초 침묵 뒤에 나온 답이 전체 인터뷰에서 가장 좋았다. "사실 이 서비스... 동료가 쓰니까 저도 쓰는 거예요. 안 쓰면 뭔가... 뒤처지는 것 같아서." 네트워크 효과. 이게 진짜 retention 이유였다. 기능이 아니라 사회적 압력. 이런 건 설문에 안 나온다. 데이터에 안 잡힌다. 23초 침묵 뒤에 나왔다. 인터뷰 끝나고 인터뷰이가 말했다. "오늘 제 생각 정리된 것 같아요. 감사해요." 이게 좋은 인터뷰다. 내가 답 얻는 것만이 아니라 인터뷰이도 생각 정리하는 시간. 침묵이 그 시간을 준다. 9년 차의 숙제 경력 9년. 인터뷰는 수백 건 했다. 침묵 견디는 건 이제 자연스럽다. 근데 여전히 어렵다. 침묵의 미묘한 차이 읽기. 5초 침묵이랑 15초 침묵은 다르다. 생각 중인 침묵이랑 회피하는 침묵도 다르다. 매번 완벽하게 못 읽는다. 가끔 놓친다. "아, 저 침묵 때 더 기다렸어야 했는데." 후회한다. 그리고 후배들한테 전하는 게 어렵다. "침묵을 기다려" 말은 쉽다. 실천은 어렵다. 경험으로 체득해야 한다. 요즘 고민은 이거다. 시니어로서 뭘 더 줄 수 있나. 스킬은 가르쳤다. 프로세스도 정리했다. 근데 "감각" 은 못 가르친다. 침묵 읽는 감각. 질문 타이밍 잡는 감각. 이건 말로 안 된다. 같이 인터뷰 다니면서 보여줘야 한다. 근데 시간이 없다. 내년에 리드 제안 들어왔다. 매니저 가는 거다. 그럼 인터뷰 직접 할 시간 줄어든다. 고민이다. 관리만 할 건가. 현장 감각 잃을 건가. 9년 쌓은 감각이 아깝다. 침묵 읽는 기술, 맥락 파악하는 눈. 이걸 계속 쓰고 싶다. 후배들한테 전하고 싶다. 근데 방법을 모르겠다. 그냥 계속 인터뷰 하는 수밖에.침묵은 데이터다. 9년 걸려서 배운 거다. 10년 차엔 뭘 배울까.
- 07 Dec, 2025
Maze 리포트를 보며 '어? 여기서?'라고 놀란 이유
Maze 리포트를 보며 '어? 여기서?'라고 놀란 이유 오전 10시, Maze 리포트 출근하자마자 Maze 리포트를 열었다. 지난주에 돌린 프로토타입 테스트. 40명 참여. 결제 플로우 개선안이었다. 클릭 히트맵을 봤다. 85%가 '다음' 버튼을 찾았다. 평균 완료 시간 2분 30초. 만족도 4.2점. 나쁘지 않았다. "이 정도면 괜찮은데?" PM한테 공유하려고 슬랙을 열었다. 그런데 뭔가 걸렸다. 지난주 유저 인터뷰 내용이 떠올랐다. 32세 여성, 온라인 쇼핑 자주 한다는 사람. 프로토타입 테스트할 때 말했다. "어? 이거 결제하는 거 맞아요? 좀 이상한데..." 그 사람도 결국 완료했다. Maze 데이터에는 '성공'으로 찍혔을 거다. 근데 그 순간의 망설임. 3초 정도. 화면을 두 번 확인했던 것. 그게 데이터에는 안 보였다.정량 데이터가 말하는 것 Maze 리포트를 다시 봤다. 천천히. 태스크 성공률: 85%40명 중 34명이 완료 평균 완료 시간 2분 30초 오류 클릭 1.2회 평균히트맵 분석:'다음' 버튼 클릭률 92% '취소' 버튼 오인 클릭 8% 스크롤 깊이 평균 78%만족도:4.2/5점 "쉬웠다" 응답 72% "개선 필요" 응답 15%숫자만 보면 괜찮다. 85% 성공이면 업계 평균 이상이다. PM이 보면 "고(Go)" 할 수준. 근데 뭔가 찝찝했다. 15%는 왜 실패했지? 1.2회 오류 클릭은 어디서 나온 거지? Maze는 '어디를' 클릭했는지는 알려준다. '왜' 클릭했는지는 모른다. 커피를 마셨다. 세 번째였다.정성 리서치가 보여준 것 지난주 유저 인터뷰. 5명. 각 1시간씩. 참여자 3번, 32세 여성:프로토타입 완료 시간: 2분 40초 (Maze 데이터 평균과 비슷) 성공 여부: 완료 만족도: 4점근데 인터뷰 녹취록을 다시 들었다. "음... (3초 정지) 이게 결제 버튼인가? 색깔이 좀... 배송지 입력하는 건가?" 결국 클릭했다. 맞는 버튼이었다. Maze에는 '성공'으로 기록됐다. 근데 저 망설임. 3초. 참여자 5번, 28세 남성:완료 시간: 3분 10초 성공 여부: 완료 만족도: 3점녹취록: "여기서 뭘 하라는 거지? (화면 스크롤) 아, 여기 있네. 근데 왜 여기 있어요? 위에 있을 줄 알았는데." 이 사람도 완료했다. 데이터에는 '성공'. 근데 저 당황. "왜 여기 있어요?" 그 질문. 참여자 1번, 41세 여성:완료 시간: 1분 50초 (평균보다 빠름) 성공 여부: 완료 만족도: 5점녹취록: "아, 이런 거 자주 써봐서. 보통 여기 있잖아요. 익숙해요." 이 사람은 순조로웠다. 경험이 많았다. 근데 이게 우리 타겟 유저인가? 41세, 온라인 쇼핑 파워유저. 우리 주 타겟은 20대 후반인데. 정리하면서 느꼈다. Maze 데이터의 '85% 성공'과 인터뷰의 '망설임'은 다른 이야기였다. 불일치의 순간 점심 먹고 데이터를 다시 정리했다. Maze 정량 데이터:85% 성공률 평균 2분 30초 만족도 4.2점 → "괜찮다"유저 인터뷰 정성 데이터:"이게 결제 버튼인가?" "왜 여기 있어요?" "좀 이상한데..." → "뭔가 불편하다"이 간극. 85%는 완료했지만, 과정에서 당황했다. 숫자는 '성공'이지만 경험은 '불편'이었다. Notion에 메모했다: 정량 = What (무엇을 했는가) 정성 = Why (왜 그렇게 했는가)Maze: 85%가 버튼을 '찾았다' 인터뷰: 근데 '망설였다'둘 다 맞다. 근데 다르다.PM한테 슬랙을 보냈다. "Maze 리포트 나왔어요. 근데 인터뷰 내용이랑 같이 봐야 할 것 같아요." 답장이 왔다. "85%면 괜찮은데요? 일단 Go 하죠." 머리가 아팠다.한 유저의 행동 그날 저녁. 퇴근 전에 Maze 로우 데이터를 다시 파고들었다. 40명의 개별 데이터. 클릭 타임스탬프. 마우스 움직임. 하나씩 봤다. 참여자 23번:완료 시간: 4분 50초 (평균보다 2배 이상) 오류 클릭: 5회 만족도: 2점이 사람 데이터를 따라가 봤다.첫 화면 진입: 30초 정지 잘못된 영역 클릭: 3회 뒤로 가기 버튼: 2회 다시 시도 완료완료는 했다. 85%에 포함됐다. 근데 이 과정. 4분 50초. 5회 오류. 만족도 2점. Maze 요약 리포트에는 이렇게 나왔다: "평균 완료 시간: 2분 30초" 참여자 23번의 4분 50초는 평균에 묻혔다. 참여자 1번의 1분 50초가 평균을 낮췄다. 통계적으로는 맞다. 근데 참여자 23번의 경험은? 그 사람한테는 '최악'이었을 거다. 여기서 깨달았다. 평균은 '대표값'이 아니다. '중간값'이다. 통계를 뒤엎는 순간 다음날 아침. 팀 회의. PM이 물었다. "Maze 리포트 봤는데, 85% 성공이면 괜찮은 거 아니에요?" 개발 리드도 거들었다. "만족도도 4.2점이잖아요. 이 정도면 배포해도 될 것 같은데." 나는 노트북을 돌렸다. "이 사람 봐주세요." 참여자 23번 데이터를 보여줬다. 4분 50초. 5회 오류. 만족도 2점. "이 사람도 85%에 포함됐어요. 근데 이 사람 경험은 최악이었어요. 만약 우리 실제 유저가 이렇게 되면?" PM이 말했다. "그래도 소수 아니에요? 대부분은 괜찮았잖아요." 나는 인터뷰 클립을 틀었다. 참여자 3번. "이게 결제 버튼인가?" 그 3초 정지. "이 사람도 완료했어요. 2분 40초. 평균이랑 비슷해요. 근데 이 망설임. 실제 서비스에서는 이탈로 이어질 수 있어요." 회의실이 조용해졌다. 디자이너가 물었다. "그럼 어떻게 해요? 85%도 안 믿어요?" 나는 정리했다. "85%는 '완료'를 측정한 거예요. '경험'을 측정한 게 아니에요. 정량 데이터는 '무엇'을 알려주고, 정성 데이터는 '왜'를 알려줘요. 둘 다 필요해요." PM이 한숨을 쉬었다. "그럼 또 수정해야 해요?" "네. 근데 작은 수정이에요. 버튼 위치하고 색상. 이거만 바꾸면 망설임이 줄어들 거예요." 그렇게 2주가 더 걸렸다. 불일치를 해석하는 법 그 뒤로 Maze 리포트를 보는 방식이 바뀌었다. 1. 평균 말고 분포를 본다 Maze 리포트:평균 완료 시간: 2분 30초내가 보는 것:최소: 1분 50초 최대: 4분 50초 중앙값: 2분 20초 90 퍼센타일: 3분 40초평균은 극값에 영향을 받는다. 중앙값과 분포를 봐야 '진짜' 경험이 보인다. 2. 성공률 말고 과정을 본다 Maze 리포트:성공률: 85%내가 보는 것:오류 클릭이 어디서? 망설임이 어디서? (타임 갭) 뒤로 가기가 왜?'완료'와 '순조로운 완료'는 다르다. 3. 만족도 말고 맥락을 본다 Maze 리포트:만족도: 4.2점내가 보는 것:5점 준 사람: 파워유저, 경험 많음 2점 준 사람: 첫 이용, 당황함평균 4.2점은 '두 그룹의 평균'이다. 우리 타겟은 어느 쪽인가? 4. 정량 데이터에 정성 데이터를 겹친다 이제는 리포트를 이렇게 만든다: [Maze 정량] 85% 성공률, 평균 2분 30초[유저 인터뷰 정성] "이게 결제 버튼인가?" (참여자 3) → 버튼 레이블 모호함"왜 여기 있어요?" (참여자 5) → 레이아웃 기대와 불일치[해석] 완료는 하지만 망설임 존재 → 버튼 위치 + 레이블 수정 필요정량은 '증상'을 알려준다. 정성은 '원인'을 알려준다. 둘이 합쳐져야 '해결책'이 나온다. 9년 차의 깨달음 UX 기획 9년 차. 지금 알게 된 것. 데이터는 거짓말을 안 한다. 근데 전부를 말하지도 않는다. Maze 리포트의 85% 성공률. 거짓말 아니다. 40명 중 34명이 실제로 완료했다. 근데 그 과정의 망설임, 당황, 불편함. 그건 숫자에 안 나온다. 한 유저의 불편이 전체 경험을 대표할 수 있다. 참여자 23번. 4분 50초 걸린 그 사람. 통계적으로는 이상치(outlier)다. 제거해도 된다. 근데 실제 서비스에서 그 사람 같은 유저가 100명이면? 그들은 이탈한다. 리뷰에 "불편하다"고 쓴다. 숫자에는 안 나오지만 비즈니스에는 타격이다. 정량과 정성의 균형 초반에는 정량 데이터만 믿었다. "숫자가 진실이야." 중반에는 정성 리서치에 빠졌다. "유저 목소리를 들어야 해." 지금은 안다. 둘 다 필요하다. 둘 다 불완전하다. 정량 데이터는 '무엇'을 알려준다. 큰 그림. 트렌드. 패턴. 정성 데이터는 '왜'를 알려준다. 맥락. 이유. 감정. '무엇'만 알면 개선 방향을 모른다. '왜'만 알면 규모를 모른다. 둘을 겹쳐야 완전해진다. 이제 하는 것 요즘은 Maze 리포트를 열 때 이렇게 한다.평균값을 본다 (전체 경향) 분포를 본다 (극값과 중앙값) 이상치를 본다 (문제의 신호) 인터뷰 녹취를 겹친다 (이유 파악) 해석을 쓴다 (무엇 + 왜 = 어떻게)그리고 팀한테 공유할 때 이렇게 말한다: "Maze에서는 85%가 성공했어요. 근데 인터뷰에서는 망설임이 있었어요. 둘 다 맞는 얘기예요. 85%는 완료했지만, 과정이 불편했다는 거죠. 개선이 필요해요." PM은 가끔 불평한다. "데이터도 믿고 인터뷰도 믿어야 하면 뭘 믿어요?" 나는 답한다. "둘 다요. 근데 다른 걸 믿는 거예요."정량 데이터는 '무엇'을, 정성 데이터는 '왜'를 말한다. 둘 다 진실이다. 근데 다른 진실이다. UX 기획자의 일은 두 진실을 연결하는 거다. 그래야 '어떻게' 개선할지 보인다.
- 06 Dec, 2025
월요일 아침 회의에서 '그냥 AB테스트로 검증하죠'라고 나올 때
월요일 아침 회의에서 '그냥 AB테스트로 검증하죠'라고 나올 때 9시 30분, 주간 기획 회의 월요일 아침이다. 커피 한 잔 들고 회의실 들어갔다. 주간 기획 회의. PM, 개발자, 디자이너, 나. 총 8명. PM이 화면 공유했다. "이번 주 이슈입니다." 앱 메인 화면 개편안이다. 탭 구조를 바꾸자는 거다. "현재 탭이 5개인데요, 3개로 줄이면 어떨까요?" 디자이너가 목업을 띄웠다. 깔끔하긴 하다. 나는 손 들었다. "유저 관점에서 보면요." 회의실이 조용해졌다. 다들 안다. 내가 뭘 말할지. "지금 탭 5개 중에 어떤 걸 없앨 건지, 유저들이 각 탭을 어떻게 쓰는지 리서치가 필요합니다." PM이 고개 끄덕였다. "맞아요, 근데 일정이..." 그때 옆에 있던 3년 차 기획자가 말했다. "그냥 AB테스트로 검증하죠. 빠르잖아요."9년 차가 듣는 말 "AB테스트로 검증하죠." 이 말을 들은 게 몇 번째인지 모르겠다. 작년엔 월 2회. 올해는 주 1회. 데이터 중심 문화가 자리 잡으면서 생긴 현상이다. 나쁜 건 아니다. 오히려 좋다. 과거엔 "대표님 취향"이었으니까. 근데 요즘은 반대로 간다. "일단 만들고 AB테스트"가 만능 해결책처럼 됐다. 내가 물었다. "AB테스트 전에 가설이 필요한데요." "탭 3개가 5개보다 낫다는 가설 근거가 뭔가요?" 3년 차가 답했다. "일단 해보면 알 수 있잖아요." 일단 해보면 안다. 맞다. 근데 뭘 배우는지가 중요하다. AB테스트는 'How much' 를 알려준다. 탭 3개 버전이 체류시간 5% 올렸다. 좋다. 근데 'Why' 는 안 알려준다. 왜 5% 올랐는지. 어떤 유저가. 어떤 상황에서. 이게 없으면 다음 기획 때 또 막힌다.회의는 계속됐다 PM이 중재했다. "리서치 일정은 얼마나 걸릴까요?" 나는 노션 페이지 열었다. 리서치 계획서다. 이미 주말에 초안 짜놨다. "유저 인터뷰 10명, 설문 조사 300명 응답. 2주 걸립니다." "인터뷰는 현재 탭 사용 패턴, 니즈 파악이고요." "설문은 정량 데이터 보강입니다." 디자이너가 물었다. "비용은요?" "인터뷰 참가자 사례비 50만원, 설문 툴 비용 30만원. 총 80만원입니다." 회의실 분위기가 미묘해졌다. 3년 차가 다시 말했다. "2주면 개발 끝나는데요." "AB테스트는 1주면 결과 나오잖아요." 맞는 말이다. 일정상으론 AB테스트가 빠르다. 비용도 적다. 개발 리소스만 있으면 된다. 근데 나는 안다. AB테스트만 하면 6개월 뒤 또 이 회의를 한다는 걸. "탭 구조가 왜 안 맞는지 모르겠어요." 라면서. 시니어의 역할 나는 9년 차다. 이 바닥에서 리서치 없이 기획한 프로젝트를 많이 봤다. 초반엔 잘 간다. 빠르게 만들고, 빠르게 테스트. 숫자는 조금씩 개선된다. 클릭률 2% 상승, 체류시간 3% 증가. 근데 1년 지나면 막힌다. "더 이상 뭘 개선해야 할지 모르겠어요." 왜냐면 유저를 모른다. 숫자만 봤지, 사람을 안 봤다. AB테스트는 답을 준다. 근데 질문은 안 준다. 다음 기획 방향은 안 알려준다. 시니어의 역할은 여기서 나온다. "왜 이게 필요한지" 를 설명하는 것. 나는 다시 말했다. "AB테스트는 검증 도구입니다. 근데 뭘 검증할지 먼저 알아야죠." "지금 우리는 검증할 가설조차 없어요." PM이 고개 끄덕였다. "그럼 어떻게 하죠?"타협안 나는 화면 공유를 바꿨다. 지난달 다른 프로젝트 리서치 결과다. "작년에 검색 기능 개편할 때 기억나세요?" "AB테스트만 했을 때랑, 리서치 병행했을 때 비교입니다." 데이터를 보여줬다. AB테스트만: 클릭률 5% 증가. 근데 3개월 뒤 원복. 리서치 병행: 클릭률 3% 증가. 근데 6개월째 유지. "리서치로 유저가 '뭘 검색하고 싶어 하는지' 알았거든요." "그래서 검색 카테고리를 바꿨고, 지금도 잘 돌아가는 겁니다." 회의실이 조용했다. 나는 타협안을 냈다. "2주가 길면, 퀵 리서치로 1주 안에 끝낼게요." "인터뷰 5명, 설문 150명. 핵심 질문만 던지고." "그 결과로 AB테스트 버전 만들면, 검증도 빠르고 방향도 명확합니다." PM이 물었다. "그럼 일정은요?" "리서치 1주, AB테스트 설계 3일, 개발 1주, 테스트 1주. 총 4주입니다." 3년 차가 말했다. "그냥 만들면 2주인데요." PM이 손 들었다. "4주로 갑시다. 제대로 하는 게 맞아요." 회의 끝나고 회의실 나왔다. 오전 11시. 복도에서 3년 차가 따라왔다. "선배, 근데 진짜 궁금한데요." "AB테스트가 빠르고 정확한데, 왜 굳이 리서치를 해요?" 나는 멈춰 섰다. 이 질문을 몇 번 들었는지 모르겠다. "AB테스트는 '이게 더 나은가' 를 알려줘." "리서치는 '왜 더 나은가, 다음은 뭘 할까' 를 알려주지." 3년 차가 고개 갸우뚱했다. 나는 예시를 들었다. "예를 들어, 탭 3개 버전이 이겼다고 치자." "근데 왜 이겼는지 모르면, 다음 기획 때 또 A안 B안 C안 만들어서 테스트하는 거야." "리서치하면 '유저들이 탭을 이렇게 쓴다' 는 걸 아니까, 바로 정답안 만들 수 있고." 3년 차가 "아..." 했다. "AB테스트는 최종 검증이야. 시작점이 아니고." "리서치가 시작점이지." 3년 차가 끄덕였다. "그럼 리서치 도와드릴게요." 데이터 중심 문화의 명과 암 사무실로 돌아왔다. 자리에 앉아서 노션 열었다. 리서치 계획 수정. 요즘 회사는 데이터 중심 문화를 강조한다. 좋은 일이다. 과거엔 "느낌", "직관", "경험" 이었으니까. 근데 명과 암이 있다. 명: 빠른 의사결정, 객관적 검증, 실패 비용 감소. 암: 숫자만 보고 사람 안 봄, Why 없이 How much만, 단기 성과 집착. AB테스트는 명의 정점이다. 빠르게 만들고, 빠르게 테스트하고, 빠르게 개선. 근데 암도 크다. 유저를 숫자로만 본다. 클릭률, 전환율, 체류시간. 유저는 숫자가 아니다. 사람이다. 피곤한 출퇴근 중에 앱 쓰고, 점심시간에 쇼핑하고, 잠들기 전에 콘텐츠 본다. 이 맥락을 모르면, 숫자는 의미 없다. "체류시간 5% 증가" 가 좋은 건지 나쁜 건지도 모른다. 빠르게 찾아서 나가야 하는 앱인데 5% 늘었으면 오히려 나쁜 거다. 리서치는 이 맥락을 준다. 오후 2시, 유저 인터뷰 준비 오후엔 다른 프로젝트 인터뷰가 있다. 앱 결제 화면 개편 관련. 인터뷰이 3명. 인터뷰 가이드 열었다. 질문 리스트 체크. 녹취 준비. Maze 프로토타입 확인. 동료 디자이너가 물었다. "인터뷰 뭐 물어볼 거예요?" "결제 화면에서 막힌 경험 있는지." "어떤 정보가 부족했는지." "신뢰를 느낀 요소는 뭔지." 디자이너가 말했다. "그냥 결제율 데이터 보면 안 돼요?" "결제율은 '얼마나' 를 알려줘. 근데 '왜 안 했는지' 는 안 알려주지." "이탈률 30% 인 걸 알아도, 왜 이탈했는지 모르면 개선 못 해." 디자이너가 끄덕였다. 인터뷰는 3시부터다. 커피 한 잔 더 마셨다. 네 번째다. 인터뷰 중 3시. 화상 회의 시작. 인터뷰이는 32세 여성. 앱 사용 2년 차. "안녕하세요, 오늘 시간 내주셔서 감사해요." "편하게 이야기해주시면 돼요." 먼저 현재 결제 화면 보여줬다. "이 화면에서 어떤 느낌 받으셨어요?" 인터뷰이가 화면 보더니 말했다. "음... 정보가 너무 많아요. 뭘 먼저 봐야 할지 모르겠어요." "어떤 정보가 불필요하다고 느꼈어요?" "쿠폰이랑 포인트가 같이 있는데, 이게 중복 적용인지 헷갈려요." "그리고 배송 정보가 왜 여기 있는지도 모르겠고." 메모했다. "중복 적용 불명확", "배송 정보 위치 문제". "그럼 어떤 정보가 있으면 좋을까요?" "최종 가격이 크게 보이면 좋겠어요. 지금은 작아서 못 찾겠어요." "그리고 배송비 포함인지 아닌지 확실하게요." 또 메모했다. "최종 가격 강조", "배송비 명시". 이게 리서치다. GA4로는 "결제 화면 이탈률 30%" 만 나온다. 인터뷰로는 "왜 이탈했는지" 가 나온다. 오후 5시, 인터뷰 정리 인터뷰 3명 끝났다. 녹취록 정리 시작. Otter.ai 돌렸다. 3명의 공통 의견:최종 가격 찾기 어려움 쿠폰/포인트 중복 적용 불명확 결제 버튼 위치 애매함 "안전한 결제" 문구 필요이걸 기획에 반영하면 된다. 디자이너한테 슬랙 보냈다. "인터뷰 결과 공유합니다. 내일 같이 보죠." PM한테도 보냈다. "이탈 원인 3가지 나왔어요. 개선안 짜볼게요." 이게 리서치의 가치다. "이탈률 30%" 라는 숫자를 "최종 가격 찾기 어려워서" 라는 이유로 바꿨다. 이제 AB테스트 버전 만들 때, A안: 최종 가격 강조 B안: 쿠폰/포인트 안내 개선 이렇게 가설 명확하게 만들 수 있다. 퇴근 전 6시. 퇴근 준비. 오늘 회의 생각났다. "그냥 AB테스트로 검증하죠." 나는 9년 차다. 이 말을 처음 들었을 땐 화났다. "리서치 무시하나?" 싶어서. 근데 지금은 이해한다. 데이터 중심 문화에서 자란 후배들은 AB테스트가 익숙하다. 빠르고, 객관적이고, 명확하니까. 리서치는 느리고, 주관적이고, 애매해 보인다. 근데 이건 오해다. 리서치는 느린 게 아니라 깊다. 주관적인 게 아니라 맥락적이다. 애매한 게 아니라 탐색적이다. 시니어의 역할은 이걸 설명하는 거다. "리서치가 왜 필요한지" 를. 화내거나 고집부리는 게 아니라, 데이터와 리서치를 어떻게 함께 쓸지 보여주는 것. AB테스트는 검증이다. 리서치는 탐색이다. 둘 다 필요하다. 집 가는 길 판교역 지하철. 퇴근 시간이라 사람 많다. 핸드폰 켰다. UX 아티클 하나 저장해뒀다. "Why user research still matters in the age of big data" 읽기 시작했다. "Big data tells you what users do. User research tells you why they do it." 맞는 말이다. GA4는 "탭 3번 클릭" 을 알려준다. 인터뷰는 "왜 3번 클릭했는지" 를 알려준다. 둘 다 있어야 완성이다. 집 도착했다. 남편이 저녁 차려놨다. 개발자라 칼퇴했다. "오늘 어땠어?" "회의에서 또 AB테스트 얘기 나왔어." "또?" "응. 근데 타협했어. 리서치 1주, 테스트 1주로." "잘했네. 9년 차는 다르네." 근데 나는 안다. 다음 주 월요일에 또 비슷한 회의 할 거라는 걸. "그냥 빠르게 만들죠" 라는 말 들을 거라는 걸. 시니어의 일은 매번 설명하는 것이다. 지치지 않고.데이터와 리서치, 둘 다 필요하다. 근데 매번 설명해야 한다. 이게 9년 차의 일이다.
- 05 Dec, 2025
Figma에서 결재자 몇 명이 만든 프로토타입, 유저는 외면했다
결재선은 통과, 유저는 이탈 월요일 아침 9시. 메일함에 '프로토타입 검토 요청' 떴다. CTO, 본부장, 팀장 세 명이 Figma 링크에 댓글 48개. "이 플로우 좋은데요", "색상 고급스럽네요", "이번엔 빠르게 갑시다." 열어봤다. 진짜 멋있다. 그라데이션, 마이크로 인터랙션, 토스트 애니메이션까지. 디자이너가 3주 밤샘한 티 난다. 근데 뭔가 이상하다. 이 플로우, 유저가 어떻게 쓸지 상상이 안 된다. "유저 테스트 일정 잡을까요?" 슬랙에 물었다. "일단 개발 들어가고, AB테스트로 보죠. 일정이 너무 빡빡해서요." 또 이 패턴이다.결재자 3명의 프로토타입 이 프로젝트, 시작은 2월이었다. 목표: 신규 구독 서비스 출시. KPI: 전환율 12%. 일정: 4개월. 킥오프 때부터 신호가 있었다. "이번엔 빠르게 가봅시다. 레퍼런스 보면서 만들면 되죠." PM이 가져온 레퍼런스 10개. 전부 해외 서비스. Spotify, Notion, Linear. "이 UI 깔끔한데요." "이 인터랙션 좋네요." "우리도 이렇게." 회의실에서 3시간. 결정권자 세 명이 각자 좋아하는 디자인 짜깁기. 유저는 한 번도 안 나왔다. 나는 말했다. "타겟 유저가 누구죠? 30대? 40대? 구독 서비스 써본 경험은?" "일단 만들어보고 수정하죠. 유저는 다 비슷비슷해요." 비슷비슷하다고. 나는 9년 동안 500명 넘게 인터뷰했다. 비슷한 유저는 한 명도 없었다. 30대 직장인도, 결제 습관도, 앱 사용 패턴도 전부 다르다. 그래도 일단 넘어갔다. 급하다니까. 디자이너는 3주 동안 Figma에 살았다. 컴포넌트 400개, 프로토타입 링크 30개. 완벽했다. 화면 전환 타이밍 0.3초까지 맞춤. 결재선에 올렸다. CTO "Good", 본부장 "Approve", 팀장 "디자인 퀄리티 최고네요." 근데 나는 불안했다.유저 테스트 1일 차, 침묵 개발 들어가기 전에 우겨서 유저 테스트 3일 받아냈다. Maze로 원격 테스트 30명, 오프라인 인터뷰 10명. 예산 450만원. "이거 꼭 해야 돼요?" 설득에 2주 걸렸다. 첫 날. 34세 남성, 직장인, 넷플릭스·유튜브 프리미엄 구독 중. "자, 이 서비스로 구독 신청해보세요." 프로토타입 링크 보냈다. 15초 침묵. "여기서 뭘 하는 건가요?" 첫 화면에서 막혔다. 메인 CTA가 그라데이션 버튼인데, 텍스트가 '시작하기'. 뭘 시작하는지 모르겠단다. "이 서비스가 뭐 해주는 건지 잘 모르겠어요. 디자인은 예쁜데." 다음 화면. 요금제 선택. 3개 카드가 가로로 쭉. 디자이너는 '스와이프 인터랙션'이라고 했는데, 유저는 스와이프를 몰랐다. 첫 번째 카드만 보고 "이게 전부예요?" 결제 화면. 카드 정보 입력 폼이 16개 필드. "너무 많은데요. 꼭 다 써야 돼요? 그냥 네이버페이 안 돼요?" 10분 테스트. 완료율 0%. "죄송한데, 이거 그냥 넘어가도 돼요?" 나는 녹취록 타이핑하면서 손에 힘이 들어갔다.30명의 데이터, 0명의 성공 Maze 결과 나왔다. 평균 완료율: 23%. 평균 소요시간: 8분 32초. 목표는 2분이었다. 히트맵 봤다. 첫 화면에서 73%가 스크롤만 하다가 이탈. CTA 클릭률 18%. 요금제 화면. 체류시간 평균 2분 14초. 유저는 고민하는 게 아니라 이해를 못 하고 있었다. "이 차이가 뭐지?" 댓글 12개. 결제 화면 진입률: 9%. 결제 완료율: 2%. 30명 중 1명만 성공. 오프라인 인터뷰 10명. 패턴이 보였다. "디자인 예쁘네요. 근데 이게 뭐 하는 건지 모르겠어요." (7명) "클릭할 곳을 못 찾겠어요." (5명) "너무 복잡해요. 그냥 앱스토어 설명 보고 결제하면 안 돼요?" (8명) "이 서비스 왜 써야 하는지 모르겠어요." (10명) 가장 충격적인 건, 35세 여성 인터뷰이었다. "이 화면 진짜 예쁘네요. 어떤 디자이너가 만들었어요?" 칭찬하면서도 3분 동안 아무것도 못 했다. 예쁜 걸 보러 온 게 아니라 구독하러 온 건데. 나는 인터뷰 끝나고 화장실 가서 한숨 쉬었다. 회의실 3시간, 또 시작 리포트 작성했다. 50페이지. 인사이트 요약 10장, 히트맵 8장, 인터뷰 발췌 20장, 개선안 12장. 회의 잡혔다. 참석자: CTO, 본부장, 팀장, PM, 디자이너, 개발자 3명, 나. 10분 발표했다. "완료율 23%, 첫 화면 이탈 73%, 유저는 이 서비스가 뭔지 모름. 재설계 필요." 침묵 10초. "그래도 디자인 퀄리티는 좋잖아요." 본부장이 말했다. "유저가 이해를 못 하는데요." 내가 대답했다. "30명이 대표성 있나요? 통계적으로." PM이 물었다. "정성 조사는 5명만 해도 80% 이슈 발견됩니다. 30명이면 충분해요." 내가 말했다. "그래도 일정이 너무 밀렸는데, 일단 출시하고 수정하면 안 될까요?" 팀장. "첫 인상이 전부예요. 출시하고 수정하면 이미 유저는 떠나요." 나. "근데 이미 개발 30% 진행됐거든요." 개발팀장. 회의실 온도가 내려갔다. CTO가 말했다. "결재선 올릴 때 왜 이 얘기 안 했어요?" "유저 테스트 하자고 했는데 일정 때문에 밀렸어요." 나는 슬랙 로그 캡처 화면 띄웠다. 2월 15일, 3월 2일, 3월 18일. 세 번 요청했다. 침묵 30초. "알겠습니다. 2주 드릴 테니 핵심만 수정하세요." CTO. 회의 끝. 3시간 걸렸다. 나는 자리 돌아와서 모니터 앞에서 멍 때렸다. 손이 떨렸다. 2주 만에 뒤집기 월요일부터 다시 시작. 디자이너랑 앉아서 우선순위 정리했다. 바꿀 것: 첫 화면, 요금제 화면, 결제 플로우. 유지할 것: 색상, 타이포, 브랜딩. 첫 화면: 그라데이션 버튼 없앴다. "시작하기" 대신 "월 9,900원으로 시작". 서비스 설명 3줄 추가. "이 서비스는 OOO을 해결합니다." 요금제: 카드 3개에서 리스트로 변경. 각 항목마다 "누구에게 맞나요?" 추가. "한 달에 10권 이상 읽는 분께 추천" 같은 구체적 설명. 결제: 16개 필드에서 6개로 축소. 네이버페이, 카카오페이 추가. "30초 만에 완료" 텍스트 강조. 수요일에 러프 프로토타입 완성. 목요일에 퀵 테스트 5명. 완료율: 80%. 평균 소요시간: 1분 52초. "오, 이제 이해되네요." "빠르네요." "이 설명 있으니까 좋아요." 금요일에 최종 디자인. 월요일에 개발 재시작. 2주 만에 뒤집었다. 출시 4주 후, 숫자 5월 15일. 정식 출시. GA4 대시보드 매일 확인했다. 1주차: 전환율 8.2%. 목표는 12%. 2주차: 9.1%. 3주차: 11.4%. 4주차: 12.8%. 목표 달성. 근데 원래 디자인이었으면? Maze 데이터 기준으로 시뮬레이션하면 전환율 3% 예상. 450만원 리서치 비용으로 전환율 9.8%p 올렸다. 구독 신규 유입 월 1,200명 기준, 월 매출 1,400만원 증가. ROI 311%. 리포트 작성해서 공유했다. 본부장한테 "수고했어요" 슬랙 받았다. 그게 전부였다. 멋진 디자인 vs. 작동하는 디자인 이 프로젝트 하면서 배운 거. 결재자가 좋아하는 디자인 ≠ 유저가 쓰는 디자인. Figma에서 예쁜 거랑, 실제로 작동하는 건 다르다. 그라데이션 버튼이 클릭률 높이는 게 아니라, "이걸 누르면 뭐가 되는지" 명확한 텍스트가 클릭률 높인다. 마이크로 인터랙션 멋있어도, 유저가 그 화면까지 못 가면 의미 없다. 레퍼런스 10개 짜깁기해도, 우리 유저 맥락이 다르면 안 맞는다. Spotify 쓰는 20대랑 우리 서비스 타겟 35세 직장인은 다르다. "일단 만들고 수정하자"는 핑계다. 출시 후 수정은 비용이 10배 든다. 개발 리소스, 유저 신뢰, 브랜드 이미지. 다 까먹는다. 가장 중요한 건, 급할 때일수록 리서치부터. 2주 리서치가 아까워서 건너뛰면, 나중에 2개월 갈아엎는다. 나는 이거 7번 봤다. 9년 동안. 유저 테스트 안 하고 출시한 프로젝트 5개, 전부 재작업. 평균 3개월 지연. 유저 테스트 하고 출시한 프로젝트 8개, 일정 준수율 87%. 숫자는 거짓말 안 한다. 결재선이 아니라 유저가 쓴다 목요일 저녁. 팀 회식. 본부장이 물었다. "그때 유저 테스트 안 했으면 어떻게 됐을까요?" "출시하고 2주 뒤에 전환율 3% 보고, 긴급 회의 했을 거예요. '왜 안 되지?' 하면서." "그랬겠네요." "그리고 디자이너 탓했겠죠. '디자인이 문제다', 'UI를 바꿔보자'. 근데 문제는 디자인이 아니라 유저 이해 부족이었어요." "맞아요. 그때 우리 유저가 누군지 제대로 몰랐죠." "결재선 통과하려고 만든 프로토타입이랑, 유저가 쓰려고 만든 프로토타입은 달라요. 우린 후자를 만들어야 하는데, 맨날 전자를 만들죠." 본부장이 웃었다. "다음엔 리서치부터 하겠습니다." 나는 속으로 생각했다. '다음에도 똑같을 거다.' 하지만 입 밖에 낸 말은 달랐다. "네, 감사합니다." 9년 차, 여전히 퇴근길 지하철. 오늘도 Figma 커뮤니티 둘러봤다. 멋진 프로토타입 천지다. 그라데이션, 3D, 글래스모피즘. 댓글 보면 "Wow", "Amazing", "How did you make this?" 근데 "유저 테스트 결과는?" 묻는 댓글은 없다. 우리는 여전히 만드는 것에 집중한다. 작동하는 것보다. 예쁜 것에 집중한다. 이해하기 쉬운 것보다. 결재자 설득에 집중한다. 유저 설득보다. 나는 9년 차다. 여전히 같은 싸움 한다. "유저 테스트 꼭 해야 돼요?" "예산이 너무 많이 들어요." "일정이 없어요." 매번 설득한다. 매번 숫자로 증명한다. 매번 이긴다. 그리고 다음 프로젝트에서 또 시작한다. 언젠간 바뀔까. 유저 리서치가 '선택'이 아니라 '기본'이 되는 날이 올까. 결재선 통과가 아니라, 유저 통과가 목표인 날이.결재자 3명이 좋아해도, 유저 30명이 외면하면 실패다.
- 04 Dec, 2025
퍼소나 작성에 2주를 쓰는 게 낭비일까?
2주를 쓴다 퍼소나 작업에 2주를 쓴다고 하니까 PM이 물었다. "그거 하루면 되는 거 아냐?" 아니다. 절대 아니다. 나이, 직업, 연봉 적는 게 퍼소나가 아니다. 그건 인구통계학적 데이터다. 퍼소나는 그 사람이 우리 서비스를 어떤 맥락에서 만나는지를 정의하는 작업이다. 32세 여성 직장인. 연봉 5천. 서울 거주. 이게 끝이면 기획이 안 나온다. 이 사람이 출근길에 뭘 보는지, 점심시간에 뭘 검색하는지, 퇴근 후 소파에 앉아서 폰을 켤 때 무슨 생각을 하는지가 없으면 플로우를 못 그린다. 그래서 2주를 쓴다.출근길 기분까지 인터뷰를 10명 했다. 우리 서비스를 쓰는 직장인 여성들. 첫 번째 질문. "오늘 출근길 어땠어요?" 대부분 "그냥요" 한다. 그럼 더 판다. "지하철에서 뭐 보셨어요?" "앱 켜셨어요?" "뭐 검색하셨어요?" 그러면 나온다. "아, 출근하면서 오늘 점심 뭐 먹을까 검색했어요." "회사 가기 전에 날씨 확인하고, 우산 챙길지 고민했어요." "지하철에서 뉴스 헤드라인만 쭉 봤어요. 자세히는 안 읽고요." 이게 퍼소나다. 출근길에 우리 앱을 여는 사람은 '정보를 깊게 읽으려는 게 아니라 빠르게 훑어보려는' 맥락이다. 그럼 첫 화면 구조가 달라져야 한다. 긴 텍스트 블록은 안 된다. 카드형 UI에 썸네일과 헤드라인만. 이런 걸 2주 동안 정리한다. 점심시간 패턴 두 번째 질문. "점심시간에 보통 뭐 하세요?" "휴대폰 봐요." 더 판다. "뭘 보시는데요?" "유튜브요. 근데 긴 영상은 안 봐요. 5분짜리 쇼츠." "인스타 릴스요. 점심 먹으면서 보다가 1시간 가요." "뉴스 앱이요. 근데 댓글 보는 게 더 재밌어요." 점심시간 유저는 '킬링타임' 모드다. 집중도가 낮다. 영상이나 숏폼 콘텐츠 소비에 최적화돼 있다. 그럼 우리 서비스에서 점심시간대 진입 유저에게 긴 아티클을 메인으로 노출하면 이탈률이 높다. 대신 짧은 영상 콘텐츠나 이미지 위주 콘텐츠를 상단에 배치해야 한다. 이런 인사이트가 GA4 수치만으론 안 나온다. "점심시간대 체류시간 2분 30초" 라는 데이터는 있다. 근데 왜 2분 30초인지는 인터뷰를 해야 안다.저녁 습관이 중요한 이유 세 번째 질문. "퇴근하고 집 가면 뭐 하세요?" "소파에 누워서 폰 봐요." "씻고 나서 침대에서 유튜브요." "배달 앱 켜서 뭐 먹을까 30분 고민해요." 저녁 시간대 유저는 '릴랙스' 모드다. 뭔가를 해야 한다는 압박이 없다. 그래서 콘텐츠 소비 시간이 길어진다. 이 타이밍에 우리 서비스가 '10분 이상 읽어야 하는 심층 아티클'을 추천하면 클릭률이 높다. 오히려 점심시간보다 저녁 9시~11시에 장문 콘텐츠 소비가 많다. 실제로 GA4 데이터 뜯어보니까 맞았다. 오후 9시 이후 평균 체류시간이 5분 넘었다. 점심시간의 두 배. 근데 우리 서비스는 저녁 시간대에 숏폼 콘텐츠를 메인으로 노출하고 있었다. 잘못된 전략이었다. 퍼소나 작업하면서 '저녁 9시, 소파에 누워서 폰을 보는 지연씨'를 구체적으로 정의했고, 그 맥락에 맞는 콘텐츠 전략을 세웠다. 디테일이 기획을 살린다 PM이 또 물었다. "그래서 퍼소나가 기획에 어떻게 반영됐는데요?" 세 가지 변경했다.오전 출근 시간대(7~9시): 카드형 UI, 헤드라인 위주, 이미지 썸네일 크게 점심 시간대(12~1시): 숏폼 영상 콘텐츠 상단 배치, 스와이프 UI 저녁 시간대(9~11시): 장문 아티클 추천, 읽기 모드 UI 개선A/B 테스트 돌렸다. 출근 시간대 체류시간 1분 30초에서 2분 10초로 증가. 40초 늘었다. 클릭률 12% 상승. 점심 시간대 숏폼 콘텐츠 소비 23% 증가. 이탈률 8% 감소. 저녁 시간대 장문 아티클 읽기 완료율 18%에서 31%로 상승. 숫자가 증명했다. 퍼소나 작업 2주가 낭비가 아니었다.왜 2주나 걸리는가 퍼소나 작업이 2주 걸리는 이유. 첫째, 인터뷰 일정 조율. 10명 섭외하고 시간 맞추는 데만 3일. 둘째, 인터뷰 진행. 한 명당 1시간. 10명이면 10시간. 이틀. 셋째, 녹취록 정리. 10시간 분량 풀어서 텍스트로 정리하는 데 3일. 넷째, 인사이트 도출. 녹취록 읽으면서 패턴 찾기. 포스트잇에 키워드 정리. 그루핑. 2일. 다섯째, 퍼소나 문서 작성. 이름, 나이, 직업, 하루 일과, 감정 상태, 니즈, 페인포인트, 사용 맥락 정리. 2일. 여섯째, 내부 리뷰. 팀원들한테 공유하고 피드백 받고 수정. 2일. 총 14일. 2주. 빠르게 하려면 3일도 가능하다. 근데 퀄리티가 떨어진다. 인터뷰 5명으로 줄이고, 녹취록 대충 보고, 인사이트 얕게 뽑으면 된다. 근데 그럼 기획이 안 나온다. "32세 여성 직장인"이라는 껍데기만 남는다. 나이와 직업만으로는 부족하다 예전에 퍼소나를 빠르게 만든 적이 있다. 3일 만에. 28세 남성, 대학생, 서울 거주, 연 500만원 소비. 이게 끝이었다. 이걸 가지고 기획 회의를 했다. PM이 물었다. "이 사람이 우리 앱을 언제 써요?" 모르겠다. 퍼소나에 없다. "뭐 하다가 우리 앱 켜요?" 모르겠다. 인터뷰를 안 했다. "이 사람이 제일 불편해하는 게 뭐예요?" 모르겠다. 정성 리서치를 안 했다. 결국 그 프로젝트는 기획이 엉망이었다. "대학생이니까 가격 민감하겠지" 라는 추측으로 할인 쿠폰 기능을 메인에 넣었다. 반응 없었다. 나중에 다시 인터뷰 했다. 대학생 유저들은 가격보다 '빠른 배송'과 '리뷰 신뢰도'를 더 중요하게 봤다. 할인 쿠폰은 관심 없었다. 퍼소나를 대충 만들면 이렇게 된다. 출근길 기분을 아는 것 지금 진행 중인 프로젝트 퍼소나. 이지혜, 34세, 마케터, 연봉 6500만원, 서울 강남 거주 여기까지는 기본. 이제 디테일. 출근길: 7시 30분 집 나섬. 지하철 40분. 출근길에 링크드인 피드 확인. 업계 뉴스 헤드라인만 훑음. 자세히 안 읽음. 회사 도착 전에 오늘 할 일 머릿속 정리. 점심시간: 동료들이랑 밥 먹고 카페 감. 아이스 아메리카노. 카페에서 인스타 릴스 15분. 업무 관련 자료는 안 봄. 머리 비우는 시간. 오후: 회의 많음. 2~3개. 중간중간 메일 확인. 자료 준비. 퇴근 전 내일 일정 체크. 퇴근 후: 7시 퇴근. 집 가는 길에 유튜브로 마케팅 웨비나 들음. 소리만. 집 도착하면 씻고 소파. 넷플릭스 틀어놓고 폰으로 업무 관련 아티클 읽음. 북마크 많이 함. 주말: 토요일 오전 카페에서 책 읽음. 마케팅 서적. 오후엔 운동. 일요일은 쉼. 넷플릭스, 친구 만남. 페인포인트: 출근길엔 긴 글 읽기 싫음. 요약본 원함. 점심시간엔 일 생각 하기 싫음. 가벼운 콘텐츠. 저녁엔 깊이 있는 인사이트 원함. 근데 10분 넘는 건 부담. 주말 아침엔 집중도 높음. 긴 아티클도 OK.사용 맥락:우리 앱을 출근길, 퇴근길, 주말 아침에 씀. 점심시간엔 안 씀. 릴스 보느라 바쁨. 저장 기능 자주 씀. 나중에 읽기. 공유 기능은 거의 안 씀. 혼자 소비.이 정도 디테일이 있어야 기획이 나온다. 출근길 화면: 3줄 요약 + 썸네일. 클릭하면 전문. 저녁 화면: 심층 아티클 추천. "8분 읽기" 표시. 주말 아침 화면: 장문 콘텐츠. "20분 읽기" 표시. 커피 마시며 읽기 좋은 레이아웃. 데이터와 정성의 균형 GA4는 "오전 7~9시 트래픽 많음" 을 알려준다. 근데 왜 많은지는 안 알려준다. 인터뷰는 "출근길에 뭘 보는지" 를 알려준다. 근데 몇 명이 그런지는 안 알려준다. 둘이 합쳐져야 완성이다. GA4로 시간대별 트래픽 패턴 파악. 인터뷰로 각 시간대 사용 맥락 파악. 퍼소나로 구체적 사용자 정의. 기획으로 맥락에 맞는 경험 설계. 이 과정이 2주. 빠르게 하면 3일. 근데 그럼 "출근 시간대 트래픽 많으니까 푸시 많이 보내자" 같은 멍청한 결론이 나온다. 실제론 출근 시간대 유저는 '알림 끄고 싶어' 모드다. 푸시 보내면 이탈한다. 집착하는 이유 동료가 물었다. "너 왜 이렇게 디테일에 집착해?" 기획 퀄리티를 좌우하기 때문이다. 디테일 없는 퍼소나: "30대 직장인 여성" → 기획: 직장인이 좋아할 만한 콘텐츠 → 결과: 애매함. 클릭률 낮음. 디테일 있는 퍼소나: "34세 마케터 지혜씨, 출근길엔 헤드라인만 훑고, 저녁엔 8분짜리 아티클 읽음" → 기획: 출근 시간대엔 3줄 요약, 저녁엔 8분 아티클 → 결과: 클릭률 12% 상승, 체류시간 40초 증가. 숫자가 증명한다. 디테일이 있으면 기획이 구체적이다. 구체적이면 실행이 명확하다. 명확하면 결과가 좋다. 디테일 없으면 모든 게 추측이다. 추측으로 만든 기획은 실패한다. 2주가 아깝지 않다 PM한테 말했다. "퍼소나 2주 걸립니다." "너무 오래 걸리는데요. 일주일 안에 안 돼요?" "안 됩니다. 퀄리티 떨어집니다." "그래도 일정이..." "그럼 기획 3번 엎을 준비 하세요." 실제로 그렇다. 퍼소나 대충 만들면 기획 나오고, 개발 들어가고, QA 하고, 출시하고, 데이터 보고, "왜 반응이 없지?" 하고, 다시 기획. 3개월 낭비. 퍼소나에 2주 쓰면 그런 일이 없다. 첫 기획이 80% 맞는다. 수정은 디테일만. 2주 vs 3개월. 답은 명확하다. 품질을 좌우하는 것 좋은 기획과 나쁜 기획의 차이. 나쁜 기획: "30대 여성이 좋아할 만한 기능" 좋은 기획: "34세 마케터 지혜씨가 출근길 지하철에서 3분 안에 소비할 수 있는 콘텐츠" 나쁜 기획은 모호하다. "좋아할 만한" 이 뭔지 모른다. 측정 불가. 좋은 기획은 구체적이다. "출근길", "지하철", "3분" 이 명확하다. 측정 가능. 측정 가능하면 개선 가능하다. 개선 가능하면 성장 가능하다. 이게 퍼소나 작업의 목적이다. 측정 가능한 기획. 그래서 2주를 쓴다. 결국 이긴다 빠르게 만든 팀과 꼼꼼하게 만든 팀. 3개월 후 비교하면 답 나온다. 빠르게 만든 팀: 기획 3번 수정, 개발 재작업 2번, 출시 지연 1달, 결과 미흡. 꼼꼼하게 만든 팀: 기획 1번, 개발 순조, 출시 정시, 결과 좋음. 시간은 똑같이 쓴다. 근데 앞에 쓰냐 뒤에 쓰냐 차이. 나는 앞에 쓴다. 퍼소나에 2주. 리서치에 1주. 기획에 2주. 그럼 개발은 순조롭다. 수정 없다. QA도 빠르다. 출시 후 결과도 좋다. 이게 UX 기획자의 역할이다. 앞단에서 시간을 써서 뒷단 시간을 아끼는 것.2주는 낭비가 아니다. 투자다.