Showing Posts From
보며
- 21 Dec, 2025
Netflix를 보며 'UX가 왜 이렇게 설계됐을까' 분석하는 밤
퇴근하고 넷플릭스 켰다 9시 반. 퇴근하고 소파에 앉았다. 넷플릭스를 켰다. 오늘도 뭐 볼까 고민하는데, 눈에 들어오는 건 콘텐츠가 아니다. 인터페이스다. "저 추천 알고리즘 어떻게 돌아가는 거지?" 또 시작이다. 직업병이다. 9년 차가 되니까 이제 습관이 됐다. 드라마를 보는 게 아니라 서비스를 분석한다. 홈 화면을 스크롤한다. 첫 번째 줄은 "내가 본 콘텐츠와 비슷한". 두 번째는 "요즘 뜨는 콘텐츠". 세 번째는 "내가 시청 중인 콘텐츠". 정보 구조가 명확하다. 개인화와 트렌드를 동시에 잡았다. 계속성과 발견 사이의 균형. 이게 쉬운 게 아닌데. 남편이 옆에서 말한다. "그냥 보면 안 돼?" 안 된다. 이미 머릿속에서 유저 플로우가 그려지고 있다.썸네일 전략부터 뜯어본다 스크롤을 멈췄다. 썸네일들을 유심히 본다. 모든 썸네일이 다르다. 같은 콘텐츠인데 유저마다 다른 이미지를 보여준다는 건 알고 있었다. 하지만 오늘은 왜 이 이미지를 나한테 보여주는지 궁금해졌다. "오징어 게임" 썸네일. 나한테는 주인공의 클로즈업이 보인다. 남편 계정으로 들어가니까 게임 장면이 나온다. A/B 테스트를 엄청나게 돌렸을 거다. 클릭률 데이터를 보고 유저 타입별로 최적화했겠지. 우리 회사도 이 정도로 하고 싶은데. 매번 "그냥 하나로 통일하면 안 돼요?" 라는 질문에 설득한다. 리소스가 없다는 핑계가 돌아온다. 넷플릭스는 다르다. 데이터 기반 UX의 교과서다. 부럽다. 썸네일을 10개 정도 봤다. 공통점이 보인다. 모두 사람 얼굴이 중심이다. 감정 표현이 명확하다. 색상 대비가 강하다. 텍스트는 최소화. "왜 사람 얼굴일까?" 이미 답은 안다. 인간은 얼굴에 반응한다. 감정을 읽는다. 클릭률이 높다. 데이터로 증명됐을 거다. 하지만 그걸 알고 실행하는 건 다른 문제다. 우리 팀도 알고 있지만 "브랜드 아이덴티티"라는 이유로 못 한다. 이해는 간다. 하지만 답답하다. 노트 앱을 켰다. "넷플릭스 썸네일 전략" 이라고 메모했다. 나중에 회의 때 참고자료로 쓸 수 있다.자동 재생이 거슬리는데 왜 안 끄지 홈 화면에서 콘텐츠 위에 마우스를 올렸다. 3초 후에 자동으로 미리보기가 재생된다. 소리까지 나온다. 짜증난다. 솔직히. 조용히 보고 싶은데 갑자기 소리가 나온다. 근데 왜 안 끄지? 설정에 가면 끌 수 있다는 걸 안다. 9년 차 기획자인데 설정 메뉴를 모를 리가 없다. 그런데 안 끈다. 이유를 생각해봤다. 첫째, 귀찮다. 설정까지 가는 게 몇 단계인지 센다. 프로필 > 계정 > 재생 설정 > 자동 미리보기 끄기. 4단계다. 너무 깊다. 둘째, 가끔 유용하다. 뭘 볼지 모를 때 미리보기가 결정을 도와준다. 3초 만에 분위기를 알 수 있다. 셋째, 습관이 됐다. 이제 자동 재생이 넷플릭스의 일부처럼 느껴진다. 넷플릭스 UX 팀은 이걸 알고 있었을 거다. 사용자가 싫어하지만 끄지 않는다는 걸. 데이터로 봤을 거다. "자동 재생 끄는 유저 비율: 5% 미만" "자동 재생으로 인한 시청 시작률 증가: 30%" 숫자로 보면 명확하다. UX로는 별로지만 비즈니스로는 좋다. 이게 글로벌 서비스의 현실이다. 우리 팀에서도 비슷한 논쟁이 있었다. "팝업이 짜증나요. 유저들이 싫어해요." "근데 전환율은 올라가요." 결국 팝업은 유지됐다. 나는 반대했지만 데이터 앞에서 졌다. 넷플릭스도 똑같다. 유저 경험과 비즈니스 목표 사이. 균형이 아니라 트레이드오프다. 메모를 추가한다. "자동 재생: 사용자 불만 vs 비즈니스 지표. 데이터가 이긴다."검색이 이상하게 느껴진 이유 드라마를 고르다가 검색을 했다. "스릴러" 라고 쳤다. 결과가 이상하다. 스릴러가 아닌 것도 섞여 있다. 로맨스 드라마가 보인다. "스릴러 요소가 있는" 로맨스인 모양이다. 검색 알고리즘이 단순 키워드 매칭이 아니다. 태그, 유사도, 개인화를 다 섞었다. 일반 유저는 이상하다고 느낄까? 테스트해봤다. "액션" 이라고 검색했다. 역시 순수 액션만 나오지 않는다. 내가 본 영화와 비슷한 분위기가 섞였다. 이게 좋은 UX일까? 유저 입장에서는 혼란스럽다. "스릴러" 검색했는데 로맨스가 왜 나와? 하지만 넷플릭스 입장에서는 합리적이다. "당신이 좋아할 만한 콘텐츠" 를 보여주는 거다. 전환율이 높을 거다. 여기서 딜레마가 생긴다. 정확성 vs 추천 유저는 정확한 결과를 원한다고 생각한다. 근데 실제로는 "내가 좋아할 것" 을 원한다. 검색어는 명확하지만 의도는 애매하다. "스릴러" 라고 쳤지만 진짜 원하는 건 "내가 좋아하는 스릴러" 다. 넷플릭스는 이걸 파악했다. 그래서 검색 결과에 개인화를 섞었다. 우리 서비스는 어떨까? 검색 결과는 정확하다. 키워드 매칭이 정확하다. 근데 클릭률은 낮다. 회의 때마다 나온다. "검색 만족도가 낮아요." 원인을 찾으려고 유저 인터뷰를 했다. 대답은 이랬다. "정확하긴 한데... 제가 원하는 게 아니에요." 정확성과 만족은 다르다. 이걸 이해하는 데 3년 걸렸다. 메모한다. "검색 = 정확성 + 개인화. 둘 중 하나만 하면 실패." 시청 기록이 나를 감시하는 기분 프로필 메뉴를 열었다. "시청 기록" 을 봤다. 지난 3개월간 본 콘텐츠가 쭉 나온다. 드라마, 영화, 다큐. 다 기억난다. 근데 어떤 건 기억 안 난다. 5분 보고 끈 드라마. 잠깐 틀어놓고 다른 일 한 영화. 이것도 다 기록돼 있다. 기분이 묘하다. 감시당하는 느낌? 아니다. 그것보다는 "너무 잘 안다" 는 느낌. 넷플릭스는 내가 뭘 좋아하는지 나보다 잘 안다. 5분 보고 끈 드라마도 데이터다. "이런 건 안 좋아하는구나" 라고 학습한다. 이게 무섭기도 하고 편하기도 하다. 무서운 이유: 내 취향이 데이터가 된다. 프라이버시 문제는 아니지만 찝찝하다. 편한 이유: 추천이 정확해진다. 시간을 절약한다. 고민 없이 본다. 트레이드오프다. 또. 프라이버시 vs 편의성. 우리 서비스도 비슷한 고민이 있다. 유저 행동 데이터를 얼마나 수집할까? 어디까지가 적절할까? 법적으로는 문제없다. 동의도 받았다. 근데 윤리적으로는? 회의 때 나온 얘기다. "유저가 불편해하지 않으면 괜찮은 거 아닐까요?" 맞는 말이다. 근데 불편함을 어떻게 측정하지? 설문? 인터뷰? 넷플릭스는 이 문제를 어떻게 풀었을까? 궁금하다. 메모: "데이터 수집의 경계. 법 vs 윤리 vs 비즈니스." "계속 시청" 의 위치가 절묘하다 홈 화면 상단. 두 번째 줄. "계속 시청" 섹션. 위치가 절묘하다. 첫 번째 줄은 추천. 새로운 발견을 유도한다. 두 번째 줄은 계속성. 보던 걸 이어본다. 순서가 중요하다. 만약 "계속 시청" 이 첫 번째였다면? 유저는 새로운 콘텐츠를 덜 발견했을 거다. 넷플릭스 입장에서는 손해다. 라이브러리의 다양성을 못 보여준다. 만약 "계속 시청" 이 아래쪽이었다면? 유저는 찾기 힘들어한다. 스크롤을 많이 해야 한다. 이탈률이 올라간다. 두 번째가 딱이다. 추천도 보고, 계속 보던 것도 쉽게 찾는다. 이런 게 UX 디테일이다. 겉으로 보면 별거 아니다. 근데 A/B 테스트를 수십 번 돌려서 찾은 최적의 위치다. 우리 서비스의 홈 화면을 떠올렸다. "최근 본 상품" 이 어디 있지? 세 번째 줄? 네 번째? 기억이 안 난다. 이게 문제다. 위치가 명확하지 않다. 유저가 찾기 어렵다. 다음 회의 때 제안해야겠다. "계속성 섹션을 두 번째 줄로." 예상되는 반응: "근데 우리는 신상품을 먼저 보여줘야 하지 않을까요?" 또 설득해야 한다. 데이터를 보여줘야 한다. 넷플릭스 케이스를 들어야 한다. 메모: "계속성 섹션 위치 = 2번째 줄. 신규 발견 + 접근성 균형." 평점이 사라진 이유를 알 것 같다 예전엔 별점이 있었다. 5점 만점. 유저가 평가하고, 평균 점수가 보였다. 지금은 없다. "좋아요/싫어요" 만 있다. 왜 바꿨을까? 별점의 문제를 안다. 유저마다 기준이 다르다. 어떤 사람은 3점이 보통, 어떤 사람은 4점이 보통. 평균을 내면 의미가 없다. 게다가 참여율이 낮다. 별점 5개 중 하나를 고르는 게 귀찮다. 생각을 해야 한다. "4점? 4.5점?" 좋아요/싫어요는 쉽다. 생각 없이 누른다. 참여율이 올라간다. 데이터가 많아진다. 알고리즘이 정확해진다. 사용자 입장에서는 어떨까? 별점이 그립다는 사람도 있다. "이게 정말 재밌는지 알고 싶은데 좋아요만 보여주면 모르겠어요." 넷플릭스는 신경 안 쓴다. 매칭 점수를 보여준다. "85% 일치" 같은 거. 이게 더 효과적이다. 평균 평점보다 "나한테 맞는지" 가 중요하다. 개인화의 승리. 우리 서비스는 아직 별점이다. 5점 만점. 문제가 많다. 평점 낮은 상품은 안 팔린다. 판매자가 자기 계정으로 5점 준다. 신뢰도가 떨어진다. 바꾸자고 제안했다. "좋아요/싫어요로 바꾸면 어떨까요?" 반응: "근데 유저들이 평점을 믿고 사는데요." 데이터를 봤다. 평점 클릭률: 12%. 좋아요 예상 클릭률: 30%. 설득 중이다. 아직 안 바뀌었다. 메모: "별점 → 좋아요/싫어요. 단순함이 이긴다. 참여율 = 데이터 = 정확도." 에피소드 자동 넘김이 완벽한 타이밍 드라마를 보고 있다. 에피소드가 끝나간다. 엔딩 크레딧이 나온다. 10초 후에 다음 에피소드가 자동으로 재생된다. 건너뛰기 버튼이 있다. 근데 안 누른다. 그냥 기다린다. 10초는 짧다. 이 타이밍이 완벽하다. 5초였으면? 너무 빠르다. 엔딩을 못 본다. 짜증난다. 20초였으면? 너무 느리다. 기다리기 귀찮다. 버튼을 눌러야 한다. 10초가 딱이다. 엔딩 크레딧 시작하고, 생각할 틈을 주고, 자연스럽게 넘어간다. 이것도 테스트로 찾았을 거다. 5초, 10초, 15초, 20초. 각각 이탈률과 계속 시청률을 비교했을 거다. 결과: 10초가 최적. 우리 서비스에는 비슷한 기능이 없다. 동영상 콘텐츠가 있지만 자동 재생이 없다. 왜? 리소스가 없어서. "나중에 하죠" 라는 대답이 돌아온다. 나중은 언제일까? 3년째 나중이다. 넷플릭스는 다르다. 디테일에 집착한다. 10초라는 타이밍 하나도 데이터로 찾는다. 이게 글로벌 서비스와 우리의 차이다. 리소스? 아니다. 태도다. 메모: "자동 넘김 타이밍 = 10초. 디테일이 경험을 만든다." 인트로 건너뛰기 버튼의 위치 드라마 인트로가 나온다. 오프닝 음악. 5초 후에 "인트로 건너뛰기" 버튼이 오른쪽 하단에 나타난다. 위치가 이상하다. 오른쪽 하단? 보통 버튼은 중앙이나 오른쪽 상단 아닌가? 생각해봤다. 중앙이었으면 화면을 가린다. 인트로를 보고 싶은 사람한테 방해된다. 오른쪽 상단이었으면 프로필 버튼이랑 겹친다. 실수로 클릭할 수 있다. 오른쪽 하단이 최적이다. 눈에 띄지만 방해되지 않는다. 손이 가기 편하다 (리모컨 기준). 이것도 테스트했을 거다. 위치별 클릭률, 오클릭률, 만족도. UX는 이런 거다. 버튼 위치 하나도 이유가 있다. 우리 서비스의 주요 버튼 위치를 떠올렸다. 일관성이 없다. 어떤 페이지는 오른쪽, 어떤 페이지는 중앙. 왜? 디자이너마다 다르게 만들어서. 가이드라인이 없어서. 통일하자고 제안했다. "디자인 시스템을 만들면 어떨까요?" 반응: "시간이 오래 걸리는데요. 당장 급한 게 아니잖아요." 급하지 않다. 근데 중요하다. 넷플릭스는 이미 다 정리돼 있다. 그래서 빠르다. 일관성이 있다. 우리는? 매번 논쟁한다. "이 버튼 어디에 둘까요?" 메모: "버튼 위치도 전략. 일관성 = 디자인 시스템 = 속도." 프로필 전환이 매끄러운 이유 남편 프로필로 바꿨다. 클릭 한 번. 0.5초. 매끄럽다. 딜레이가 없다. 왜일까? 프로필 데이터가 이미 로드돼 있다. 전환할 때마다 서버에서 가져오는 게 아니라 로컬에 캐싱했을 거다. 이게 당연해 보이지만 어렵다. 우리 서비스는 프로필 전환이 느리다. 3~4초 걸린다. 로딩 스피너가 돈다. 왜? 매번 서버에서 데이터를 가져온다. 캐싱 전략이 없다. 제안했다. "프로필 데이터를 미리 로드하면 어떨까요?" 반응: "보안 문제가 있을 수 있어요. 다른 사람 데이터가 노출될 수 있어요." 맞는 말이다. 근데 넷플릭스는 어떻게 했을까? 조사했다. 암호화된 로컬 캐시. 세션 기반 관리. 보안과 속도 둘 다 잡았다. 기술적으로 가능하다. 근데 우리는 안 한다. 우선순위가 낮아서. "나중에 최적화하죠." 또 나중이다. 메모: "프로필 전환 속도 = 0.5초. 캐싱 전략 필요. 속도가 경험이다." 자막 설정이 기억되는 게 신기하다 드라마를 봤다. 자막을 켰다. 한글 자막. 폰트 크기를 키웠다. 다음 에피소드를 봤다. 자막 설정이 그대로다. 다시 설정 안 해도 된다. 당연한 거 아니냐고? 아니다. 많은 서비스가 이걸 못 한다. 매번 설정을 다시 해야 한다. 우리 서비스의 동영상 플레이어도 그렇다. 자막 켜고, 속도 조절하고, 화질 선택하고. 다음 영상 보면 초기화된다. 유저 피드백이 많다. "왜 매번 설정해야 돼요?" 개발팀 답변: "쿠키에 저장하면 되는데 우선순위가 낮아요." 3년째 우선순위가 낮다. 넷플릭스는 다르다. 설정이 프로필에 저장된다. 디바이스를 바꿔도 유지된다. 이게 UX 디테일이다. 작지만 중요하다. 한 번 설정하면 끝. 유저는 생각 안 한다. 불편함을 못 느낀다. 그게 좋은 UX다. 메모: "설정 기억 = 기본. 안 되면 나쁜 UX. 되면 당연한 UX. 당연함을 만드는 게 우리 일." 언어 선택이 똑똑하다 영화를 봤다. 한국 영화. 자동으로 한글 자막이 꺼져 있다. 외국 영화를 봤다. 자동으로 한글 자막이 켜진다. 어떻게 알았지? 콘텐츠 메타데이터를 본다. 언어 정보가 있다. 유저의 기본 언어 설정과 비교한다. 다르면 자막을 켠다. 간단해 보이지만 생각이 필요하다. "유저가 한국어를 쓴다 = 한국어 콘텐츠는 자막 필요 없다" 이 로직을 구현하려면 메타데이터가 정확해야 한다. 언어 정보가 빠지면 안 된다. 우리 서비스는? 자막이 항상 꺼져 있다. 유저가 직접 켜야 한다. 왜? 콘텐츠 메타데이터에 언어 정보가 없다. 정리가 안 됐다. "나중에 정리하죠." 또. 메모: "자막 자동 설정 = 메타데이터 + 로직. 작은 불편을 없애는 게 디테일." 다운로드 기능이 여행을 바꿨다 오프라인 다운로드. 비행기에서 본다. 지하철에서 본다. 당연한 기능처럼 보인다. 근데 처음 나왔을 때는 혁신이었다. 스트리밍 서비스는 온라인이 기본이다. 근데 넷플릭스는 오프라인도 지원한다. 왜? 사용 맥락을 이해해서. 유저는 집에서만 보지 않는다. 이동 중에 본다. 와이파이가 없는 곳에서 본다. 이 니즈를 파악하고 기능을 만들었다. 저작권 문제, 기술 문제를 다 해결했다. 우리 서비스는? 오프라인 기능 없다. "왜 필요한가요? 요즘 데이터 무제한이잖아요." 맞다. 근데 지하철은? 비행기는? 해외는? 사용
- 07 Dec, 2025
Maze 리포트를 보며 '어? 여기서?'라고 놀란 이유
Maze 리포트를 보며 '어? 여기서?'라고 놀란 이유 오전 10시, Maze 리포트 출근하자마자 Maze 리포트를 열었다. 지난주에 돌린 프로토타입 테스트. 40명 참여. 결제 플로우 개선안이었다. 클릭 히트맵을 봤다. 85%가 '다음' 버튼을 찾았다. 평균 완료 시간 2분 30초. 만족도 4.2점. 나쁘지 않았다. "이 정도면 괜찮은데?" PM한테 공유하려고 슬랙을 열었다. 그런데 뭔가 걸렸다. 지난주 유저 인터뷰 내용이 떠올랐다. 32세 여성, 온라인 쇼핑 자주 한다는 사람. 프로토타입 테스트할 때 말했다. "어? 이거 결제하는 거 맞아요? 좀 이상한데..." 그 사람도 결국 완료했다. Maze 데이터에는 '성공'으로 찍혔을 거다. 근데 그 순간의 망설임. 3초 정도. 화면을 두 번 확인했던 것. 그게 데이터에는 안 보였다.정량 데이터가 말하는 것 Maze 리포트를 다시 봤다. 천천히. 태스크 성공률: 85%40명 중 34명이 완료 평균 완료 시간 2분 30초 오류 클릭 1.2회 평균히트맵 분석:'다음' 버튼 클릭률 92% '취소' 버튼 오인 클릭 8% 스크롤 깊이 평균 78%만족도:4.2/5점 "쉬웠다" 응답 72% "개선 필요" 응답 15%숫자만 보면 괜찮다. 85% 성공이면 업계 평균 이상이다. PM이 보면 "고(Go)" 할 수준. 근데 뭔가 찝찝했다. 15%는 왜 실패했지? 1.2회 오류 클릭은 어디서 나온 거지? Maze는 '어디를' 클릭했는지는 알려준다. '왜' 클릭했는지는 모른다. 커피를 마셨다. 세 번째였다.정성 리서치가 보여준 것 지난주 유저 인터뷰. 5명. 각 1시간씩. 참여자 3번, 32세 여성:프로토타입 완료 시간: 2분 40초 (Maze 데이터 평균과 비슷) 성공 여부: 완료 만족도: 4점근데 인터뷰 녹취록을 다시 들었다. "음... (3초 정지) 이게 결제 버튼인가? 색깔이 좀... 배송지 입력하는 건가?" 결국 클릭했다. 맞는 버튼이었다. Maze에는 '성공'으로 기록됐다. 근데 저 망설임. 3초. 참여자 5번, 28세 남성:완료 시간: 3분 10초 성공 여부: 완료 만족도: 3점녹취록: "여기서 뭘 하라는 거지? (화면 스크롤) 아, 여기 있네. 근데 왜 여기 있어요? 위에 있을 줄 알았는데." 이 사람도 완료했다. 데이터에는 '성공'. 근데 저 당황. "왜 여기 있어요?" 그 질문. 참여자 1번, 41세 여성:완료 시간: 1분 50초 (평균보다 빠름) 성공 여부: 완료 만족도: 5점녹취록: "아, 이런 거 자주 써봐서. 보통 여기 있잖아요. 익숙해요." 이 사람은 순조로웠다. 경험이 많았다. 근데 이게 우리 타겟 유저인가? 41세, 온라인 쇼핑 파워유저. 우리 주 타겟은 20대 후반인데. 정리하면서 느꼈다. Maze 데이터의 '85% 성공'과 인터뷰의 '망설임'은 다른 이야기였다. 불일치의 순간 점심 먹고 데이터를 다시 정리했다. Maze 정량 데이터:85% 성공률 평균 2분 30초 만족도 4.2점 → "괜찮다"유저 인터뷰 정성 데이터:"이게 결제 버튼인가?" "왜 여기 있어요?" "좀 이상한데..." → "뭔가 불편하다"이 간극. 85%는 완료했지만, 과정에서 당황했다. 숫자는 '성공'이지만 경험은 '불편'이었다. Notion에 메모했다: 정량 = What (무엇을 했는가) 정성 = Why (왜 그렇게 했는가)Maze: 85%가 버튼을 '찾았다' 인터뷰: 근데 '망설였다'둘 다 맞다. 근데 다르다.PM한테 슬랙을 보냈다. "Maze 리포트 나왔어요. 근데 인터뷰 내용이랑 같이 봐야 할 것 같아요." 답장이 왔다. "85%면 괜찮은데요? 일단 Go 하죠." 머리가 아팠다.한 유저의 행동 그날 저녁. 퇴근 전에 Maze 로우 데이터를 다시 파고들었다. 40명의 개별 데이터. 클릭 타임스탬프. 마우스 움직임. 하나씩 봤다. 참여자 23번:완료 시간: 4분 50초 (평균보다 2배 이상) 오류 클릭: 5회 만족도: 2점이 사람 데이터를 따라가 봤다.첫 화면 진입: 30초 정지 잘못된 영역 클릭: 3회 뒤로 가기 버튼: 2회 다시 시도 완료완료는 했다. 85%에 포함됐다. 근데 이 과정. 4분 50초. 5회 오류. 만족도 2점. Maze 요약 리포트에는 이렇게 나왔다: "평균 완료 시간: 2분 30초" 참여자 23번의 4분 50초는 평균에 묻혔다. 참여자 1번의 1분 50초가 평균을 낮췄다. 통계적으로는 맞다. 근데 참여자 23번의 경험은? 그 사람한테는 '최악'이었을 거다. 여기서 깨달았다. 평균은 '대표값'이 아니다. '중간값'이다. 통계를 뒤엎는 순간 다음날 아침. 팀 회의. PM이 물었다. "Maze 리포트 봤는데, 85% 성공이면 괜찮은 거 아니에요?" 개발 리드도 거들었다. "만족도도 4.2점이잖아요. 이 정도면 배포해도 될 것 같은데." 나는 노트북을 돌렸다. "이 사람 봐주세요." 참여자 23번 데이터를 보여줬다. 4분 50초. 5회 오류. 만족도 2점. "이 사람도 85%에 포함됐어요. 근데 이 사람 경험은 최악이었어요. 만약 우리 실제 유저가 이렇게 되면?" PM이 말했다. "그래도 소수 아니에요? 대부분은 괜찮았잖아요." 나는 인터뷰 클립을 틀었다. 참여자 3번. "이게 결제 버튼인가?" 그 3초 정지. "이 사람도 완료했어요. 2분 40초. 평균이랑 비슷해요. 근데 이 망설임. 실제 서비스에서는 이탈로 이어질 수 있어요." 회의실이 조용해졌다. 디자이너가 물었다. "그럼 어떻게 해요? 85%도 안 믿어요?" 나는 정리했다. "85%는 '완료'를 측정한 거예요. '경험'을 측정한 게 아니에요. 정량 데이터는 '무엇'을 알려주고, 정성 데이터는 '왜'를 알려줘요. 둘 다 필요해요." PM이 한숨을 쉬었다. "그럼 또 수정해야 해요?" "네. 근데 작은 수정이에요. 버튼 위치하고 색상. 이거만 바꾸면 망설임이 줄어들 거예요." 그렇게 2주가 더 걸렸다. 불일치를 해석하는 법 그 뒤로 Maze 리포트를 보는 방식이 바뀌었다. 1. 평균 말고 분포를 본다 Maze 리포트:평균 완료 시간: 2분 30초내가 보는 것:최소: 1분 50초 최대: 4분 50초 중앙값: 2분 20초 90 퍼센타일: 3분 40초평균은 극값에 영향을 받는다. 중앙값과 분포를 봐야 '진짜' 경험이 보인다. 2. 성공률 말고 과정을 본다 Maze 리포트:성공률: 85%내가 보는 것:오류 클릭이 어디서? 망설임이 어디서? (타임 갭) 뒤로 가기가 왜?'완료'와 '순조로운 완료'는 다르다. 3. 만족도 말고 맥락을 본다 Maze 리포트:만족도: 4.2점내가 보는 것:5점 준 사람: 파워유저, 경험 많음 2점 준 사람: 첫 이용, 당황함평균 4.2점은 '두 그룹의 평균'이다. 우리 타겟은 어느 쪽인가? 4. 정량 데이터에 정성 데이터를 겹친다 이제는 리포트를 이렇게 만든다: [Maze 정량] 85% 성공률, 평균 2분 30초[유저 인터뷰 정성] "이게 결제 버튼인가?" (참여자 3) → 버튼 레이블 모호함"왜 여기 있어요?" (참여자 5) → 레이아웃 기대와 불일치[해석] 완료는 하지만 망설임 존재 → 버튼 위치 + 레이블 수정 필요정량은 '증상'을 알려준다. 정성은 '원인'을 알려준다. 둘이 합쳐져야 '해결책'이 나온다. 9년 차의 깨달음 UX 기획 9년 차. 지금 알게 된 것. 데이터는 거짓말을 안 한다. 근데 전부를 말하지도 않는다. Maze 리포트의 85% 성공률. 거짓말 아니다. 40명 중 34명이 실제로 완료했다. 근데 그 과정의 망설임, 당황, 불편함. 그건 숫자에 안 나온다. 한 유저의 불편이 전체 경험을 대표할 수 있다. 참여자 23번. 4분 50초 걸린 그 사람. 통계적으로는 이상치(outlier)다. 제거해도 된다. 근데 실제 서비스에서 그 사람 같은 유저가 100명이면? 그들은 이탈한다. 리뷰에 "불편하다"고 쓴다. 숫자에는 안 나오지만 비즈니스에는 타격이다. 정량과 정성의 균형 초반에는 정량 데이터만 믿었다. "숫자가 진실이야." 중반에는 정성 리서치에 빠졌다. "유저 목소리를 들어야 해." 지금은 안다. 둘 다 필요하다. 둘 다 불완전하다. 정량 데이터는 '무엇'을 알려준다. 큰 그림. 트렌드. 패턴. 정성 데이터는 '왜'를 알려준다. 맥락. 이유. 감정. '무엇'만 알면 개선 방향을 모른다. '왜'만 알면 규모를 모른다. 둘을 겹쳐야 완전해진다. 이제 하는 것 요즘은 Maze 리포트를 열 때 이렇게 한다.평균값을 본다 (전체 경향) 분포를 본다 (극값과 중앙값) 이상치를 본다 (문제의 신호) 인터뷰 녹취를 겹친다 (이유 파악) 해석을 쓴다 (무엇 + 왜 = 어떻게)그리고 팀한테 공유할 때 이렇게 말한다: "Maze에서는 85%가 성공했어요. 근데 인터뷰에서는 망설임이 있었어요. 둘 다 맞는 얘기예요. 85%는 완료했지만, 과정이 불편했다는 거죠. 개선이 필요해요." PM은 가끔 불평한다. "데이터도 믿고 인터뷰도 믿어야 하면 뭘 믿어요?" 나는 답한다. "둘 다요. 근데 다른 걸 믿는 거예요."정량 데이터는 '무엇'을, 정성 데이터는 '왜'를 말한다. 둘 다 진실이다. 근데 다른 진실이다. UX 기획자의 일은 두 진실을 연결하는 거다. 그래야 '어떻게' 개선할지 보인다.