본문 바로가기
카테고리 없음

중복 데이터 3초 만에 찾고 제거하는 방법

by 디저트사커 2025. 12. 13.
반응형

고객 명단을 정리하거나 설문 조사 결과를 취합하다 보면 필연적으로 마주치는 문제가 있습니다. 바로 '중복된 데이터'입니다. 똑같은 이름이나 전화번호가 두 번, 세 번 들어가 있으면 데이터의 신뢰도가 떨어질 뿐만 아니라, 나중에 문자를 보내거나 통계를 낼 때 큰 사고로 이어질 수 있습니다.

"설마 이걸 눈으로 보면서 하나씩 지우고 계신가요?" 수백, 수천 행의 데이터에서 눈으로 중복을 찾는 건 불가능에 가깝습니다. 하지만 구글 스프레드시트(그리고 엑셀) 기능을 활용하면 이 지루한 작업을 단 3초 만에 해결할 수 있습니다. 오늘 포스팅에서는 상황에 따라 골라 쓸 수 있는 중복 데이터 처리의 3가지 핵심 기술(삭제하기, 표시하기, 따로 추출하기)을 완벽하게 정리해 드립니다.

중복 데이터 3초 만에 찾고 제거하는 방법
중복 데이터 3초 만에 찾고 제거하는 방법

1. 가장 빠르고 확실하게: "중복 항목 삭제" 기능

가장 기본적이면서도 강력한 기능입니다. 원본 데이터에서 중복된 행을 아예 '삭제'해버리고, 깔끔한 유니크(Unique) 값만 남기고 싶을 때 사용합니다.

📋 실행 단계 (Step-by-Step)

  1. 중복을 검사할 데이터 범위를 전체 드래그하여 선택합니다.
  2. 상단 메뉴에서 [데이터] > [데이터 정리] > [중복 항목 삭제]를 클릭합니다.
  3. 팝업창이 뜨면 '데이터에 헤더 행이 포함되어 있음'을 체크할지 결정합니다. (제목 줄은 지우면 안 되니까요!)
  4. [중복 항목 삭제] 버튼을 누르면 끝!
💡 [주의사항]
이 기능은 '영구 삭제'입니다. 실행하고 나면 중복된 데이터는 사라집니다. 만약 원본을 보존해야 한다면, 시트를 복사해 두거나 아래에서 소개할 3번 방법을 사용하세요.

2. 지우지는 말고 눈으로만 확인: "조건부 서식" 활용

"지우면 안 되는데, 어디가 중복인지는 알아야 해요." 이런 상황도 많습니다. 이럴 때는 중복된 값에만 빨간색 배경색을 칠해서 시각적으로 강조하는 방법이 있습니다.

🎨 COUNTIF 함수로 중복 색칠하기

조금 어려워 보일 수 있지만, 공식을 그대로 복사해서 쓰시면 됩니다.

  1. 데이터 범위를 선택합니다 (예: A열 전체).
  2. 상단 메뉴에서 [서식] > [조건부 서식]을 클릭합니다.
  3. '형식 규칙'에서 [맞춤 수식]을 선택합니다.
  4. 아래 수식을 입력합니다.
    =COUNTIF(A:A, A1) > 1
  5. 서식 스타일(채우기 색상)을 빨간색이나 노란색으로 지정하고 [완료]를 누릅니다.

원리 설명: "A열 전체에서, A1 셀과 똑같은 내용이 1개보다 많다면(즉, 2개 이상이라면) 색을 칠해라"라는 뜻입니다. 이제 중복된 데이터들이 신호등처럼 눈에 확 들어올 것입니다.


3. 원본은 그대로, 결과만 따로 추출: "UNIQUE 함수"

이것이 바로 고수들의 방법입니다. 원본 데이터는 건드리지 않고, 옆에 새로운 공간에 중복이 제거된 깔끔한 명단을 자동으로 생성하는 방법입니다.

🪄 마법의 함수 =UNIQUE()

빈 셀 아무 곳이나 클릭하고 아래와 같이 입력해 보세요.

수식: =UNIQUE(A2:A)

결과: A열에 있는 데이터 중 중복을 싹 제거한 고유한 값들만 촤라락 나열됩니다. 원본 데이터가 추가되거나 변경되면, 이 UNIQUE 목록도 실시간으로 자동 업데이트됩니다. 보고서를 만들 때 가장 추천하는 방식입니다.



마무리하며: 상황에 맞는 도구를 쓰세요

데이터 정리에는 정답이 없습니다. 상황에 맞춰 가장 효율적인 방법을 선택하는 것이 중요합니다.

  • 일회성 정리: [데이터] > [중복 항목 삭제] (가장 빠름)
  • 눈으로 검토 필요: [조건부 서식] > [COUNTIF 함수] (시각적 확인)
  • 원본 보존 및 자동화: [UNIQUE 함수] (가장 스마트함)

오늘 알려드린 3가지 방법만 기억하신다면, 앞으로 어떤 엉망인 데이터를 만나더라도 당황하지 않고 3초 만에 깔끔하게 정리하실 수 있을 겁니다.

혹시 데이터를 정리한 후에 다른 시트의 값을 불러와야 한다면? 지난 포스팅인 'VLOOKUP 함수 기초: 다른 시트 값 10초 만에 불러오는 법'을 참고해 주세요. 여러분의 퇴근 시간이 더 빨라집니다!

반응형