AI 녹취록

전화 녹취록은 법률 문제부터 정리한 다음 기술 얘기를 해야 한다

iOS 18.1이 2024년 10월 통화녹음을 기본 탑재. 갤럭시·픽셀·VoIP 녹음과 결합해 Atter AI로 98.7% 정확도의 녹취록을 만든다.

전화 통화 녹취록을 다루는 가이드는 대부분 “1단계: 이 앱을 여세요”부터 시작한다. 순서가 틀렸다. 전화 녹음은 기술 문제이기 전에 법률 문제이고, 어느 쪽 법이 적용되는지는 당신과 상대방이 어디에 있는지에 따라 바뀐다. 한국은 「통신비밀보호법」 제3조에 따라 통화 당사자의 일방 동의로 녹음할 수 있는 1자 동의 국가다. 다만 통화 당사자가 아닌 제3자의 비밀 녹음은 같은 법 제3조 제1항 위반으로 형사처벌 대상이다. 미국 연방법(18 U.S.C. § 2511)도 기본은 1자 동의지만 캘리포니아, 플로리다, 일리노이 등 12개 주는 모든 참여자 동의를 요구한다. EU의 GDPR은 대부분의 경우 명시적 동의가 필요하다. 국경을 넘나드는 통화에서는 더 엄격한 쪽의 법이 적용되는 게 원칙이다.

법률 정리가 끝나면, 지난 18개월 동안 기술적 워크플로는 극적으로 단순해졌다. iOS 18.1이 2024년 10월 28일 출시되면서 지원되는 모든 iPhone에 통화 녹음이 기본 탑재됐다 — 2007년 iPhone 출시 이후 17년 만에 처음으로 서드파티 앱 없이 녹음할 수 있게 된 것이다. 한국 발매 갤럭시는 One UI에서 이미 통화 녹음을 기본 제공해왔고, 구글 Pixel은 2019년 Pixel 4부터 지원했다. 대부분의 VoIP 플랫폼(클라우드 PBX, 클로바 AICall, KT 클라우드 PBX, SK텔레콤 비즈콜)도 항상 녹음을 지원해왔다. 어려운 부분은 더 이상 “오디오를 캡처하는 것”이 아니라, “이 낮은 비트레이트의, 종종 좁은 대역폭 녹음을 실제로 쓸 만한 녹취록으로 바꾸는 것”이다. 이 가이드의 주제가 바로 그것이고, Atter AI가 90개 이상의 언어에서 98.7% 정확도의 녹취록을 만들어준다.

음질의 바닥: 8 kHz vs 16 kHz

전화 오디오는 역사적으로 8 kHz / 64 kbps G.711 코덱 — 1970년대 PSTN 교환기에 박힌 규격 — 에 갇혀 있었고, 2026년에도 대부분의 유선전화와 구세대 셀룰러 통신망에서 여전히 동작 중이다. HD 보이스(VoLTE)는 SK텔레콤이 2012년 8월 세계 최초로 상용화했고, KT와 LG U+가 같은 해 따라잡으면서 한국은 가장 일찍 VoLTE를 전면 도입한 나라 중 하나다. 샘플링 주파수는 16 kHz, 코덱은 AMR-WB 또는 Opus. 들어보면 차이가 분명하다: 8 kHz는 4 kHz 이상의 주파수를 잘라내서 사람 목소리의 “밝은” 부분이 거의 사라지므로, 전통 전화가 같은 볼륨의 Zoom 회의보다 “먹먹하게” 들리는 이유가 이것이다.

이건 녹취록 정확도에 직접적인 영향을 준다. 일반적인 음성 인식 시스템은 와이드밴드(16 kHz 이상)에서 학습되므로, 추론 시 8 kHz가 입력되면 정확도가 몇 퍼센트포인트 떨어진다. 특히 고유명사, 전문용어, 사투리에서 손실이 크다. Atter AI는 좁은 대역폭과 넓은 대역폭용 음향 모델을 따로 운영하며 입력 오디오의 샘플링 레이트로 자동 라우팅한다. 오래된 8 kHz 통화도 쓸 만한 결과가 나오지만, iPhone / 갤럭시 / Pixel / VoLTE / VoIP에서 녹음한 16 kHz 통화는 명확히 더 높은 정확도를 보인다.

iPhone과 갤럭시가 자체적으로 녹음한 파일은 보통 이미 16 kHz다. OS가 PSTN 측 다운샘플링 전에 업/다운링크 혼합을 캡처하기 때문이다. VoIP 플랫폼(클라우드 PBX, RingCentral, Zoom Phone)에서 내보낸 파일은 내보내기 설정에 따라 다른데, 대부분 기본값이 16 kHz .mp3 또는 .wav지만 일부 레거시 테넌트는 여전히 8 kHz다.

방법 1: iPhone 기본 통화 녹음 (iOS 18.1 이상)

iOS 18.1은 2024년 10월 28일 출시됐고, 18.1 이상을 실행하는 모든 iPhone(iPhone XS 이후 기기)에서 사용할 수 있다. 작동 방식:

  1. 통화 중, 통화 화면 왼쪽 상단의 녹음 버튼을 탭한다.
  2. 상대방은 음성 안내를 듣는다: “이 통화는 녹음됩니다.” Apple이 의도적으로 만든 동의 UX로, 버그가 아니다.
  3. 통화가 끝나면, 녹음은 메모 앱(음성 메모가 아님)에 자동 생성된 녹취록과 AI 요약과 함께 첨부로 저장된다.
  4. 메모의 녹음 첨부를 길게 누르고 → 공유 → 파일 앱에 저장, Mac에 AirDrop, 또는 임의의 앱으로 전송.

Apple 내장 녹취록보다 높은 품질이 필요하다면 오디오를 Atter AI로 내보내라. Apple의 온디바이스 녹취록은 영어 중심이며, 클라우드 전용 서비스보다 작은 모델을 사용하므로, 한국어 통화에서 전문용어, 사투리, 코드 스위칭이 있으면 정확도 차이가 상당히 크다. iPhone 오디오의 전반적인 워크플로는 iPhone 음성 메모 녹취록에서 다뤘다.

방법 2: 갤럭시 + Pixel + 기타 안드로이드

한국 발매 갤럭시는 One UI 통화 앱에 통화 녹음이 기본 탑재되어 있다(미국 발매 같은 모델에서는 법적 이슈로 비활성화됨). 사용 방법:

  • 통화 중 화면 하단의 “녹음” 버튼을 한 번 탭하면 시작된다. 상대방은 한국어 음성 안내를 듣는다.
  • 녹음 파일은 본체 저장소 Call/ 또는 내 파일 → 통화 녹음 폴더에 .m4a 또는 .amr 형식으로 저장된다.
  • 파일 관리자에서 파일을 찾아 Atter AI에 업로드한다.

구글 Pixel은 2019년 Pixel 4부터 통화 녹음을 지원한다 — 주요 플랫폼 중 가장 먼저 네이티브 통화 녹음을 구현한 곳으로, iPhone보다 5년 빨랐다. 녹음은 Recorder 앱에 저장되고 검색 가능한 온디바이스 녹취록이 함께 생성된다.

Pixel의 온디바이스 녹취록은 영어 전용이고, 구글의 좀 오래된 세대 온디바이스 음성 모델을 쓴다. 메모 검색에는 충분하지만 프로덕션 녹취록에는 부족하다. 한국어 통화나 문서로 공유할 녹음은 .m4a 파일을 내보내 Atter AI에서 처리하라.

샤오미, OPPO, vivo 등 다른 안드로이드 제조사도 통화 녹음을 지원하지만 시장별로 다르고, Android 11 이후 구글의 Accessibility API 제한으로 일부 모델에서는 셀룰러 통화 녹음이 제대로 작동하지 않는다.

방법 3: VoIP / 클라우드 PBX 내보내기

통화가 RingCentral, Zoom Phone, Microsoft Teams Phone, Google Voice(Workspace 유료 등급), 또는 한국 클라우드 PBX(클로바 AICall, KT 클라우드 PBX, SK텔레콤 비즈콜, 라온피플 콜링)에서 이루어졌다면, 플랫폼은 거의 확실히 테넌트 정책에 따라 통화를 자동으로 녹음했다. 녹음은 플랫폼의 통화 기록에 저장되며 .mp3 또는 .wav로 내보낼 수 있다.

표준 내보내기 워크플로(플랫폼마다 약간 다름):

  1. 플랫폼 관리 포털 또는 개인 통화 기록 보기를 연다.
  2. 날짜, 내선, 참여자별로 필터링한다.
  3. 통화 선택 → 녹음 다운로드(또는 일괄 작업용 내보내기).
  4. Atter AI 열기 → 업로드 → 다운로드한 파일을 끌어다 놓는다.

대규모 콜센터와 영업팀에서는 여러 VoIP 플랫폼이 완료된 통화 녹음을 대상 URL로 푸시하는 웹훅 또는 API 엔드포인트를 제공한다. 이 웹훅을 Atter AI 워크스페이스의 인바운드 엔드포인트로 향하게 하는 것이 모든 통화를 자동으로 녹취하는 가장 깔끔한 방법이다. 일반적인 RingCentral 엔터프라이즈 테넌트는 상담사당 월 500~2,000개의 녹음을 생성하므로 수동 내보내기는 확장되지 않는다.

방법 4: 서드파티 녹음 앱

양쪽 모두 통화 녹음이 가능한 스마트폰을 사용하지 않을 때 전용 앱이 필요하다. 2026년의 주요 선수들:

  • TapeACall(iOS, Android) — 500만+ 다운로드, 월 $9.99 또는 연 $59.99. 3자 통화 메커니즘으로 녹음 브리지를 통해 양쪽 모두 캡처. 16 kHz .mp3 출력.
  • Rev Call Recorder(iOS) — 무료 녹음, 녹취록은 분당 $0.25 과금. TapeACall과 같은 3자 통화 방식.
  • 녹음 어플리케이션 ACR(Android) — Android 11 이상에서는 구글의 Accessibility API 제한으로 대부분의 기기에서 셀룰러 녹음이 끊겼다.
  • 카카오톡 보이스톡, 라인 통화 — 약관에서 제3자 녹음 금지, 종단간 암호화로 기술적으로도 차단. 본체 마이크로 스피커폰 캡처만 가능하고, 상대방 음량은 약 6 dB 손실된다.

“스피커폰 + 두 번째 기기로 음성 메모 녹음” 꼼수는 2026년에도 여전히 유효하고 일회성 용도에는 음질이 충분하다. Atter AI의 화자 분리는 마이크가 직접 잡은 본인의 목소리와 스피커가 재생한 원격 목소리의 음향 특성이 크게 다르므로 둘을 구분할 수 있다.

방법 5: 전화 회의 브리지와 옛 아카이브

전통적인 전화 회의 브리지(KT 800 다이얼인 회의, 해외의 Free Conference Call, GoToMeeting Audio, Zoom Phone 오디오)에서 내보낸 녹음은 보통 모든 참가자가 한 트랙에 섞인 모노 .mp3 또는 .wav다. 여기서는 녹취록 자체보다 화자 분리가 더 큰 과제다: 6명이 단일 브리지 채널에 있을 때 Atter AI는 메타데이터 없이 오디오 신호만으로 화자를 분리해야 한다.

Atter AI의 화자 분리는 모노 채널에서 최대 10명까지 안정적으로 처리한다. 12명 이상의 대규모 회의 브리지(이사회 통화, 전사 미팅)에서는 분리 정확도가 떨어지므로, 회의 명단을 기반으로 사후 일괄 리네임하는 Speaker 1Speaker N 플레이스홀더가 붙은 그대로 녹취록을 출력하는 게 더 실용적이다.

오래된 콜센터 컴플라이언스 아카이브는 종종 .au, .gsm, 8-bit .wav 등의 레거시 형식으로 도착한다. Atter AI는 셋 다 받아들이고 음성 인식 전에 녹취록 친화적 중간 형식으로 트랜스코딩한다. 8 kHz .gsm(구식 모바일 브리지 콜센터에서 사용)의 정확도 바닥은 와이드밴드보다 의미 있게 낮지만, 클린한 녹음에서는 여전히 92~95% 범위다.

통신비밀보호법과 개인정보보호법: 한국의 현실

법률 부분은 대부분의 가이드가 건너뛰는 부분이다. 한국에서는:

  • 개인 간 통화: 통화 당사자의 일방 녹음은 「통신비밀보호법」 위반이 아니다. 다만 무단 공개는 별도로 명예훼손이나 사생활 침해 소송 대상이 될 수 있다.
  • 상업적 녹음(고객센터, 텔레마케팅, 금융기관 컴플라이언스 녹음): 「개인정보보호법」 제15조 및 제22조에 따른 동의가 필요하고, 통화 시작 시 표준 고지(“더 나은 서비스 제공을 위해 본 통화는 녹음됩니다”)를 재생한 뒤 통화 계속을 묵시적 동의로 해석하는 운영이 일반적이다.
  • 금융투자업 의무 녹음: 「자본시장법」과 금감원 규정에 따라 증권사·은행의 투자권유 통화는 녹음·보관 의무가 있다 — 합법이 아니라 법정 의무다.
  • 국경 간 통화: 상대가 EU/영국에 있으면 GDPR에 따라 명시적 동의가 필요하고, 캘리포니아·일리노이 등 미국 양당사자 동의 주에 있으면 그 주법을 따른다.
  • 카카오톡 보이스톡 / 라인: 약관 금지 + 기술적 E2E 암호화로 차단.

이상은 법률 자문이 아니다. 노동 분쟁, 계약 소송, 행정 처분 등 정식 절차에서 증거로 쓸 녹음은 사전에 변호사에게 해당 관할 법원의 채택 가능성을 확인하는 것이 좋다.

iPhone / 갤럭시 / Pixel 기본 녹취록 vs Atter AI

기능iPhone (iOS 18.1)갤럭시 통화녹음Pixel RecorderAtter AI
네이티브 통화 녹음지원(18.1+)지원(한국 모델)지원(Pixel 4+)N/A(녹취록 계층)
녹취록 언어영어 중심한국어+영어영어 전용90+ 언어
깨끗한 통화 음성 정확도약 92-94%약 90-93%약 92-94%98.7%
화자 분리2명 기본보통 없음2명 기본최대 10명
녹음 간 검색없음단일 녹음 내단일 녹음 내아카이브 전체 전문 검색
내보내기 형식TXTTXTTXTPDF, DOCX, TXT, SRT, VTT, JSON
길이 제한없음없음없음없음
비용기기 포함기기 포함기기 포함$129.99 평생 / $49.99/년 / $6.99/주 + 3일 무료 평가판

다른 오디오 소스의 처리 흐름은 온라인 오디오 파일 녹취록과 신호 특성이 약간 다른 Zoom 회의 녹취록을 참조하라.

전화 통화 녹취록 자주 묻는 질문

내가 내 통화를 녹음하고 녹취록을 만드는 게 합법인가요?

관할 구역에 따라 다릅니다. 한국에서는 통화 당사자의 일방 녹음은 「통신비밀보호법」 위반이 아닙니다. 다만 무단 공개는 명예훼손 또는 사생활 침해가 될 수 있습니다. 상업적 녹음은 통화 시작 시 고지가 필요합니다. 국경 간 통화는 더 엄격한 쪽 법을 따릅니다. 중요한 사안은 사전에 변호사 자문을 받으세요.

Atter AI는 전통적인 8 kHz 전화 음질에서 얼마나 정확한가요?

Atter AI의 좁은 대역폭 튜닝 음향 모델은 화자 사투리와 주제에 따라 깨끗한 8 kHz 음성에서 92~95% 정확도를 달성합니다. 현대의 16 kHz 와이드밴드 음성(VoLTE, VoIP, iPhone 또는 갤럭시에서 녹음)에서는 98.7%에 도달 — Zoom이나 대면 회의와 같은 수치입니다.

참가자 8명의 전화 회의 녹음을 녹취록으로 만들 수 있나요?

가능합니다. Atter AI의 화자 분리는 모노 채널에서 최대 10명의 화자를 처리합니다. 더 큰 규모(이사회 통화, 전사 미팅)에서는 분리 정확도가 떨어지므로, 회의 명단을 기준으로 사후 리네임하는 플레이스홀더 화자 라벨이 있는 그대로 녹취록에 의존하는 것이 좋습니다.

Atter AI는 TapeACall, Rev Call Recorder, 갤럭시 통화녹음 파일과 호환되나요?

네. 주요 통화 녹음 앱은 모두 표준 형식(.mp3, .m4a, .amr, .wav)으로 내보냅니다. Atter AI에 직접 업로드 — 수동 변환은 필요 없습니다. Atter AI는 모든 일반 오디오 형식을 받아들이고 필요에 따라 내부적으로 재인코딩합니다.

Apple의 내장 녹취록은 한국어 통화에 작동하나요?

iOS 18.1+의 온디바이스 녹취록은 영어 중심이며 주요 언어 몇 개에 제한적으로 지원됩니다. 진정한 한국어 통화 — 한영 혼용, 의료/금융/법률 전문용어, 사투리(경상, 전라, 제주) — 의 경우 오디오 파일을 Atter AI로 내보내세요. 90개 이상의 언어를 완전한 화자 분리와 함께 지원합니다.

몇 년 전 8-bit .wav 형식으로 녹음한 전화 통화를 녹취록으로 만들 수 있나요?

가능합니다. Atter AI는 옛 콜센터 아카이브에서 흔한 .au, .gsm, 8-bit .wav 및 기타 레거시 형식을 받아들입니다. 시스템은 음성 인식 실행 전에 녹취록 친화적 중간 형식으로 트랜스코딩합니다. 정확도는 와이드밴드 녹음보다 낮지만 깨끗한 음성에서는 여전히 90% 후반대입니다.

양당사자 동의 주에서 두 번째 기기의 음성 메모를 통해 스피커폰으로 통화를 녹음하는 게 합법인가요?

녹음 메커니즘은 법적 요건을 바꾸지 않습니다 — 주가 모든 참여자 동의를 요구한다면, 내장 기능, 서드파티 앱, 두 번째 기기의 음성 메모 어느 것을 쓰든 녹음 시작 전에 동의를 받아야 합니다. iPhone과 Pixel이 재생하는 음성 안내 동의 UX는 음성 메모 캡처가 자동으로 하지 않는 일을 하고 있습니다.

1년치 콜센터 녹음을 일괄 녹취록으로 만들려면?

Atter AI의 폴더 일괄 업로드 또는 API를 사용합니다. 대부분의 통화 플랫폼(RingCentral, Zoom Phone, 클로바 AICall, KT 클라우드 PBX, SK텔레콤 비즈콜)은 Atter AI 워크스페이스 인제스션과 호환되는 일괄 내보내기 또는 웹훅 전달 중 하나를 제공합니다. 상담사당 월 1,000시간 이상의 녹음을 처리하는 일반적인 엔터프라이즈 콜센터는 수동 업로드보다 API 통합이 유리합니다.