고유명사 및 주소 영문 번역 프로젝트 – 엑셀 파일 번역

개요

엑셀 파일에 카테고리 별로 정리된 대량의 상호명과 주소를 영문으로 번역하는 프로젝트입니다.

사전 예측

문제의 소지가 될 요소

  • 고유명사 번역
  • 주소의 정확한 번역

고유명사 번역

우선 고유명사의 경우에는 로마자 표기법에 따라 번역합니다. 로마자 표기법은 2000년에 문화관광부에서 고시한 로마자 작성 표기 표준 방식입니다. 따라서 정부 기관 외에 공적인 사용에는 모두 로마자 표기법에 맞춰서 영문으로 표기되어 있습니다.

그러나 2000년 이전에 설립된 기업 등의 영문 명칭은 현재의 로마자 표기법과 상이한 경우가 많습니다. 예를 들면 현재 사용하는 로마자 표기법에서 강남은 Gangnam 이지만 과거에는 Kangnam을 사용한 경우입니다. 이 경우에는 현재의 로마자 표기법에 따라 임의적으로 번역할 수 없어서 실제 사용하는 영문 기업명을 해당의 기업의 웹사이트 또는 사전 등을 찾아서 올바르게 번역했는지 확인하는 절차를 거칩니다.

이 프로젝트의 경우에도 로마자 표기법과 상이한 명칭을 쓰는 곳이 몇 군데 포함되어 있었기 때문에 번역 완료 후에 따로 검색하는 절차를 거쳤습니다.

도로명 주소의 영문화

도로명 주소도 번역을 완료한 후에 검증하는 과정을 진행하였습니다.

다만 주소의 경우, 행정안전부에서 서비스하는 도로명 주소 웹사이트를 통해서 영문명을 빠르게 검색할 수 있었습니다.

그러나 하나 하나 검색하기에는 많은 시간이 소요되어 정부에서 서비스하는 juso.go.kr 웹사이트가 제공하는 api를 사용하기로 하였습니다.

또한, juso.go.kr 에서 제공하는 데이터 파일 전체 정보를 내려받아서 사용하기에는 도로명 주소의 지속적인 변경이 있기 때문에 지속적인 관리를 필요로 했습니다.

따라서 이번 프로젝트에서는 api 인증 키를 요청하고 엑셀에서 vba로 영문주소를 파싱하여 번역 내용과 공식적인 영문 주소를 비교하는 방식을 선택했습니다.

우선 juso.go.kr에서 제공하는 검색 결과 xml 내용은 아래와 같습니다.

<?xml version="1.0" encoding="UTF-8"?>
<results>
  <common>
    <totalCount>1</totalCount>
    <currentPage>1</currentPage>
    <countPerPage>5</countPerPage>
    <errorCode>0</errorCode>
    <errorMessage>정상</errorMessage>
  </common>
  <juso>
    <roadAddr>서울특별시 마포구 성암로 301 (상암동)</roadAddr>
    <roadAddrPart1>서울특별시 마포구 성암로 301</roadAddrPart1>
    <roadAddrPart2> (상암동)</roadAddrPart2>
    <jibunAddr>서울특별시 마포구 상암동 1595 한국지역정보개발원(KLID Tower)</jibunAddr>
    <engAddr>301, Seongam-ro, Mapo-gu, Seoul</engAddr>
    <zipNo>03923</zipNo>
    <admCd>1144012700</admCd>
    <rnMgtSn>114403113012</rnMgtSn>
    <bdMgtSn>1144012700115950000000001</bdMgtSn>
    <detBdNmList>한국지역정보개발원</detBdNmList>
    <bdNm>한국지역정보개발원(KLID Tower)</bdNm>
    <bdKdcd>0</bdKdcd>
    <siNm>서울특별시</siNm>
    <sggNm>마포구</sggNm>
    <emdNm>상암동</emdNm>
    <liNm></liNm>
    <rn>성암로</rn>
    <udrtYn>0</udrtYn>
    <buldMnnm>301</buldMnnm>
    <buldSlno>0</buldSlno>
    <mtYn>0</mtYn>
    <lnbrMnnm>1595</lnbrMnnm>
    <lnbrSlno>0</lnbrSlno>
    <emdNo>03</emdNo>
    <hstryYn>0</hstryYn>
    <relJibun></relJibun>
    <hemdNm>서울특별시 마포구 상암동</hemdNm>
  </juso>
</results>

참고  (https://www.juso.go.kr/addrlink/devAddrLinkRequestUse.do?menu=roadSearch#dataListRoadSearch)

위에서 확인한 것과 같이 영문 주소가 포함된 노드는 <engAddr> 노드입니다.

필요한 노드를 확인했으니, Vba에서 검색하려는 주소의 영문 주소를 파싱을 하기 위해서 CreateObject(“MSXML2.ServerXMLHTTP”)를 생성하고 아래의 URL을 통해서 응답 받을 준비를 합니다.

엑셀에서 검색해야 할 키워드를 searchKeyword 변수에 입력하고 결과를 응답 받기 위해서 아래의 주소로 요청을 보냅니다. 여기에서 confirmKey는 등록한 api 키입니다.

“https://www.juso.go.kr/addrlink/addrLinkApi.do?keyword=”&searchKeyword&”&confirmKey=XXX”

응답 받은 내역과 기존에 번역된 내역에 차이가 있으면 엑셀 파일에 표시해 줍니다.

이 과정을 진행하면서 현재 주소가 변경되었으나, 변경 전 주소로 기재된 경우를 확인했습니다.

예를 들면 2018년에 변경된 인천 미추홀구(구 인천 남구) 같은 경우였습니다.

고객사에서는 업데이트를 원했기 때문에 원문과 영문 두 가지를 모두 현재에 맞도록 수정하고, 확인이 용이하도록 표시하였습니다.

간단한 엑셀 vba 프로그램을 통해서 비교적 빠르게 영문화 작업을 완료할 수 있었습니다.

한 달 이상 소요되었던 이 프로젝트는 성공적으로 종료되었습니다.

 

최근 글

이메일 뉴스 레터 영한 번역–eml 파일

프로젝트 개요 마케팅의 일환으로 기업은 지속적으로 고객에게 뉴스 레터를 발송합니다. 마케팅 자료를 번역하는 과정에서 흔히 볼 수 있는 의뢰 파일은 아니지만 eml 파일을 의뢰 받기도...

인디자인 단축키 만들기 – 커스텀 단축키

프로그램 사용이 익숙해지면 마우스 클릭 보다 단축키가 익숙해집니다. 그리고 반복적인 작업에 단축키를 사용하게 되면 보다 빠르게 작업을 완료할 수 있습니다. 사용자가 자주 쓸 것으로...

IT 서비스 영한 번역 프로젝트 – 영상 번역 포함

프로젝트 개요 외국계 기업의 서비스 자료를 한글로 번역하는 프로젝트입니다. 번역 대상 파일은 PDF 파일과 동영상 파일이었습니다. PDF 파일은 단어수를 확인하여 분량을 산출하였고, 동영상 파일은 전체 러닝...

의료기기 매뉴얼 영한 번역 프로젝트 – idml 파일 번역

개요 이 프로젝트는 외국계 기업의 제품 매뉴얼을 한글로 번역하는 프로젝트입니다. 번역 대상으로 제공되었던 파일은 idml 확장자를 가진 파일*이었고 한국 법인은 해당 파일을 확인하지 못한 상태였습니다. 따라서 견적과...

고유명사 및 주소 영문 번역 프로젝트 – 엑셀 파일 번역

개요 엑셀 파일에 카테고리 별로 정리된 대량의 상호명과 주소를 영문으로 번역하는 프로젝트입니다. 사전 예측 문제의 소지가 될 요소 고유명사 번역 주소의 정확한 번역 고유명사 번역 우선 고유명사의 경우에는 로마자...

관련 글