특별기고

자율주행차 상용화를 위한 데이터 이슈

차두원 소장(차두원 모빌리티연구소)

테슬라의 자율주행을 위한 데이터 수집 현황과 이슈

테슬라는 출시한 차량에 탑재된 8대의 카메라, 레이더, 센서 등을 통해 다양한 데이터를 수집하고 있다는 것은 널리 알려진 사실이다. 테슬라가 수집하는 데이터는 매우 방대하다. 데이터 출처별로 구분하면 고객과 사용 디바이스(성명, 주소, 전화번호, 이메일, 지불 내역 정보), 차량(차대번호, 속도, 주행거리계, 배터리 및 충전 이력, 각종 전자시스템 사용 이력, 소프트웨어 버전, 인포테인먼트 시스템 사용 데이터, 안전벨트 등 안전 데이터, 카메라 이미지, 에어백 정보, 가감속, 보안, 사고 발생 시 비디오 클립, 차량 이동기능(Summon), 차량 퍼포먼스 데이터, 리모트 서비스 이력, 차량 외부 비디오 클립), 개인정보(연락처, 인터넷 검색 이력, 내비게이션 사용 이력, 라디오 채널 사용 이력, 현재 위치, 사용 충전소 위치), 신용정보(은행 라우팅 정보, 사회보장번호, 신용카드 사용 이력 및 한도, 운전면허증, 생년월일, 기타 카드 관련 정보) 등으로 거의 모든 차량과 운전자 정보를 활용한다.

작년 세계 전기차 판매 1위를 달성한 테슬라 출시 차량들의 전체 운행거리는 2021년 1월 1일 기준 약 225억 마일, 부분자율주행시스템인 오토파일럿의 예상 주행거리는 약 33억 마일이다. 이러한 주행거리를 감안하면 테슬라가 수집한 데이터양은 막대한 수준으로 테슬라를 데이터 플랫폼 기업이라고 부르는 이유이기도 하다.

데이터 공유에 대한 고객의 동의하에 데이터를 수집하고 있고 고객이 데이터 공유를 중단할 수 있지만, 테슬라는 공유를 하지 않으면 차량 작동에 영향을 미치거나 소프트웨어 업데이트 혹은 일부 기능 비활성화에 영향을 미칠 수 있다고 언급하는 등 테슬라의 데이터에 대한 욕심이 적지 않다. 테슬라는 위와 같은 운전자와 차량 행동, 주행 주변 데이터들을 활용해 사고 위험 예측과 사고방지, 차량 기능 업데이트와 자율주행 기능 향상에 활용하고 있다고 주장하고 있다.

물론 개인정보 수집 및 활용에 대한 문제는 제기되고 있다. 운전자 지원시스템 등 부분자율주행시스템이 상용화되기 시작하면서 운전자들이 과거와 같이 차량 조작에 신경을 집중하지 않기 때문이다. 이에 완성차 업체들은 운전자가 주행에 집중하고 있는지 모니터링하고, 불안전한 행동을 취할 때 경고를 보내는 운전자 모니터링 시스템의 장착을 확대하고 있다. BMW, 포드, GM 등의 업체에서 적용한 시스템은 적외선 센서나 카메라를 통해 운전자 눈 움직임과 머리 위치를 사용하여 운전자 행동을 모니터링하지만 녹화는 하지 않는다. 하지만 테슬라 모델3와 모델Y 일부 차량 리어뷰 미러 위에 장착된 내부 카메라를 통해 운전자 영상을 녹화해 분석하고 있는 것으로 알려져 컨슈머 리포트(Consumer Report)의 지적을 받기도 했다.

외부영상 수집도 마찬가지다. 테슬라가 인공지능 학습용으로 수집하고 있는 외부 영상데이터의 개인정보 수집 이슈과 보안시설 등의 녹화에 대한 문제도 제기되고 있다. 테슬라는 라이다를 사용하지 않고 카메라만으로 물체의 깊이를 측정해 3차원 형상을 구현하는 의사 라이다(Pseudo-LiDAR) 방식을 채택하고 있지만, 수집된 영상 식별 정확도를 높이기 위해 자체적으로 1000명이 넘는 데이터 어노테이션 스페셜리스트(Data Annotation Specialist) 그룹을 운영하고 있으며, 수집 데이터량이 증가함에 따라 채용을 확대하고 있는 것으로 알려졌다. 데이터 수집뿐만 아니라, 정교한 분석을 통해 학습데이터로 활용하고 있어 데이터 수집을 넘어 정확한 분석을 통한 활용도 제고가 중요하다는 점은 다시 한 번 상기할 필요가 있다.

테슬라는 수집된 데이터를 활용해 2019년 9월부터 보험 사업도 시작했다. 데이터 기반의 개인 맞춤형 설계로 경쟁사보다 20~30% 보험료가 저렴한 것이 특징으로 일론 머스크는 향후 보험 비즈니스가 테슬라 비즈니스의 30~40%의 가치를 차지할 것이라고 주장하기도 했다.

그림 1. 커넥티드카의 활용 가능한 데이터 그림 1. 커넥티드카의 활용 가능한 데이터

테슬라의 사례만 살펴봤지만, 차량 데이터 활용 가치는 자율주행 등 기능이 향상됨에 따라 점차 높아지고 있다. 현재까지 개인정보보호 등에 이슈가 남아 있지만 커넥티드카에 이어 자율주행차가 본격적으로 등장하면 인공지능을 적용해 사용자에게 최적화된 서비스 제공과 차량상태 유지, 자율주행기술 업그레이드에 활용할 수 있는 핵심자원으로 대부분의 관련 기업들이 새로운 성장동력으로 관심을 갖고 투자하는 이유다.

아직은 걸음마인 국내 자율주행차 데이터 공개 현황

2015년부터 매년 2월 캘리포니아 교통당국(DMV)에서는 자율주행 테스트 보고서(California's Autonomous Vehicles Disengagement Reports)를 공개한다. 약 1500대가 시험운행 되고 있는 미국의 자율주행차들 가운데 가장 많은 차량이 테스트를 진행하는 곳으로 유일하게 정형화된 관련 운행 데이터를 확인할 수 있는 보고서다. 자율주행 테스트 프로그램에 참여하는 업체 목록, 업체별 자율주행 자동차대수, 월 단위 차량별 운행거리, 자율주행 중 차량의 고장, 인공지능의 오류 등 만약의 사태에 대비해 탑승하는 세이프티 드라이버(Safety Driver) 개입 횟수 등에 대한 정보를 포함하고 있어 매월 2월이면 전 세계적으로 많은 관심을 받고 있는 이유다.

올해 공개된 2000년 보고서에서 주목을 받은 업체는 웨이모와 크루즈다. 보고서를 제출한 29개 업체 가운데 총 주행거리 100만 킬로미터, 자율주행기능 해제 평균 거리 4만 5천 킬로미터를 넘는 단 두 개의 업체이다. 전체 시험 운행거리는 크루즈가 약 123만 2079 킬로미터, 웨이모가 100만 6142 킬로미터로 크루즈가 약 23만 킬로미터 정도 시험운행 거리가 길다. 3위는 포니닷에이아이로 36만 794 킬로미터, 4위는 죽스로 16만 4034킬로미터, 5위는 88,592킬로미터를 시험운행 한 뉴로로 나머지 기업들과는 커다란 격차를 보이고 있다. 자율주행기능 해제 건수는 웨이모가 27회, 크루즈는 21회로 각각 평균적으로 4만 7911킬로미터, 4만 5632킬로미터 마다 세이프티 드라이버가 자율주행 기능에 개입을 했다.

물론 데이터 신뢰성 등에 대한 문제는 지적되고 있다. 캘리포니아 교통당국(DMV) 공보담당관 마틴 그린스타인(Martin Greenstein)은 더 버지(The Verge)와의 인터뷰에서 “시험운행 허가 업체들은 서로 다른 목표와 비즈니스 모델을 가지고 있어 서로 다른 방식, 위치, 조건에서 실시하고 있으며, 보고서 결과를 가지고 기업 간 기술 능력을 비교해서는 안 된다.”라고 언급하기도 했다. 업체들도 불만은 있다. 웨이모는 2000년 캘리포니아 교통당국 발표 후 ‘세이프티 드라이버 개입’ 지표가 웨이모 드라이버(웨이모 자율주행시스템)의 인사이트를 제공하지 않으며, 막대한 거리의 시뮬레이션과 디트로이트와 애리조나주 피닉스의 주행 결과가 자율주행 기술개발에 반영된다고 트위터를 통해 불만을 표출했다. 크루즈도 2020년 홈페이지를 통해 300대의 전기 자율주행차가 투입되고 있다고 밝혀 다른 도시에서도 주행하고 있음을 알 수 있다. 매년 2월이면 캘리포니아주에서 시험운행하는 자율주행 업체를 평가하는 보고서로 평가받지만, 실제로는 주의 깊게 살펴보고 특정 업체 평가 등을 위해서는 다른 데이터과도 함께 고민해야 할 보고서라는 점을 인식해야 한다.

이러한 문제점을 보완하기 위해 미국도로교통안전국(National Highway Traffic Safety Administration)은 2020년 6월 미국 전역의 자율주행 테스트 현황 데이터 공개를 위한 플랫폼(AV Test Initiative(Automated Vehicle Transparency and Engagement for Safe Testing)을 오픈했다. 현재 캘리포니아주만 데이터를 기업들에게 의무적으로 보고 받아 공개하고 있으나, 자율주행자동차 데이터 투명성과 사회적 수용성을 높이기 위해 공개한 온라인 매핑도구다. 비프(beep), 나브야(NAVYA), 도요타, 뉴로, 웨이모, GM/크루즈, FCA, 코디악 로보틱스, 투심플(TuSimple) 등 자율주행 셔틀, 자동차, 트럭 등을 시험운행하는 기업과 대학들이 참여하고 있다. 지도상에서 특정 지역을 클릭하면 시험운행 지역, 차량 제조업체와 차종과 운영 규모, 도로 타입, 안전 운전자 탑승 여부, 자율주행기업 공급 업체 등 업체 정보와 업체들이 작성 공개한 안전 보고서, 각 주별 자율주행 운행 규칙 및 자율주행차 유형별 운행 대수 등을 확인할 수 있다.

그림 2. 출처: AV Test Initiative 웹사이트 (https://www.nhtsa.gov/automated-vehicles-safety/av-test-initiative-tracking-tool) 그림 2. 출처: AV Test Initiative 웹사이트 (https://www.nhtsa.gov/automated-vehicles-safety/av-test-initiative-tracking-tool)

미국 캘리포니아 주는 매년 자율주행 시험 운행을 실시하는 업체들에게 연 단위 주행 보고서와 사고가 발생했을 경우 10일 이내에 사고 보고서를 제출해야 하는 의무도 부과하고 실시간으로 웹사이트를 통해 관련 데이터를 공개하고 있다. 2014년 최초 델파이 자율주행차 사고 발생 이후 올해 3월 29일까지 295건의 사고 보고를 받았다. 사고 유형, 지역, 시간대, 기후 상황 등의 분석이 가능해 자율주행 사고 유형 분석의 자료로 다수 활용되고 있다.

캘리포니아주의 연간 주행 데이터와 사고 데이터는 기업들이 보고한다는 태생적 한계는 지니고 있다. 하지만 전 세계에서 유일하게 공개하는 자율주행 관련 데이터로 시험운행에 참여하는 기업들의 기술수준을 정확히 파악할 수는 없지만, 해당 데이터만으로도 제한적이지만 기술 수준을 파악함으로써 자율주행기술의 현재와 미래를 가늠할 수는 있다는데 커다란 의미가 있다.

자율주행 시험운행 및 사고 데이터의 필요성

정부는 2020년 10월 자율주행차 데이터 표준화를 위한 협의체를 구축했다. 현재까지 국제 및 국내 표준이 정립되지 않아 미국과 유럽 단체 표준을 참고하고 있는 상황으로 전국 단위 실증사업을 위해서는 데이터 표준화가 필수적이기 때문이다. 자율주행차 운행을 위한 차량과 도로상태, 교통신호 등의 기초 데이터를 위해 자율주행 차량과 차량, 차량과 인프라 등의 기초 데이터 분류와 정의, 이를 조합하여 자율주행 서비스를 제공하기 위한 데이터 형식, 서비스 적용 사례 등에 대한 표준이 주요 대상이다. 현재 국제 및 국가표준이 정립되지 않은 상황에서 해외 단체표준을 참고하고 있어 관련 작업은 시급한 시점이다.

국토교통부에 따르면 지난해 11월 20일 기준 국내 자동차 업계, IT·통신·전자업계, 중소기업·스타트업, 연구(지원)기관, 대학 41개 기관에서 차량 119대가 임시운행 허가를 받았고, 최근 130대를 넘은 것으로 알려졌다. 2018년 12월 기준 시험운행 71만 6000km로 알려져 있는 누적 주행거리는 임시운행면허를 발급하는 국토교통부 및 허가를 받은 업체들이 비공개 처리하고 있다.

자율주행차 인공지능 학습용 데이터는 정부 주도 데이터댐 사업의 일환으로도 개발되어 자율주행차 인공지능 학습 데이터로 활용되고 있으나, 아직까지 주행 및 시험운행 데이터는 공개되지 않는 실정이다. 자율주행차 뿐만 아니라 모든 모빌리티 기업에겐 데이터 공개가 업체 기술 수준에 대한 공개를 의미하기도 해 부담이 있을 수밖에 없다. 하지만 새로운 기술과 서비스가 사회에 논란없이 실현되고 잠재 이용자들의 수용성을 확보하기 위해서는 적절한 수준의 데이터 공개가 필요하고, 보다 건강한 자율주행기술 개발을 위한 데이터 생태계가 구축될 것이다.

Reference
  • - Autonomous Vehicle Collision Report, State of California DMV, Link
  • - 차두원, 자율주행차 사고 가장 큰 원인은 뭘까?, 디지털투데이, 2021. 3. 23.
  • - Keith Barry, Tesla's In-Car Cameras Raise Privacy Concerns, Consumer Report, 2021. 3. 22.
  • - Lex Fridman, Tesla Vehicle Deliveries and Autopilot Mileage Statistics, https://lexfridman.com/tesla-autopilot-miles-and-vehicles
  • - Lyle Adriano,Tesla Insurance could potentially be America's biggest auto insurer, Insurance Business, 2020. 10. 26.

지난 웹진 보기

이전호 더보기