AI NODAJI는
AI에 대한 자유로운 의견과 질문, 그리고 깊은 인사이트까지 교류하실 수 있는 AI 사업개발 커뮤니티입니다. AI NODAJI 토크쇼는 매 달 마지막 주 목요일에 열리는 온오프라인 행사입니다. 토크쇼에서는 AI와 관련한 자유로운 토론, 관련 업계 분들을 모시고 함께 이야기를 나누고, 창업 과정, 궁금했던 이야기 등을 나누고자 합니다.
AI 커뮤니티 분들은 모두 노다지를 찾는 ‘광부’로 불립니다. 오늘의 광부는 CAR 테크 스타트업 오토피디아의 COO 조재영 님입니다.
AI 도입이 막막하고 인공지능을 어디에 어떻게 도입시킬지, 또 어느 정도까지 활용할 수 있을지 확신이 서지 않으시다면. AI에 대한 전문성이나 전략이 부족해 실행하지 못하고 검토만 진행 중이시라면 AI 노다지에서 실마리를 찾아보세요.
같은 고민을 하고 있는 사람들을 만나고 싶다면?
제 4차 산업혁명 시대가 도래하며 높아지는 인공지능의 중요성
많은 곳에서 비용 절감, 업무의 자동화 등을 위해 인공지능을 적극적으로 도입하고 있습니다. 하지만 중요성을 알면서도 도입을 하지 못하는 데는 다양한 이유가 있습니다.
2018년부터 312개의 데이터 프로젝트를 진행하면서 약 1억 3천만 건의 데이터를 쌓아온 셀렉트스타의 두 대표님을 모시고 인공지능이 다양한 산업 군에서 어떻게 사용되고 있는지 인사이트를 나누고 네트워킹하는 시간이었습니다.
*이 글은 AI NODAJI 토크쇼 8월 방송을 요약한 내용입니다. 더 많은 이야기를 듣고 싶으시다면 유튜브 라이브 녹화본에서 확인해주세요.
차량정비 사업 전문가와 AI 전문가의 만남
민영: 차량 정비 사업 전문가와 AI 전문가의 만남. 현재 오토피디아의 대표님과 만나신 뒤 서비스를 어떻게 풀어나갈지 문제에 대한 접근 과정이 궁금합니다.
재영: 솔직히 처음에는 AI가 서비스의 본질은 아니었습니다. 닥터차가 직면한 서비스의 본질은 유저들이 겪던 문제, 즉 내 차의 문제를 잘 해결해 줄 수 있는 방법과 어느 업체에 가면 만족할 수 있는 서비스를 받을 수 있는지였습니다. 그래서 차량 정비 시장에서 소비자들이 느끼는 페인 포인트가 무엇일까에 대해 집중했습니다.
그 결과 정보의 격차, 비대칭이 가장 큰 원인이라고 생각했고, 어떻게 하면 이 정보의 격차를 줄일 수 있을까에 대해 고민했을 때 그 당시 저희가 가장 좋았다고 생각한 솔루션은 차를 잘 아는 전문가가 일대일로 컨설팅 혹은 상담을 해줌으로써 소비자가 적절한 좋은 정비소를 찾아갈 수 있도록 가이드를 해주는 것이 필요하는 결론을 내렸습니다.
닥터차 서비스 이미지 출처: https://doctor-cha.com/service
AI 도입을 어떤 부분에 할지 판단을 하는 기준은?
재영: 가장 심플하게는 AI 자동화 툴을 생각합니다. 가능하다면 간단하게 휴리스틱(heuristic)한 (AI를 도입하지 않더라도 단순하게 알고리즘 형식으로 자동화할 수 있는) 규칙을 기반으로 룰을 코딩해서 이것을 가지고 자동으로 문제를 해결하는 것이 베스트일 것 같습니다. 하지만 그렇지 못한 경우가 많고 ‘이 프로세스는 서비스 플로우 중 이 단계는 시간과 노력이 엄청 많이 들어간다.’ 하는 단계를 먼저 찾고 그 단계에서 이러한 부분은 우리가 쓸 수 있는 기술 혹은 시중에 오픈되어 있는 기술을 활용하면 충분히 적용시켜 현재 ‘이 단계에 투입되고 있는 돈과 시간을 줄일 수 있겠다.’ 라고 판단이 될 때 AI 도입을 생각합니다.
AI 도입을 위해 무엇을 준비해야 할까?
재영: 문제 인지와 정의가 필요합니다. 회사, 서비스에서 가장 시간과 비용이 많이 드는 단계를 찾는 것. 즉, 인지단계가 선행되어야 하는데요. 인지가 되고 나서는 바로 데이터셋을 모으기 보다는 ‘어떤’ 데이터셋을 모으는지가 중요합니다. 어떤 데이터셋을 모을 것인가를 결정하기 위해 우리의 비즈니스가 가진 문제를 어떤 방식으로 풀 것인가를 잘 정의하는 것이 핵심입니다.
저희의 경험 중 타이어 AI 개발을 예로 들자면, 주어진 타이어 사진이 있을 때 앞으로 사용 가능한 타이어의 두께가 몇 mm가 남았는지 ‘값’을 예측하는 문제로 처음에 정의를 했습니다. 처음에는 해당 값을 예측하고 ‘교체가 필요하다’, ‘필요하지 않다’ 이렇게 분류 모델로 정의를 했었는데 이러한 정의 아래에서는 고객들이 ‘왜 교체를 해야 하는데?’, ‘왜 교체를 안 해도 되는데?’에 대한 궁금증들이 생겼고 이것에 대한 설명이 필요함을 느꼈습니다.
그래서 애매하게 돌려 말하지 말고 ‘당신은 3mm보다 타이어가 조금 남았기 때문에 교체가 필요하다’는 식으로 그 값이 3mm보다 조금 남으면 ‘교체해야 한다’, 그 이상이면 ‘교체하지 않아도 된다’ 라는 문제로 바꿨고 고객들에게 더욱 설득력을 갖춘 AI를 만들 수 있었습니다.
민영: 흔히 비유를 하자면 타이어 교체 시 ‘눈탱이’ 맞는다고 하잖아요. 특히 타이어 교체에 대해서 주관적으로 타이어를 교체해야 한다는 말보다 객관적인 수치로 치환을 시킨 데이터를 쌓아왔다는 말씀이시군요.
재영: 문제 정의가 왜 중요한지 첨언을 하자면, 저희가 만약에 처음 분류 모델로 타이어 사진에 대해 전문가 분들에게 교체가 필요한지, 필요하지 않은지 양쪽으로 분류하는 데이터를 몇 천만 원을 들여 데이터셋을 준비했다고 해볼게요. 데이터셋을 준비하고 나서 ‘어? 좀 더 정확하게 몇 mm로 바꿔야겠는데’ 라고 생각이 바뀌는 경우 처음부터 데이터를 다시 모아야 합니다. 이렇듯 문제 정의를 처음에 잘못하고 데이터셋을 모으기 시작하면 돈을 날려야 합니다. (슬픈 미소)
데이터 수집에 대해 경험이 없는 기업들에서는 AI 도입 단계에서 어떻게 해야할까?
재영: 문제 정의를 잘 하고 싶은데, 어떻게 해야 문제 정의를 잘 할 수 있냐는 질문 같아요. ‘가장 진부한 답변은 AI 전문가와 상의하십시오.’ 혹은 ‘AI 전문가와 연결시켜줄 수 있는 셀렉트스타와 상의하십시오.’ 이렇게 될 수도 있을 것 같은데… (웃음) 좀 더 기술에 관심을 가지고 계신 최대한 비슷한 사례를 먼저 찾아보는 것을 권장 드리고 싶어요. 예를 들면 개발자들이 많이 쓰는 깃허브 (https://github.com/) 라는 사이트에는 검색하면 다양한 정보들을 찾아볼 수 있습니다.
‘컴퓨터 비전’을 검색 하면 이미지를 검색해서 할 수 있는 기술 혹은 사례, 프로젝트를 몇 백 개씩 모아둔 사이트들이 이미 있어요. 이렇게 레퍼런스를 찾다 보면 ‘이런 문제는 이렇게 정의를 해서 이렇게 풀면 되는구나’ 라는 사례집을 모을 수 있습니다. 다양한 사례들을 먼저 참고하시면 얼마든지 나의 문제와 비슷한 문제를 찾을 수도 있고 그렇지 않더라도 보다 보면 내 문제는 어떤 문제로 볼 수 있을까로 생각하는 힘이 길러지지 않을까 싶습니다.
그다음 문제 정의가 된 후 데이터셋을 모으기 전에는 그래서 ‘우리가 데이터셋을 모으고 나면 AI의 성능이 충분히 잘 나와줄까?’라는 것이 대부분 관계자분들의 고민일 것이라 생각하고요. ‘어떻게 하면 우리가 데이터셋을 모으기 전부터 AI를 잘 만들 수 있을까?’ 라고 판단하는 기준은 단순하지만 AI 개발자에게 먼저 시켜봅니다.
민영: 시켜본다는 것이?
재영: 저 자신에게 타이어 사진을 보여주고 제가 그 타이어가 교체가 필요한지 아닌지를 데이터를 많이 보다 보면…
민영: 아 인간지능!
재영: 네 인간지능. 학습을 시켜봅니다. 100개의 타이어 사진 중 70개의 교체 판단 정답을 본 후 나머지 30개의 정답을 맞혀보는 식으로 이것이 잘 이루어지는지 먼저 판단을 합니다. 잘 모르는 비전문가에게 6시간 정도 감금시켜(웃음) 학습을 시킨 후 모의고사를 풀게 했을 때 좀 한다 하면 어느 정도는 원하는 만큼 나오겠다고 판단합니다.