AI 에이전트는 실제 업무에서 어떤 방식으로 사람의 일을 바꾸고 있을까요? 단순히 답변을 더 잘하는 수준을 넘어, 업무의 구조 자체를 바꾸고 있을까요? 그리고 그 변화는 생산성 향상에 그치지 않고, 직무와 팀의 경계까지 흔들 수 있을까요?

퍼플렉시티가 하버드 비즈니스 스쿨 연구진과 함께 공개한 <How AI Agents Reshape Knowledge Work>는 이 질문에 대한 답을 찾아갑니다. 연구진은 퍼플렉시티의 기존 검색형 제품인 Search와 에이전트형 제품인 Computer의 실제 사용 데이터를 비교해, AI 에이전트가 지식노동의 성격을 어떻게 바꾸는지 분석하는데요. 그들은 과연 어떤 결론에 도달했을까요?

Search는 설명하고, Computer는 실행한다

결과를 제대로 이해하기 위해서는 먼저, 연구진이 비교한 두 제품의 차이를 알아야겠지요?

Perplexity Search는 우리가 익숙하게 알고 있는 검색 및 답변형 AI에 가깝습니다. 사용자가 질문하면 AI는 관련 정보를 찾고, 요약하고, 출처가 있는 답변을 제공하지요. 하지만 그다음 단계는 여전히 사용자의 몫입니다. 사용자는 답변을 읽고, 필요한 파일을 열고, 문서를 만들고, 코드를 실행하고, 결과물을 검토해야 합니다.

Perplexity Computer. 출처: 퍼플렉시티

반면 Perplexity Computer는 에이전트형 제품입니다. 사용자가 원하는 결과를 지정하면, 시스템이 스스로 계획을 세우고, 여러 도구를 사용하며, 검색·브라우징·코딩·파일 편집·검증 같은 중간 단계를 수행합니다. 필요하면 사용자에게 추가 입력이나 승인을 요청하고, 최종적으로 완성된 산출물을 돌려주는 구조이지요. Search는 '어떻게 하면 되는지'를 알려준다면 Computer는 '그 일을 실제로 해보는' 쪽에 가깝습니다.

1. AI가 더 오래, 더 많이, 더 자율적으로 일한다

AI 에이전트가 얼마나 스스로 일을 처리하는지를 보여주는 가장 직관적인 지표는 '사용자가 요청한 뒤 시스템이 얼마나 오래 스스로 실행되는가'입니다. Search는 보통 몇 초 안에 답변을 주는 반면, Computer는 몇 분, 때로는 훨씬 더 긴 시간 동안 작업을 이어갑니다. 검색하고, 웹을 탐색하고, 문서를 작성하고, 코드를 실행하고, 중간 결과를 점검하는 식이지요.

연구진은 거의 동일한 초기 요청을 가진 Search 세션과 Computer 세션 1만 쌍을 비교했는데요. 그 결과 Computer는 세션당 평균 26분 동안 자율적으로 작업을 수행한 반면, Search는 평균 33초에 그쳤습니다. 평균 기준으로는 약 48배 차이입니다. 중앙값으로 봐도 Computer는 9분, Search는 14초로 약 40배 차이가 났습니다.

Search와 Computer의 자율 실행 시간(machine execution time) 비교. 출처: 퍼플렉시티

이러한 수치는 AI 에이전트의 본질을 잘 보여줍니다. 에이전트의 가치는 단순히 '더 좋은 답변'이 아니라, 한 번의 사용자 요청 뒤에 더 긴 실행 체인을 만들 수 있다는 데 있습니다. 기존 챗봇은 한 번 답하고 멈추고, 사용자가 다시 지시하면 그때 다음 단계를 수행합니다. 반면 에이전트는 하나의 목표를 받아 여러 중간 단계를 스스로 이어가지요.

Search를 사용할 때 사용자는 짧은 주기로 묻고, 읽고, 직접 실행하고, 다시 묻습니다. 반면 Computer를 사용할 때 사용자는 처음에 목표를 더 명확히 주고, 이후에는 결과물을 검토하거나 확장 요청을 하는 쪽으로 이동하는데요. 흥미로운 점은 더 오래 실행된다고 해서 사용자가 더 많이 포기하지는 않았다는 점입니다. 연구에 따르면 사용자 중단 이벤트는 Computer와 Search에서 큰 차이가 없었습니다. 다만 Computer는 승인이나 추가 입력이 필요할 때 사용자에게 멈춰서 묻는 경우가 더 많았는데요. 이는 에이전트가 완전히 무인으로 굴러가는 시스템이라기보다, 중간 체크포인트를 가진 자율 실행 시스템에 가깝다고 해석할 수 있습니다.

2. 실행 비용이 사람의 시간에서 기계 연산으로 이동한다

이번 연구에서 가장 눈에 띄는 수치는 시간과 비용 절감인데요. 연구진은 같은 작업을 두 가지 방식으로 비교했습니다.

Search + Human
Search가 검색과 요약을 제공하고, 사람은 그 답변을 바탕으로 직접 나머지를 실행
Computer + Human
Computer가 워크플로의 상당 부분을 수행하고, 사람은 목표를 설정하고 결과를 검토

물론 여기에는 중요한 문제가 있습니다. 바로 Search를 사용한 사람이 실제로 같은 작업을 수동으로 했다면 얼마나 걸렸을지 직접 관찰할 수 없다는 점이지요. 그래서 연구진은 세 가지 방식으로 시간을 추정했습니다.

Computer의 도구 호출을 정보 검색에 해당하는 Search 작업과 실제 실행에 해당하는 Do 작업으로 나누고, Do 작업을 숙련된 사람이 수행했다면 걸렸을 시간을 추정
LLM을 사용해 해당 요청을 숙련된 전문가가 수동으로 처리할 경우의 소요 시간을 추정
실제 Computer 사용자 25명을 인터뷰해, Computer 도입 이전에는 같은 작업을 어떻게 수행했고 얼마나 걸렸는지 질문

도구 기반 추정 결과, Search + Human 방식의 평균 작업 시간은 269분으로, Computer + Human 방식은 36분으로 계산됐습니다. 약 87%의 시간 절감이지요!

이를 비용으로 환산하면 차이는 더 커집니다. 연구진은 미국 노동통계국의 직무별 평균 임금 데이터를 사용해 사람의 노동비용과 모델 실행 비용을 함께 계산했는데요. 그 결과 Computer + Human 방식은 평균적으로 약 94%의 비용 절감을 보였습니다. 특히 프로그래밍 영역에서 효과가 크게 나타났는데요. Search + Human 방식은 596분, Computer + Human 방식은 48분으로 추정됐고, 이는 92%의 시간 절감과 96%의 비용 절감으로 이어졌습니다.

가장 빠른 AI 뉴스

가장 빠른 AI 뉴스 구독하기

3. 사용자는 더 넓은 업무를 시도한다

그렇다면 업무의 범위에는 어떤 변화가 있을까요?

연구진은 Computer 사용자가 자기 주 직업군 밖의 업무를 더 자주 수행하는지 분석했습니다. 그 결과 Computer 사용자는 자기 직업군 바깥의 업무를 59% 수행한 반면, Search에서는 그 비율이 50%였습니다. 이는 단순한 호기심 검색이 늘었다는 의미가 아닙니다. 연구에 따르면 Search의 직업군 밖 쿼리는 디지털 기술 영역에 상대적으로 집중되어 있었지만, Computer에서는 마케팅, 경영, 금융 서비스 등 더 다양한 실행 영역으로 퍼졌습니다.

Search와 Computer 사용 시 직업군 간 업무 이동 흐름 비교. 출처: 퍼플렉시티

Search는 사용자가 모르는 것을 알아보게 해주고 Computer는 사용자가 원래 전문가에게 맡겨야 했던 일을 직접 시도하게 만듭니다. 예를 들어 비개발자가 간단한 웹페이지를 만들거나, 마케터가 데이터 시각화를 수행하거나, 창업자가 투자자용 문서를 직접 정리하는 식이지요. 이런 작업은 단순 검색만으로는 어려운데요. 정보를 아는 것과 결과물을 만드는 것은 다르기 때문입니다.

결국 AI 에이전트는 직무 경계에도 영향을 준다고 볼 수 있습니다. 특정 직무를 완전히 대체한다기보다, 여러 직무에 걸쳐 있던 작은 실행 단위들을 한 사람의 작업 가능 영역 안으로 끌어올 수 있지요.

4. 업무의 인지 수준이 올라간다

업무의 깊이 또한 분석 대상이었는데요. 연구진은 기억하기·이해하기·적용하기·분석하기·평가하기·창조하기처럼 인지 작업의 수준을 나누어 사용자가 AI에게 어떤 수준의 일을 맡기는지 살펴봤습니다. 결과는 어땠을까요?

Computer 쿼리의 76%는 고차원적 인지 작업으로 분류된 반면, Search는 55%였습니다. 특히 최상위 단계인 'Create' 작업은 Computer가 50%, Search가 26%였습니다. 아래 그래프를 보면, Search에서는 사실 확인이나 정보 조회에 가까운 요청이 상대적으로 많지만, Computer에서는 보고서 작성, 코드 생성, 자료 구성, 시각화처럼 새로운 산출물을 만드는 Create 수준의 요청이 훨씬 더 많이 나타났습니다.

Search와 Computer 요청의 인지 복잡도 비교. 출처: 퍼플렉시티

고부가가치 업무는 단일 역량만으로 끝나지 않습니다. 좋은 제품 기획은 시장 이해, 사용자 문제, 기술 가능성, 비즈니스 모델, 커뮤니케이션을 함께 요구하지요. 좋은 데이터 분석 결과물 역시 통계, 도메인 지식, 시각화, 의사결정 맥락이 함께 맞물려야 합니다. AI 에이전트는 이런 복합 업무를 더 쉽게 시도하게 만듭니다. 사용자는 모든 영역의 전문가가 아니더라도, 에이전트를 통해 여러 지식 영역을 연결한 산출물을 만들 수 있습니다.

물론 모든 수치들은 조심해서 읽을 필요가 있습니다. 연구 대상은 Perplexity 생태계 안의 초기 Computer 사용자들이고, 시간과 비용 절감 효과 역시 실제 모든 업무를 직접 측정한 값이라기보다 도구 호출, LLM 추정, 사용자 인터뷰를 결합해 계산한 추정치입니다. 따라서 'AI 에이전트가 모든 지식노동 비용을 94% 줄인다'고 일반화하기보다는, 특정 조건에서 에이전트가 사람의 수동 실행 시간을 줄이고 더 복잡한 업무를 시도하게 만들 수 있다는 초기 증거로 보는 편이 정확합니다.

이번 연구에서 특히 주목할 부분은 Computer-only task입니다. 이는 같은 사용자들이 Search에서는 거의 시도하지 않았지만, Computer에서는 나타난 업무를 의미하는데요. 가장 엄격한 기준으로 봤을 때, Computer 쿼리의 23%는 Search 표본에는 전혀 나타나지 않는 작업을 포함했습니다.

AI 도입 효과를 측정할 때 우리는 흔히 '기존 작업을 몇 퍼센트 빠르게 했는가'를 봅니다. 하지만 에이전트 시대에는 그 질문만으로 부족합니다. 이 도구가 없었다면 애초에 시도하지 않았을 작업이 얼마나 생겼는지, 그리고 여러 직무에 흩어져 있던 실행 단위가 어떻게 다시 묶이는지를 함께 봐야 합니다. AI 에이전트의 진짜 변화는 더 빠른 답변이 아니라, 일의 단위가 다시 쪼개지고 묶이는 데 있습니다.

목록으로 돌아가기