지난해 봄, CellarTracker라는 와인 컬렉션 관리 애플리케이션은 AI를 통합하여 “와인 전문가” 역할을 수행하며, 사용자의 취향에 맞춘 조언을 제공하기 시작했습니다. 하지만 문제는 이 챗봇이 너무 “친절”하다는 것입니다. Eric LeVine CellarTracker CEO는 “이 챗봇은 솔직하게 말하는 것보다 훨씬 더 공손합니다”라고 말했습니다. “정직한 평가를 내리기까지 6주간의 테스트와 조정이 필요했습니다.” 이는 AI와 인간 간의 업무 갈등을 보여주는 사례입니다.
ChatGPT가 등장한 지 3년이 지나면서, 많은 기업들이 AI 생성 기술을 빠르게 채택하고, 가능한 많은 제품에 통합하기 위해 노력하고 있습니다. 그러나 전문가와 관찰자, 많은 기업의 경영진에 따르면, 여전히 대다수 기업이 투자한 자본에 대한 수익을 얻는 데 어려움을 겪고 있습니다. Forrester Research의 1,576명의 경영진을 대상으로 한 조사에 따르면, 응답자의 단 15%만이 AI 덕분에 회사의 이익률이 개선되었다고 보고했습니다. 한편, BCG는 1,250명의 경영진을 대상으로 한 조사에서 단 5%만이 AI가 가져온 광범위한 가치를 인식하고 있다고 밝혔습니다. 그들은 AI 생성 기술이 궁극적으로 비즈니스 운영을 변화시킬 것이라고 믿지만, 현재 진행 속도를 재검토하고 있습니다.
Forrester Research는 2026년까지 기업들이 계획한 AI 지출의 25%를 1년 더 미룰 것으로 예측했습니다. Forrester의 분석가 Brian Hopkins는 “기술 기업들은 AI 덕분에 모든 것이 빠르게 변화할 것이라고 기대하고 있지만, 사실은 그렇게 빨리 변하지 않습니다”라고 언급했습니다.
OpenAI, Anthropic, Google 등 AI 모델을 개발하는 기업들은 내년에는 기업 고객을 유치하는 데 집중하고 있습니다. 최근 뉴욕에서 열린 언론 점심회에서 OpenAI CEO Sam Altman은 기업 AI 시장이 1,000억 달러에 이를 수 있다고 말했습니다. 이는 반도체, 데이터 센터, 에너지 시스템 등 다양한 분야에 대한 투자 자원이 풍부한 상황에서 이루어지고 있습니다. 그러나 많은 전문가들은 AI가 실제로 효과를 가져올지, 아니면 2000년대의 닷컴 버블처럼 거품이 될지에 대해 논란을 벌이고 있습니다.
AI의 “편의성” 현재 AI 모델은 사용자에게 만족을 주기 위해 노력하고 있습니다. 이러한 편향이나 “아부”는 사용자와의 대화를 촉진하지만, 모델이 더 나은 조언을 제공하는 능력을 저하시킬 수 있습니다. LeVine CEO는 CellarTracker가 OpenAI 기술을 기반으로 한 기능을 통합할 때 이러한 문제를 겪었다고 말했습니다. 챗봇은 일반적인 질문에 대해서는 잘 작동하지만, 특정 빈티지와 같은 분석이 필요한 문제에 대해서는 긍정적인 평가를 내리는 경향이 있습니다. LeVine은 챗봇이 “객관적인 의견을 내고 사람들이 싫어할 수 있는 와인 종류를 제안하는 데” 여러 주를 보냈다고 전했습니다.
Cando Rail and Terminals의 CEO Jeremy Nielsen은 직원들이 연구, 교육 및 내부 안전 보고를 지원하는 챗봇을 실험했습니다. 그러나 이 모델은 약 100페이지에 달하는 캐나다 철도 운영 규칙을 일관되게 정확하게 요약할 수 없었습니다. 이 규칙은 산업 안전 기준을 규정하고 있습니다. 챗봇은 심지어 잘못 이해하거나 완전히 새로운 규칙을 “삽입”하기도 했습니다. Nielsen은 프로젝트에 30만 달러가 소요됐지만, 효과가 부족해 현재 중단된 상태라고 말했습니다. “우리는 이것이 쉬운 해결책이라고 생각했지만, 실제로는 그렇지 않았습니다”라고 Nielsen은 덧붙였습니다.
“인간이 돌아와야 한다” 많은 기업들이 AI를 자동 응답 서비스 또는 고객 정보 제공에 활용하고 있습니다. 그러나 이들 중 많은 기업은 인간과 챗봇 간의 상호작용에 한계가 있다는 것을 빠르게 깨달았습니다. 예를 들어, 지난해 초 스웨덴 결제 회사 Klarna는 OpenAI 솔루션을 통합한 고객 서비스 보조 시스템을 도입하여 700명의 전담 고객 서비스 직원을 대체할 수 있었습니다. 그러나 CEO Sebastian Siemiathowski는 올해 중반에 “전략을 조정해야 했다”고 밝히며, 고객이 기계보다는 실제 사람과 대화하기를 선호한다고 인정했습니다. “챗봇은 단순하고 반복적인 일을 수행할 수 있지만, 복잡한 문제는 곧바로 실제 사람에게 넘겨질 것입니다”라고 Siemiathowski는 말하며, 새로운 AI 지원 버전을 곧 출시할 예정이지만 “인간이 여전히 중심에 있어야 한다”고 강조했습니다.
마찬가지로 미국 통신사 Verizon은 AI를 적용한 후 다시 직원들을 활용하기 시작했습니다. Verizon의 AI 애플리케이션 부서 책임자 Ivan Berg는 “40%의 소비자는 여전히 실제 사람과 대화하는 것을 선호하며, 직접 지원 직원과 연결되지 못할 경우 실망한다”고 전했습니다. 현재 Verizon은 약 2,000명의 고객 서비스 직원을 보유하고 있으며, AI를 사용하여 전화를 분류하고 고객 정보를 수집하여 자가 서비스 시스템이나 직접 지원 직원에게 안내하고 있습니다. 이를 통해 직원들은 복잡한 문제를 해결하고 새로운 것을 시도할 수 있는 시간을 확보하게 됩니다.
울퉁불퉁한 경계 대규모 언어 모델은 수학 및 프로그래밍에서 복잡한 작업을 신속하게 수행할 수 있지만, 상대적으로 간단한 작업에서는 실패할 수 있습니다. 연구자들은 이러한 모순을 AI의 “울퉁불퉁한 경계(jagged frontier)”라고 부릅니다. “AI는 수학에서는 페라리처럼 빠르지만, 일정을 정리하는 데는 당나귀처럼 느릴 수 있습니다”라고 AI 성능 평가 도구 LMArena의 공동 창립자이자 CEO인 Anastasios Angelopoulos는 말했습니다.
작은 문제들조차 AI 시스템에 예상치 못한 문제를 일으킬 수 있습니다. 많은 금융 기업들이 다양한 출처에서 수집한 데이터에 의존하고 있으며, 각 출처는 서로 다른 형식을 갖고 있습니다. 이러한 차이는 AI가 “존재하지 않는 패턴을 읽게 만들 수 있습니다”라고 Alpha Financial Markets Consulting의 Clark Shafer는 설명했습니다. Shafer는 많은 기업들이 AI를 활용하기 위해 데이터 형식 프로세스를 검토하고 있으며, 이는 비용이 많이 들고 시간이 소요되며 복잡할 수 있다고 덧붙였습니다. “사람들은 AI가 마법 같다고 생각했지만, 사실은 그렇지 않습니다”라고 Prosus의 AI 부서 책임자 Euro Beinat는 말했습니다. “이 도구들이 효과적으로 작동하려면 많은 지식을 코드화해야 합니다.”
Bảo Lâm (로이터 통신)