AI가 재정의하는 ‘성과’의 허상

인공지능이 이메일을 쓰고 데이터를 분석하며 코드를 생성할 수 있다면, 속도·생산성·업무 완료율 등 우리가 현재 측정하는 모든 지표에서 기계가 인간을 앞선다. 문제는 이 지표들이 인간의 가치를 온전히 담아내지 못한다는 점이다. 최근 관리학 연구에 따르면 AI는 인간의 업무 효율을 12% 향상시키지만, 동시에 19%의 오류율을 보인다. 우리는 ‘처리량’을 최적화하는 데 급급한 나머지 오류가 누적되는 현실을 묵인하고 있는 셈이다.

AI와 인간의 가장 큰 차이는 ‘창조성’에 있다. AI는 ‘생성형’이라는 이름과는 달리 기존 데이터를 재조합하고 최적화할 뿐, 아직 존재하지 않는 것을 상상하지 못한다. dissension(반대 의견)을 제시하지 못하고, empathy(공감)도, integrity(정직성)를 판단하지 못한다. 반면 인간은 모순을 품고 새로운 해결책을 창조하는 능력을 지닌다. 이 ‘생성적 능력’이 바로 혁신의 원동력이다. 그런데 우리의 성과 측정 시스템은 이를 전혀 반영하지 못한다.

100년 전 과학적 관리법의 유산

이 문제는 결코 새로운 것이 아니다. 오히려 100년 전으로 거슬러 올라간다. 1900년대 초 Frederick Taylor는 ‘과학적 관리법’을 제시하며 인간의 노동을 표준화·측정·최적화 가능한 ‘입력(input)’으로 규정했다. 효율성이라는 ‘출력(output)’을 위해 인간을 관리 대상으로 삼은 것이다.

이후 미국 육군은 병사들을 서로 등급화하는 평정 시스템을 도입했다. 이는 계급 구조를 유지하고 배치 효율성을 높이기 위한 군사적 도구였을 뿐, 인재 개발과는 무관했다. 전쟁이 끝나고 이 시스템은 기업으로 전파되었다. 1950년대가 되자 연례 성과평가가 기업 문화의 필수 요소가 되었다. 그 목적은 인재를 개발하는 것이 아니었다. 그저 ‘정렬·순위화·평가’하는 것이었다.

GE의 잭 웰치는 이 시스템을 극단으로 끌고 갔다. 그는 매년 상위 20%에게는 보상을, 하위 10%에게는 해고를 단행했다. 이는 전 세계 기업에 ‘인간은 등급화되어야 한다’는 전제를 퍼뜨렸다. 그러나 정작 웰치의 ‘스택 앤 랭크(Stack and Rank)’ 시스템은 성과 향상이 목적이 아니었다. 주주들의 인식을 관리하기 위한 도구였다. 그는 이 시스템을 통해 인원을 감축하고, 주가 관리를 도모했다.

성과평가의 세 가지 문제점

  • 창의성 억압: AI 시대에도 여전히 ‘속도와 양’을 중시하는 성과평가는 인간의 창조적 사고를 억압한다. 새로운 아이디어를 내는 데는 시간이 걸리며, 실패도 불가피하다. 그러나 현재의 시스템은 이를 ‘비효율’로 치부한다.
  • 단기 성과 편향: 연례 평가와 분기별 실적 중심의 평가는 장기적 혁신을 저해한다. AI는 기존 데이터를 기반으로 최적화할 수 있지만, 인간의 ‘장기적 상상력’을 대체할 수는 없다.
  • 인간성 배제: empathy, integrity, dissension 같은 인간의 고유한 가치는 측정 불가능한 요소다. 그러나 이 요소들이恰恰(바로) 혁신의 핵심이다. 현재의 성과평가는 이들을 배제한 채 ‘측정 가능한 것만’으로 인간을 평가한다.

AI 시대, 우리는 무엇을 해야 하는가?

AI가 인간의 일자리를 대체하는 시대가 아니라, 인간의 역할을 재정의하는 시대가 왔다. 그렇다면 우리는 성과평가의 패러다임을 바꿔야 한다. 인간 고유의 가치를 반영할 수 있는 새로운 평가 체계가 필요하다.

첫째, ‘생성적 성과’를 측정하라. AI는 ‘재생산’이라면, 인간은 ‘창조’다. 새로운 아이디어의 창출, 문제 해결의 혁신성, 장기적 비전 등 ‘생성적 성과’를 평가할 수 있는 지표가 필요하다. 예를 들어, ‘새로운 솔루션 개발’, ‘장기 프로젝트 리드’, ‘팀 내 혁신 기여도’ 같은 요소들을 고려할 수 있다.

둘째, ‘실패 허용’을 장려하라. AI는 오류를 최소화하는 데 최적화되어 있지만, 인간은 실패를 통해 배우고 성장한다. ‘실패 허용’이라는 문화는 혁신을 위한 필수 조건이다. 실패를 ‘비효율’이 아닌 ‘학습 기회’로 인식하는 시스템이 필요하다.

셋째, ‘인간적 가치’를 평가에 반영하라. empathy, integrity, dissension 같은 인간의 고유한 가치를 평가에 포함해야 한다. 예를 들어, ‘팀 내 협력’, ‘윤리적 의사결정’, ‘다양한 의견 수용’ 같은 요소들을 측정할 수 있다. 이러한 요소들은 AI가 대체할 수 없는 인간의 고유한 역량이다.

넷째, ‘장기적 관점’을 강조하라. 연례 평가 대신, 3~5년 단위의 장기적 평가를 도입하라. AI는 단기적 최적화를 잘하지만, 인간의 장기적 비전과 혁신은 AI가 따라올 수 없는 영역이다. 장기적 관점의 평가는 이러한 가치를 반영할 수 있다.

“인공지능이 인간의 일자리를 대체하는 시대가 아니다. 인간의 역할을 재정의하는 시대가 왔다. 우리는 AI가 못하는 ‘창조적 사고’를 어떻게 평가하고 육성할 것인가?”

결론: 인간의 가치를 재발견하는 시점

AI가 인간의 일자리를 위협하는 시대가 아니라, 인간의 진정한 가치를 재발견하는 시대가 왔다. 100년 전 과학적 관리법이 인간의 노동을 ‘입력’으로 전락시킨 것처럼, 현재의 성과평가 시스템은 인간의 ‘창조성’을 ‘비효율’로 치부하고 있다. 그러나 AI 시대에도 인간의 고유한 가치는 변하지 않는다. 새로운 아이디어를 창출하고, 모순을 품고, 혁신을Lead하는 능력은 AI가 결코 대체할 수 없는 인간의 역량이다.

우리는 이제 ‘성과’의 정의를 재정의해야 한다. 속도와 양이 아닌, 창조성과 혁신, 그리고 인간의 고유한 가치를 반영하는 새로운 성과평가의 시대가 필요하다. 그래야만 AI 시대에서도 인간의 가치가 빛을 발할 수 있다.