챗GPT, 간단한 계산문제 틀려… 회계시험 낙제
파이낸셜뉴스
2023.04.24 13:22
수정 : 2023.04.24 14:07기사원문
14개국 186개 대학 참여해 회계문제 제출해 테스트
챗GPT는 47.4점… 회계학과생은 평균점수 76.7점
미국 브리검 영 대학의 대이비드 우드 회계학과 교수팀이 챗GPT에게 회계시험을 보게 한 결과 낙제 점수를 받았다.
미국 의사면허시험과 법학전문대학원(로스쿨), 경영전문대학원(MBA) 시험은 물론 15개의 대학과목 선이수제(AP) 시험중 13개 통과했던 챗GPT가 47.4점을 받은 것.
그결과, 회계학을 배우는 대학생들의 평균점수가 76.7점 인데 반해 챗GPT는 47.4점에 그쳤다. 전체 문제 중 AIS와 감사 등 11.3%는 챗GPT가 학생들보다 높은 점수를 받았다. 하지만 세무와 재무, 관리 평가 항목에서는 성적이 나빴다. 연구진은 "챗GPT가 계산하는 것에 대해 어려움을 겪어 이 항목에서 성적이 좋지 않은 것 같다"고 유추했다.
또한 문제 유형별로 차이가 있다는 것도 알아냈다. 챗GPT는 OX 문제는 68.7%, 객관식 문제는 59.5%를 맞췄다. 하지만 단답형 주관식 문제에서는 정답률이 28.7%에 그쳤다.
또한 연구진은 이번 시험을 통해 챗GPT의 특징을 발견했다. 연구진은 "챗GPT는 고차원적 질문에 대해 답하는 것을 어려워했고, 때로는 엉뚱하게 대답하기도 했다"고 말했다. 문제를 풀때 뺄셈을 해야하는데 나눗셈을 하고 덧셈을 하는 등 엉뚱한 오류를 범했다. 또 설명은 잘 했지만 틀린 답을 내놨다. 뿐만아니라 참고문헌을 제시할때 존재하지 않은 저자와 있지도 않은 참고문헌을 만들기도 했다.
이번 시험에 참여한 학생은 "완벽하지 않은 챗GPT만을 이용해 배우려고 하면 안된다"고 지적했다.
monarch@fnnews.com 김만기 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지