대규모 언어모델(LLM)이 “이건 거짓이다”라는 명시적 경고를 받고도 그 진술을 사실처럼 자신 있게 다루는 경향이 새 실험으로 드러났다고 28일 아스 테크니카(Ars Technica)가 보도했다. 미세 조정(fine-tuning) 테스트 결과는 “주장을 사실로 자신 있게 표현하려는 편향이 ...
자세한 내용은 원문에서 확인하세요.
로그인하고 댓글을 작성하세요
첫 댓글을 작성해보세요
KEYWORK는 고용노동부에 정식 신고된직업정보제공사업자입니다.
신고번호: J1806020260002
로그인하고 댓글을 작성하세요