스스로 개선하는 AI

메타 AI의 혁신적인 작업은 자체 훈련 데이터의 생성과 활용을 선도하는 자가 개선 언어 모델을 소개합니다. 이 자율적인 방법은 Claude 2, Gemini Pro 및 GPT-4 0613와 같은 주목할만한 상대들을 AlpacaEval 2.0 순위에서 능가하는 능력을 모델에게 제공합니다. 작동 방식은 다음과 같습니다: 초기화: 능숙하게 사전 훈련된 언어 모델과 인간이 레이블을 지정한 훈련 데이터의 씨앗으로 시작합니다. 자체 지시어 생성: 모델은 씨앗 데이터로부터 자동으로 새로운 지시어를 만들고 가능한 답변의 범위를 구성합니다. 자체 평가: 각 응답은 관련성과 사실적 정확성과 같은 기준에 따라 모델에 의해 면밀히 검토되고 점수가 매겨집니다....