최신논문
상자 밖에서 생각하자: 창의적 유머 생성을 통한 대규모 언어 모델에서의 도약적 사고 탐구
작성자
작성일
2024-07-03 23:35
조회
302
https://arxiv.org/abs/2312.02439
Chain-of-Thought(CoT)는 대규모 언어 모델(LLM)이 단계별로 추론하도록 안내하며, 논리적 추론 능력을 촉진할 수 있습니다. CoT는 논리적 과제에 효과적이지만, 창의적인 문제 해결에는 도움이 되지 않습니다. 창의적인 문제 해결에는 종종 틀에서 벗어난 사고가 필요하고 혁신 발전에 필수적입니다. 이 논문에서는 LLM 내의 Leap-of-Thought(LoT) 능력을 탐구합니다. 이는 강력한 연관성과 지식 도약을 포함하는 비순차적이고 창의적인 패러다임입니다. 이를 위해 인기 있는 Oogiri 게임에 대한 LLM을 연구합니다. 이 게임은 참가자가 주어진 이미지, 텍스트 또는 둘 다에 예상치 못하게 유머러스하게 반응하기 위해 좋은 창의성과 강력한 연관성 사고를 가져야 하므로 LoT 연구에 적합합니다. 그런 다음 Oogiri 게임에서 LLM의 LoT 능력을 조사하기 위해 먼저 Oogiri 게임의 130,000개 이상의 샘플을 포함하는 다중 모드 및 다국어 Oogiri-GO 데이터 세트를 구축하고 Oogiri 게임에서 대부분의 기존 LLM의 LoT 능력이 부족하거나 실패하는 것을 관찰합니다. 따라서 LLM의 LoT 능력을 향상시키기 위한 창의적인 Leap-of-Thought(CLoT) 패러다임을 도입합니다. CLoT은 먼저 Oogiri-GO 데이터 세트를 LoT 지향 명령어 튜닝 데이터로 공식화하여 특정 LoT 유머 생성 및 구별 능력을 달성하도록 사전 훈련된 LLM을 훈련합니다. 그런 다음 CLoT은 LLM이 겉보기에 관련성이 없어 보이는 개념 간의 유사점을 탐색하여 더 창의적인 LoT 데이터를 생성하도록 장려하는 탐색적 자체 개선을 설계하고 자체 개선을 위해 자체적으로 훈련할 고품질 데이터를 선택합니다. CLoT은 Oogiri 게임에서 유머 생성에 탁월할 뿐만 아니라 클라우드 추측 게임 및 발산 연관 작업과 같은 다양한 작업에서 창의적인 능력을 향상시킵니다. 이러한 발견은 우리의 이해를 증진시키고 도메인 전반에 걸쳐 혁신적인 응용 프로그램을 위한 LLM의 창의적 역량을 개선할 수 있는 경로를 제공합니다. 데이터 세트, 코드 및 모델은 온라인으로 공개됩니다.
https://zhongshsh.github.io/CLoT/
Chain-of-Thought(CoT)는 대규모 언어 모델(LLM)이 단계별로 추론하도록 안내하며, 논리적 추론 능력을 촉진할 수 있습니다. CoT는 논리적 과제에 효과적이지만, 창의적인 문제 해결에는 도움이 되지 않습니다. 창의적인 문제 해결에는 종종 틀에서 벗어난 사고가 필요하고 혁신 발전에 필수적입니다. 이 논문에서는 LLM 내의 Leap-of-Thought(LoT) 능력을 탐구합니다. 이는 강력한 연관성과 지식 도약을 포함하는 비순차적이고 창의적인 패러다임입니다. 이를 위해 인기 있는 Oogiri 게임에 대한 LLM을 연구합니다. 이 게임은 참가자가 주어진 이미지, 텍스트 또는 둘 다에 예상치 못하게 유머러스하게 반응하기 위해 좋은 창의성과 강력한 연관성 사고를 가져야 하므로 LoT 연구에 적합합니다. 그런 다음 Oogiri 게임에서 LLM의 LoT 능력을 조사하기 위해 먼저 Oogiri 게임의 130,000개 이상의 샘플을 포함하는 다중 모드 및 다국어 Oogiri-GO 데이터 세트를 구축하고 Oogiri 게임에서 대부분의 기존 LLM의 LoT 능력이 부족하거나 실패하는 것을 관찰합니다. 따라서 LLM의 LoT 능력을 향상시키기 위한 창의적인 Leap-of-Thought(CLoT) 패러다임을 도입합니다. CLoT은 먼저 Oogiri-GO 데이터 세트를 LoT 지향 명령어 튜닝 데이터로 공식화하여 특정 LoT 유머 생성 및 구별 능력을 달성하도록 사전 훈련된 LLM을 훈련합니다. 그런 다음 CLoT은 LLM이 겉보기에 관련성이 없어 보이는 개념 간의 유사점을 탐색하여 더 창의적인 LoT 데이터를 생성하도록 장려하는 탐색적 자체 개선을 설계하고 자체 개선을 위해 자체적으로 훈련할 고품질 데이터를 선택합니다. CLoT은 Oogiri 게임에서 유머 생성에 탁월할 뿐만 아니라 클라우드 추측 게임 및 발산 연관 작업과 같은 다양한 작업에서 창의적인 능력을 향상시킵니다. 이러한 발견은 우리의 이해를 증진시키고 도메인 전반에 걸쳐 혁신적인 응용 프로그램을 위한 LLM의 창의적 역량을 개선할 수 있는 경로를 제공합니다. 데이터 세트, 코드 및 모델은 온라인으로 공개됩니다.
https://zhongshsh.github.io/CLoT/
전체 0