본문 바로가기

test time computing2

Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking 논문 리뷰 Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking날짜: 2025년 3월 27일https://arxiv.org/pdf/2502.02339학습 안하고 MCTS  Abstract다중 모달 대형 언어 모델(MLLMs)복잡한 시각적 추론에서 여전히 한계성능과 효율성의 균형을 맞추는 데 어려움방대한 데이터와 탐색 공간에 대한 의존도가 높아 비효율적인 암묵적 통찰력 추출과 데이터 활용을 초래AStar를 제안몬테 카를로 트리 탐색(MCTS)을 통한 다중 모달 추론자동화된 구조적 사로 패러다임→ 내부 추론 능력과 외부 추론 가이드를 원활하게 통합한 통합 추론 프레임워크를 설계→ 최소한의 트리 반복으로 효율적인 추론  1. Introduction시.. 2025. 3. 27.
Test-time-computing에 대하여 (허깅페이스 블로그 포스트 정리) Test-time-computing날짜: 2025년 2월 27일https://huggingface.co/spaces/HuggingFaceH4/blogpost-scaling-test-time-compute전반적인 TTC 내용  개요대형 언어 모델(LLM)의 발전컴퓨팅 자원 확장이 큰 영향 → 큰 모델 훈련 = 지나치게 비쌈보조적인 접근법인 테스트 시간 컴퓨팅 확장에 대한 관심 증가큰 훈련 예산을 사용하는 대신, 모델이 어려운 문제를 풀 때 더 긴 시간을 들여 생각할 수 있게 하는 동적인 추론 전략을 사용그 중 하나가 OpenAI의 o1 모델로, 테스트 시간 컴퓨팅을 늘림으로써 어려운 수학 문제에서 일관되게 성능이 향상  DeepMind의 최근 연구: 테스트 시간 컴퓨팅을 최적으로 확장할 수 있는 전략 제시.. 2025. 3. 27.