본문 바로가기

전체 글129

OpenAI GPT API 기간 한정 무료 토큰 이용 사용하는 법(free daily usage ~25.04.30) 안녕하세요, 연구 중에 OpenAI API 무료 이용이 가능한 점이 있어서 글을 쓰게 되었습니다. API 사용하려고 들어갔다가 아래와 같은 팝업 창이 떠서 봤는데보니까 traffic shared을 하면서 tier별로 매일 무료 토큰을 제공해주더라구요.조금 한 지 된 이벤트? 같은데 이제야 봐서 얼른 공유합니다..! 오늘은 관련 정보와 사용 방법을 간단히 적으려고 합니다. + 수정)모두가 해당하는건 아닌것 같아요. data controls에 타겟으로 떠야 쓸 수 있는 것 같아요아마 많이 사용한 사람 위주로 선정하는듯해용.. ** 안내글 **: https://help.openai.com/en/articles/10306912-sharing-feedback-evals-and-api-data-with-opena.. 2025. 4. 24.
[CS 전공지식 #17] 챕터5. 자료 구조 목차5.1 복잡도5.2 선형 자료 구조5.3 비선형 자료 구조 챕터5. 자료 구조자료구조 data structure: 효율적으로 데이터를 관리, 수정, 삭제, 탐색, 저장할 수 있는 데이터 집합본 책 C++ 기반으로 자료 구조 설명 예정 5.1 복잡도복잡도: 시간 복잡도, 공간 복잡도 5.1.1 시간 복잡도시간 복잡도: 문제를 해결하는 데 걸리는 시간과 입력의 함수 관계빅오 표기법:입력 범위 n을 기준으로 해서 로직이 몇 번 반복되는지 나타내느 것가장 영향을 많이 끼치는 항의 상수 인자를 빼고 나머지 항을 없앤 것$10n^2+n$ → $O(n^2)$시간 복잡도의 존재 이유: 효율적인 코드로 개선하는 데 쓰이는 척도 5.1.2 공간 복잡도공간 복잡도: 프로그램을 실행시켰을 때 필요로 하는 자원 공간의 .. 2025. 4. 16.
Mulberry: Empowering MLLM with o1-like Reasoning and Reflection via Collective Monte Carlo Tree Search 논문 리뷰 Mulberry: Empowering MLLM with o1-like Reasoning and Reflection via Collective Monte Carlo Tree Search날짜: 2025년 4월 10일https://arxiv.org/pdf/2412.18319집단 몬테 카를로 트리 검색(CoMCTS) 데이터셋을 생성하고 Mulberry-260k생성한 데이터셋으로 지도학습한 모델 Mulberry이 저자들이 Mulberry 데이터셋으로 강화학습한 논문도 3월에 나옴R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimizationhttps://arxiv.org/pdf.. 2025. 4. 16.
MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI (논문 리뷰) MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI날짜: 2025년 4월 3일https://arxiv.org/pdf/2311.16502CVPR 2024 Oral멀티모달 벤치마크 중 추론 벤치마크가 궁금해서 읽어봄아주 대표적인 멀티모달 추론 벤치마크입니다. (테크 리포트에서도 단골손님)거의 추론 수준의 벤치마크는 이 논문처럼 인간을 갈아서? 만드는 논문 많음 AbstractMMMU:대학 수준의 주제 지식, 추론 멀티모달 벤치마크6가지 핵심 분야: 예술 및 디자인, 비즈니스, 과학, 건강 및 의학, 인문학 및 사회 과학, 기술 및 공학대학 시험, 퀴즈 및 교과서차트, 다이어그램, 지도, .. 2025. 4. 16.
[강화학습 #2] 챕터2. 마르코프 결정 과정 목차챕터 2. 마르코프 결정 과정2.1 마르코프 결정 과정 (MDP)이란?2.2 환경과 에이전트를 수식으로2.3 MDP의 목표2.4 MDP 예제  챕터 2. 마르코프 결정 과정밴디트: 에이전트 행동에 따라 문제의 설정 변화 X실제: 에이전트 행동에 따라 문제의 설정 변화 O마르코프 결정 과정 Markov Decision Process (MDP)  2.1 마르코프 결정 과정 (MDP)이란?결정 과정: 에이전트가 환경과 상호작용하면서 행동을 결정하는 과정MDP 문제 예시: 그리드 월드에이전트 agent: 로봇주변 environment: 환경보상 reward: 사과를 얻을 때 +1, 폭탄을 얻을 때 -2상태 state: 에이전트의 행동에 따라 에이전트가 처하는 상황이 달라짐타임 스텝 time step:에이전트.. 2025. 4. 7.
[강화학습 #1] 챕터1. 밴디트 문제 BOAZ 학기 중 스터디로 강화학습 스터디도 진행 중인데,정리한 내용을 차차 올려보려고 합니다. 졸업 주제로 강화학습을 접목할 예정이라 보고 있는데책이 워낙 잘 쓰여져서 그런지 개념이 잡히고 있는 느낌..! 노션에 정리한 기록을 옮기는 거라.. 식이 다 잘 들어갈지 걱정이 되는군요...강화학습 차근차근 공부하실 분들께 이 책 추천합니다 :)   목차1.1 머신러닝 분류와 강화 학습1.2 밴디트 문제1.3 밴디트 알고리즘1.4 밴디트 알고리즘 구현1.5 비정상 문제  챕터 1. 밴디트 문제1.1 머신러닝 분류와 강화 학습머신러닝 분류: 지도 학습, 비지도 학습, 강화 학습지도 학습 supervised learning입력 (문제)과 출력(정답)을 쌍으로 묶은 데이터‘정답 레이블’ 이 존재사람의 손으로 정답 .. 2025. 4. 7.
[Data Engineering Zoomcamp #2] GCP, Terraform https://github.com/DataTalksClub/data-engineering-zoomcamp GitHub - DataTalksClub/data-engineering-zoomcamp: Data Engineering Zoomcamp is a free nine-week course that covers the fundamentData Engineering Zoomcamp is a free nine-week course that covers the fundamentals of data engineering. - DataTalksClub/data-engineering-zoomcampgithub.com   목차🌏 TerraformIntroduction Terraform: Concepts and Ove.. 2025. 3. 31.
[Data Engineering Zoomcamp #1] Docker, SQL 보아즈 학기 스터디로 Data Pipeline 스터디를 시작하게 되었습니다.Data engineering zoomcamp 라는 깃허브&유튜브를 중점적으로 진행 예정이예요.공부한 기록을 업로드하려고 합니다.https://github.com/DataTalksClub/data-engineering-zoomcamp GitHub - DataTalksClub/data-engineering-zoomcamp: Data Engineering Zoomcamp is a free nine-week course that covers the fundamentData Engineering Zoomcamp is a free nine-week course that covers the fundamentals of data enginee.. 2025. 3. 28.
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking 논문 리뷰 Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking날짜: 2025년 3월 27일https://arxiv.org/pdf/2502.02339학습 안하고 MCTS  Abstract다중 모달 대형 언어 모델(MLLMs)복잡한 시각적 추론에서 여전히 한계성능과 효율성의 균형을 맞추는 데 어려움방대한 데이터와 탐색 공간에 대한 의존도가 높아 비효율적인 암묵적 통찰력 추출과 데이터 활용을 초래AStar를 제안몬테 카를로 트리 탐색(MCTS)을 통한 다중 모달 추론자동화된 구조적 사로 패러다임→ 내부 추론 능력과 외부 추론 가이드를 원활하게 통합한 통합 추론 프레임워크를 설계→ 최소한의 트리 반복으로 효율적인 추론  1. Introduction시.. 2025. 3. 27.
Test-time-computing에 대하여 (허깅페이스 블로그 포스트 정리) Test-time-computing날짜: 2025년 2월 27일https://huggingface.co/spaces/HuggingFaceH4/blogpost-scaling-test-time-compute전반적인 TTC 내용  개요대형 언어 모델(LLM)의 발전컴퓨팅 자원 확장이 큰 영향 → 큰 모델 훈련 = 지나치게 비쌈보조적인 접근법인 테스트 시간 컴퓨팅 확장에 대한 관심 증가큰 훈련 예산을 사용하는 대신, 모델이 어려운 문제를 풀 때 더 긴 시간을 들여 생각할 수 있게 하는 동적인 추론 전략을 사용그 중 하나가 OpenAI의 o1 모델로, 테스트 시간 컴퓨팅을 늘림으로써 어려운 수학 문제에서 일관되게 성능이 향상  DeepMind의 최근 연구: 테스트 시간 컴퓨팅을 최적으로 확장할 수 있는 전략 제시.. 2025. 3. 27.
R1-Zero’s “Aha Moment” in Visual Reasoning on a 2B Non-SFT Model 논문 리뷰 R1-Zero’s “Aha Moment” in Visual Reasoning on a 2B Non-SFT Model날짜: 2025년 3월 20일https://arxiv.org/pdf/2503.05132아직 연구 중이라고 함Awesome MLLM Reasoning 찾음https://github.com/HJYao00/Awesome-Reasoning-MLLM?tab=readme-ov-file거기서 찾은 논문이 본 논문open_r1 이라고 huggingface에서 deepseek r1 재현하기 위해 판 레퍼가 있음 https://github.com/huggingface/open-r1 AbstractDeepSeek-R1간단한 규칙 기반 보상을 통한 강화 학습 → 복잡한 추론훈련 중에 자기 반성 및 응답 길이 증가.. 2025. 3. 27.
Visual-RFT: Visual Reinforcement Fine-Tuning 논문 읽기 Visual-RFT: Visual Reinforcement Fine-Tuning날짜: 2025년 3월 6일https://arxiv.org/pdf/2503.01785허페 daily 1등 했던 논문인데 (지금은 phi4에 밀려서 2등 되긴 했는데..) Visual 쪽으로 RFT 논문 자체가 별로 없어서 읽어보았습니다 :) 논문 고도화해서 졸업 논문으로 Visul RFT + TTC 쪽으로 쓰려고 해서 읽는 중입니다.deepseek R1 을 포함해서 요즘 추론용 모델들이 핫해지면서강화학습 쪽이 완전 핫해졌어용..강화학습 왜 해,, 라고 생각했는데 제가 하게 되었네용..강화학습 스터디도 할 예정..! (일 벌리기 달인 ^^)대박인데의문인점은 이런식으로 비교하는 게 맞을까 싶음강화학습에 중점된 학습 방식으로 강화학.. 2025. 3. 9.
[CS 전공지식 #16] 챕터4-6~7. 조인과 조인의 원리 목차4.6 조인의 종류4.7 조인의 원리4.7.1 중첩 루프 조인 NLJ, Nested Loop Join4.7.2 정렬 병합 조인4.7.3 해시 조인 챕터4. 데이터베이스 4.6 조인의 종류조인 join하나의 테이블이 아닌 두 개 이상의 테이블을 묶어서 하나의 결과물을 만드는 것MySQL에서는 JOIN이라는 쿼리, MongoDB에서는 lookup 이라는 쿼리로참고로, MongoDB 사용 시, lookup 최대한 사용 XMongoDB는 조인 연산에 대해 관계형 데이터베이스보다 성능이 떨어짐여러 테이블 조인하는 작업 많을 경우MongoDB보다는 관게형 데이터베이스 사용 필요조인의 종류: 내부 조인, 왼쪽 조인, 오른쪽 조인, 합집합 조인 4.6.1 내부 조인두 테이블 간에 교집합 4.6.2 왼쪽 조인테이블 .. 2025. 2. 24.
[CS 전공지식 #15] 챕터4-4~5. 데이터베이스의 종류와 인덱스 목차4.4 데이터베이스의 종류4.4.1 관계형 데이터베이스4.4.2 NoSQL 데이터베이스4.5 인덱스4.5.1 인덱스의 필요성4.5.2 B-트리4.5.3 인덱스 만드는 방법4.5.4 인덱스 최적화 기법 챕터4. 데이터베이스 4.4 데이터베이스의 종류 4.4.1 관계형 데이터베이스관계형 데이터베이스 RDBMS행과 열을 가지는 표 형식 데이터를 저장하는 형태의 데이터베이스SQL을 써서 조작. 각각의 제품에 특화시킨 SQL 사용MySQL대부분의 운영체제와 호환 가능, 가장 많이 사용되는 데이터베이스스토리지 엔진: 모듈식 아키텍처로 쉽게 교체 가능데이터 웨어하우징, 트랜잭션 처리, 고가용성 처리에 강점스토리지 엔진 위에는 커넥터 API 및 서비스 계층을 통해 MySQL 데이터베이스와 쉽게 상호작용 가능쿼리 캐.. 2025. 2. 24.
[공부log 25.02.24]논문 Accept, 추가 연구 진행중, 동아리 Adv, 중국 여행 등, 개강 일주일 전의 삶 석사 마지막 학기의 개강이 일주일 앞으로 다가왔다.이번 학기는 어떤 학기가 되려나 싶은 요즘인데 ㅎㅎ일상글 스타트!    1. 논문 Accept2월 9일에 드디어 기다리고 기다리던 논문이 Accept 이 되었다.PAKDD라는 학회이고 학교에서 인정해주는 BK21학회여서 아주 기쁜 날이였다근데 와중에 학교가 BK21학회 리스트가 아니라 앞으로는 정보과학회 우수 학회로 실적 기준을 바꾼다고 한단다그래도 다행히 PAKDD는 둘 다 들어있는 학회라 다행~   이번 발표일은 다른 학회 발표일보다 기대감?이 없었는데기대가 안돼서 기대감이 없었다기보다는 그냥 여러번 학회 발표일이 지나다보니 감흥 자체가 떨어진 느낌? 그 전날에 발표일인거는 알았는데 막 자기전에는 다른 생각하다가.. 잠듦그 다음날 공동 1저자로 같이 .. 2025. 2. 24.
[CS 전공지식 #14] 챕터4-3. 트랜잭션과 무결정 목차4.3 트랜잭션과 무결정4.3.1 트랜잭션4.3.2 무결성 챕터4. 데이터베이스 4.3 트랜잭션과 무결정 4.3.1 트랜잭션트랜잭션데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위여러 개의 쿼리들을 하나로 묶는 단위특징: 원자성, 일관성, 독립성, 지속성 = ACID 특징원자성 atomicity트랜잭션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특징all or nothing예) 트랙잭션 커밋 → 문제 발생 → 롤백 → 그 이후에 모두 수행되지 않음을 보장트랜잭션 단위로 여러 로직들을 묶을 때 외부 API를 호출하는 것이 있으면 X커밋 commit:여러 쿼리가 성공적으로 처리되었다고 확정하는 명령어트랜잭션 단위로 수행, 변경된 내용이 모두 영구적으로 저장되는 것커밋이 수행 .. 2025. 2. 24.
[CS 전공지식 #13] 챕터4-2. ERD와 정규화 과정 목차4.2 ERD와 정규화 과정4.2.1 ERD의 중요성4.2.2 예제로 배우는 ERD4.2.3 정규화 과정  챕터4. 데이터베이스 4.2 ERD와 정규화 과정ERD Entity Relationship Diagram데이터베이스를 구축할 때 가장 기초적인 뼈대 역할릴레이션 간의 관계를 정의한 것서비스 구축 시 가장 먼저 신경 써야 할 부분 4.2.1 ERD의 중요성ERD: 시스템의 요구 사항을 기반으로 작성ERD를 기반으로 데이터베이스 구축데이터베이스 구축 이후에도 디버깅 또는 비즈니스 프로세스 재설계 필요한 경우에 설계도 역할 담당관계형 구조로 표현할 수 있는 데이터 구성에 유용단점) 비정형 데이터 충분히 표현 불가 4.2.2 예제로 배우는 ERD영업 부서의 ERD영업 사원: 0~n명의 고객 관리고객: .. 2025. 2. 24.
[CS 전공지식 #12] 챕터4-1. 데이터베이스의 기본 목차4.1 데이터베이스의 기본4.1.1 엔티티4.1.2 릴레이션4.1.3 속성4.1.4 도메인4.1.5 필드와 레코드4.1.6 관계4.1.7 키 챕터4. 데이터베이스 4.1 데이터베이스의 기본데이터베이스 DB, DataBase일정한 규칙, 혹은 규약을 통해 구조화 되어 저장되는 데이터의 모음실시간 접근과 동시 공유 가능DBMS DataBase Management System해당 데이터베이스를 제어, 관리하는 통합 시스템특정 DBMS마다 정의된 쿼리 언어를 통해 삽입, 삭제, 수정, 조회 등 수행 가능데이터베이스 위에 DBMS, 그 위에 응용 프로그램예) MySQL 이라는 DBMS, 그 위에 응용 프로그램에 속하는 Node.js 나 php 프로그램 4.1.1 엔티티엔티티 entity: 사람, 장소, 물건,.. 2025. 2. 24.
[CS 전공지식 #11] 챕터3-4. CPU 스케줄링 알고리즘 목차4. CPU 스케줄링 알고리즘3.4.1 비선점형 방식3.4.2 선점형 방식 챕터3. 운영체제 4. CPU 스케줄링 알고리즘CPU 스케줄러:CPU 스케줄링 알고리즘에 따라 프로세스에서 해야 하는 일을 스레드 단위로 CPU에 할당프로그램이 실행될 때, CPU 스케줄링 알고리즘이 어떤 프로그램에 CPU 소유권을 줄 것인지 결정 3.4.1 비선점형 방식프로세스가 스스로 CPU 소유권을 포기하는 방식강제로 프로세스 중지 x→ 컨텍스트 스위칭으로 인한 부하가 적음FCFS First Come, First Served:가장 먼저 온 것을 가장 먼저 처리하는 알고리즘단점) 길게 수행되는 프로세스 → 준비 큐에서 오래 기다리는 현상 발생SJF Shortest Job First실행 시간이 가장 짧은 프로세스를 가장 먼저.. 2025. 2. 17.
[CS 전공지식 #10] 챕터3-3. 프로세스와 스레드 목차3. 프로세스와 스레드3.3.1 프로세스와 컴파일 과정3.3.2 프로세스의 상태3.3.3 프로세스의 메모리 구조3.3.4 PCB Process Control Block3.3.5 멀티프로세싱3.3.6 스레드와 멀티스레딩3.3.7 공유 자원과 임계 영역3.3.8 교착 상태 챕터3. 운영체제 3. 프로세스와 스레드프로세스 process: 컴퓨터에서 실행되고 있는 프로그램CPU 스케줄링의 대상이 되는 작업 TASK이라는 용어와 거의 같은 의미스레드는 프로세스 내 작업의 흐름 지칭 3.3.1 프로세스와 컴파일 과정프로세스: 프로그램이 메모리에 올라가 인스턴스화된 것예)프로그램: 구글 크롬 프로그램 exe 와 같은 실행 파일프로세스: exe를 두 번 클릭하면 프로세스로 변환됨프로그램을 만드는 과정은 언어마다 상.. 2025. 2. 17.