RAFT 훑어보기

논문: RAFT: Adapting Language Model to Domain Specific RAG 저자: Tianjun Zhang, Shishir G. Patil, Naman Jain, Sheng Shen, Matei Zaharia, Ion Stoica, Joseph E. Gonzalez 소속: UC Berkeley 코드: https:/...

Feb 20, 2025 paper

Sora 훑어보기

논문: Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models GitHub: https://github.com/lichao-sun/SoraReview WebSite: https://sora.com/ 🔍 Sora란? So...

Feb 19, 2025 paper

Google Veo2 훑어보기

Website: https://deepmind.google/technologies/veo/veo-2/ 최근 AI 영상 생성 분야에 혁신을 불러온 Veo 2는 DeepMind가 선보인 최첨단 비디오 생성 모델입니다. 🔍 Veo 2란? Veo 2는 DeepMind가 개발한 최첨단 비디오 생성 모델로, 단순한 텍스트 프롬프트만으로도 사실적인 모션과...

Feb 17, 2025 paper

Google Whisk 훑어보기

Whisk: https://labs.google/fx/tools/whisk Google Labs 블로그: Whisk: Visualize and remix ideas using images and AI 서론 ✨ Google Whisk는 구글 랩스에서 선보인 최신 생성형 AI 실험 도구로, 사용자가 복잡한 텍스트 프롬프트 없이 이미지...

Feb 17, 2025 paper

Data Formulator 2: AI 기반 반복적 데이터 시각화 자동화

🔍 Data Formulator 2란? Data Formulator 2는 AI를 활용하여 데이터 변환과 시각화 과정을 자동화하고 최적화하는 최신 데이터 분석 도구입니다. 기존 데이터 시각화 툴과 달리 사용자 인터페이스(UI)와 자연어 입력(NL)을 결합하여 보다 직관적인 데이터 분석 환경을 제공합니다. 특히, 반복적인 데이터 변환과 차트 생성이 필요한...

Feb 17, 2025 paper

InternVideo 톺아보기

논문: InternVideo: General Video Foundation Models via Generative and Discriminative Learning GitHub: InternVideo 공식 저장소 Papers with Code Benchmarks: Kinetics-400 Something-Somet...

Feb 16, 2025 paper

Soft Teacher 톺아보기: 반지도 객체 탐지의 새로운 기준

논문: End-to-End Semi-Supervised Object Detection with Soft Teacher GitHub 코드: SoftTeacher 공식 저장소 Papers with Code Benchmarks: COCO 1% COCO 5% COCO 10% ...

Feb 15, 2025 paper

HunyuanVideo 톺아보기: 오픈소스 비디오 생성 모델의 새로운 기준

논문: HunyuanVideo: A Systematic Framework for Large Video Generative Models GitHub: https://github.com/Tencent/HunyuanVideo Demo: HunyuanVideo Playground Hugging Face 모델: HunyuanVideo on Huggi...

Feb 14, 2025 AI,, Video, Generation

MILS 톺아보기

논문: LLMs can see and hear without any training Github: https://github.com/facebookresearch/MILS 🔍 MILS란? MILS (Multimodal Iterative LLM Solver)은 추가 학습 없이 대형 언어 모델(LLM)을 활용하여 이미지, 비디오, 오디오 캡션 ...

Feb 13, 2025 paper

MoAI 톺아보기: 차세대 멀티모달 AI 모델

논문: MoAI: Mixture of All Intelligence for Large Language and Vision Models Github: https://github.com/ByungKwanLee/MoAI 🔍 MoAI란? MoAI(Mixture of All Intelligence)는 기존 LLVM(Large Language an...

Feb 12, 2025 paper