RAFT 훑어보기
논문: RAFT: Adapting Language Model to Domain Specific RAG 저자: Tianjun Zhang, Shishir G. Patil, Naman Jain, Sheng Shen, Matei Zaharia, Ion Stoica, Joseph E. Gonzalez 소속: UC Berkeley 코드: https:/...
논문: RAFT: Adapting Language Model to Domain Specific RAG 저자: Tianjun Zhang, Shishir G. Patil, Naman Jain, Sheng Shen, Matei Zaharia, Ion Stoica, Joseph E. Gonzalez 소속: UC Berkeley 코드: https:/...
논문: Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models GitHub: https://github.com/lichao-sun/SoraReview WebSite: https://sora.com/ 🔍 Sora란? So...
Website: https://deepmind.google/technologies/veo/veo-2/ 최근 AI 영상 생성 분야에 혁신을 불러온 Veo 2는 DeepMind가 선보인 최첨단 비디오 생성 모델입니다. 🔍 Veo 2란? Veo 2는 DeepMind가 개발한 최첨단 비디오 생성 모델로, 단순한 텍스트 프롬프트만으로도 사실적인 모션과...
Whisk: https://labs.google/fx/tools/whisk Google Labs 블로그: Whisk: Visualize and remix ideas using images and AI 서론 ✨ Google Whisk는 구글 랩스에서 선보인 최신 생성형 AI 실험 도구로, 사용자가 복잡한 텍스트 프롬프트 없이 이미지...
🔍 Data Formulator 2란? Data Formulator 2는 AI를 활용하여 데이터 변환과 시각화 과정을 자동화하고 최적화하는 최신 데이터 분석 도구입니다. 기존 데이터 시각화 툴과 달리 사용자 인터페이스(UI)와 자연어 입력(NL)을 결합하여 보다 직관적인 데이터 분석 환경을 제공합니다. 특히, 반복적인 데이터 변환과 차트 생성이 필요한...
논문: InternVideo: General Video Foundation Models via Generative and Discriminative Learning GitHub: InternVideo 공식 저장소 Papers with Code Benchmarks: Kinetics-400 Something-Somet...
논문: End-to-End Semi-Supervised Object Detection with Soft Teacher GitHub 코드: SoftTeacher 공식 저장소 Papers with Code Benchmarks: COCO 1% COCO 5% COCO 10% ...
논문: HunyuanVideo: A Systematic Framework for Large Video Generative Models GitHub: https://github.com/Tencent/HunyuanVideo Demo: HunyuanVideo Playground Hugging Face 모델: HunyuanVideo on Huggi...
논문: LLMs can see and hear without any training Github: https://github.com/facebookresearch/MILS 🔍 MILS란? MILS (Multimodal Iterative LLM Solver)은 추가 학습 없이 대형 언어 모델(LLM)을 활용하여 이미지, 비디오, 오디오 캡션 ...
논문: MoAI: Mixture of All Intelligence for Large Language and Vision Models Github: https://github.com/ByungKwanLee/MoAI 🔍 MoAI란? MoAI(Mixture of All Intelligence)는 기존 LLVM(Large Language an...