프로필사진

Paper Tale/Top ML Papers of the Week

🥇 이주의 ML 논문 (2023-04-10 ~ 2023-04-16)

다각 2023. 12. 17. 23:15

1) Zip-NeRF - mip-NeRF 360과 그리드 기반 모델을 결합하여 mip-NeRF 360보다 22배 빠르게 학습될 수 있도록 NeRF를 개선 (paper | tweet)

2) LLMs as Generative Agents - LLM을 확장하여 인간과 유사한 행동을 시뮬레이션할 수 있는 에이전트를 구축하는 아키텍처를 제안. 에이전트의 경험을 완전한 기록으로 저장하고 시간에 따라 기억을 고찰(reflecion)로 합성하며, 행동을 계획하기 위해 이를 동적으로 검색하는 것이 가능 (paper | tweet)

3) Scientific Research Capabilities of LLMs - 에이전트와 LLM을 결합하여 과학적 실험의 자율적인 설계, 계획 및 실행을 가능하게 함. 촉매된 크로스-커플링 반응(catalyzed cross-coupling reactions) 성공적인 수행과 같은활발한 과학적 연구 능력을 보임 (paper | tweet)

4) Automatic Gradient Descent - 신경 구조(neural architecture)를 명시적으로 활용하는 최적화 알고리즘을 유도. ImageNet 규모에서 CNN을 훈련시키는 하이퍼파라미터 없는 1차적인 옵티마이저를 제안 (paper | tweet)

5) ChemCrow - 합성, 약물 발견 및 소재 설계 작업을 수행하는 LLM 화학 에이전트를 제시. 13개의 전문가 디자인 도구를 통합하여 LLM의 화학 영역 성능을 향상시키고 화학 작업 자동화의 효과를 증명함 (paper | tweet)

6) A Survey of ChatGPT and GPT-4 (paper | tweet)

7) OpenAGI - 복잡한 다단계 작업을 해결하기 위해 다양한 도메인 전문가 모델을 조정하는 LLM의 개발과 평가를 용이하게 하는 오픈 소스 연구 플랫폼 (paper | tweet)

8) AGIEval - 인간 중심의 표준 시험(human-centric standardized exam) 관점에서 기본 모델을 평가하는 새로운 벤치마크로, 대학 입학 시험, 로스쿨 입학 시험, 수학 경시 대회 시험과 같은 시험이 해당됨 (paper | tweet)

9) Teaching LLMs to Self-Debug - LLM에게 퓨샷 예시를 통해 자체 디버깅을 가르치는 방법을 제안. 이를 통해 모델은 생성된 코드를 자연어로 설명하여 자신의 실수를 식별할 수 있으며, 텍스트-SQL 생성과 같은 여러 코드 생성 작업에서 SoTA를 달성함 (paper | tweet)

10) Segment Everything Everywhere All at Once - 프롬프트를 입력 가능하고 상호작용 가능한 모델로, 개방 어휘(open-vocabulary)나 대화식 세그멘테이션(interative segmentation) 벤치마크에서 다양한 세그멘테이션 작업을 수행할 시 경쟁력 있는 성능을 보임 (paper | tweet)

 

 

 


위 글은 NLP Newsletter by Elvis에서 게재를 허락 받고 가져와 번역한 글이며, 원문은 The top ML Papers of the Week (Apr 10 - Apr 16)에서 확인할 수 있습니다.