프로필사진

전체 글 83

🥇 이주의 ML 논문 (2023-06-19 ~ 2023-06-25)

1) Textbooks Are All You Need - phi-1이라는 1.3B 파라미터 규모의 LLM 소개. 사이즈가 작은 모델로, 교과서 품질의 데이터와 GPT-3.5로 생성한 합성 교과서 및 연습 문제를 사용하여 4일 동안 훈련. HumanEval 벤치마크에서 유망한 결과를 달성함 (paper | tweet) 2) RoboCat - 다양한 로봇 팔을 조작할 수 있는 새로운 기초 에이전트로, 최소 100개의 시연만으로도 작업을 해결할 수 있음. 이러한 self-inproving AI 에이전트는 새로운 훈련 데이터를 자체 생성하여 기술을 향상시키고 새로운 작업에 적응하는 데 더 효율적으로 만들어줌 (paper | tweet) 3) ClinicalGPT - 의료기록, 도메인 특화 지식, 다중 회차 대화..

🥇 이주의 ML 논문 (2023-06-12 ~ 2023-06-18)

1) Voicebox - 올인원 생성 음성 모델로, 6개 언어의 음성을 합성할 수 있음. 노이즈 제거, 콘텐츠 편집, 스타일 변환 등을 수행할 수 있으며, 현재 모델보다 20배 빠름. in-context learning을 이용하면 단일 목적 모델의 성능을 능가 (paper | tweet)  2) FinGPT - 금융 분야를 위한 오픈 소스 LLM으로, 연구자와 실무자에게 FinLLM을 개발하기 위한 접근 가능한 리소스를 제공하는 데이터 중심 접근 방식을 취함 (paper | tweet)  3) Crowd Workers Widely Use Large Language Models for Text Production Tasks - MTurk의 크라우드 워커 중 33~46%가 텍스트 제작 작업을 완료할 때 LL..

🍞 오늘의 AI 논문 [2024-02-12]

[1/95] Understanding the Weakness of Large Language Model Agents within a Complex Android Environment Keywords: task_evaluation_androidarena, planning_llm_agents, challenges_motivate_androidarena Abstract: 대규모 언어 모델(LLM)은 지능형 에이전트가 브라우저나 게임과 같은 도메인별 소프트웨어 내에서 복잡한 작업을 실행할 수 있는 역량을 강화해 왔습니다. 하지만 운영 체제와 같은 범용 소프트웨어 시스템에 적용할 경우 LLM 에이전트는 세 가지 주요 과제에 직면하게 됩니다. 첫째, 작업 공간이 방대하고 동적이기 때문에 LLM 에이전트가 최신 상태..

🍞 오늘의 AI 논문 [2024-02-07]

[1/134] Can Generative Agents Predict Emotion? Keywords: emotion_creation_agent, emotion_creation, agent_capturing_emotional Abstract: 대규모 언어 모델(LLM)은 인간과 유사한 여러 가지 능력을 보여줬지만, LLM의 공감적 이해와 감정 상태는 아직 인간에 미치지 못합니다. 이 연구에서는 새로운 사건을 인지할 때 생성형 LLM 에이전트의 감정 상태가 어떻게 진화하는지를 조사하여 새로운 경험을 과거의 기억과 비교하는 새로운 아키텍처를 도입했습니다. 이러한 비교를 통해 에이전트는 감정 평가 이론에 따르면 감정 생성에 필수적인 새로운 경험을 맥락에서 이해할 수 있는 능력을 얻게 됩니다. 먼저 에이전트는 새..

🍞 오늘의 AI 논문 [2024-02-05]

[1/99] Natural Counterfactuals With Necessary Backtracking Keywords: refines_counterfactual_reasoning, generate_natural_counterfactuals, generating_counterfactuals_natural Abstract: 사실과 반대되는 추론은 인간의 인지 능력에서 중추적인 역할을 하며, 특히 설명을 제공하고 의사 결정을 내리는 데 중요합니다. 유다 펄의 영향력 있는 접근 방식은 이론적으로는 우아하지만, 역설적 시나리오를 생성하려면 실제 시나리오와 너무 동떨어진 개입이 필요해 실현 불가능한 경우가 많습니다. 이에 따라 크리테오에서는 자연스러운 반대 시나리오의 프레임워크와 실제 세계의 데이터 분포와 관련..

🍞 오늘의 AI 논문 [2024-02-02]

[1/106] FM3Q: Factorized Multi-Agent MiniMax Q-Learning for Two-Team Zero-Sum Markov Game Keywords: multi_agent_minimax, agent_minimax_learning, multi_agent_reinforcement Abstract: 많은 실제 애플리케이션에는 두 팀으로 나뉘는 일부 에이전트가 포함되며, 같은 팀 내에서는 보상이 같지만 상대 팀에서는 반대 부호를 갖습니다. 이른바 두 팀 제로섬 마르코프 게임(2t0sMG)은 최근 강화 학습으로 해결할 수 있습니다. 그러나 기존 방법은 팀 내 신용 할당, 데이터 활용, 계산 난해성 등을 충분히 고려하지 않아 비효율적입니다. 본 논문에서는 2t0sMG에서 Q 함수를 통해..

🍞 오늘의 AI 논문 [2024-02-01]

[1/76] SDRDPy: An application to graphically visualize the knowledge obtained with supervised descriptive rule algorithms Keywords: descriptive_rule_discovery, rule_discovery, sdrdpy Abstract: SDRDPy는 전문가가 모든 지도 설명 규칙 검색 알고리즘으로 추출한 지식을 직관적인 그래픽과 표로 표현할 수 있는 데스크톱 애플리케이션입니다. 이 애플리케이션은 알고리즘이 실행된 도구에 관계없이 데이터 세트의 관련 정보와 규칙, 데이터 및 각 규칙에 연결된 품질 측정값 간의 관계를 보여주는 데이터 분석을 제공할 수 있습니다. 모든 정보는 전문가 분석과 다양한 형식..

🍞 오늘의 AI 논문 [2024-01-31]

[1/77] Layered and Staged Monte Carlo Tree Search for SMT Strategy Synthesis Keywords: smt_strategy_synthesis, modern_smt_solvers, automatic_smt_strategy Abstract: Z3와 같은 최신 SMT 솔버는 사용자가 제어 가능한 전략을 제공하여 사용자가 고유한 인스턴스 세트에 맞게 전략을 조정할 수 있으므로 사용 사례에 맞는 솔버 성능을 크게 향상시킬 수 있습니다. 그러나 이러한 전략 커스터마이징 접근 방식은 중요한 과제를 안고 있는데, SMT 인스턴스 클래스에 최적화된 전략을 직접 제작하는 것은 솔버 개발자와 사용자 모두에게 복잡하고 까다로운 작업으로 남아 있습니다. 이 논문에서는 새로..

🍞 오늘의 AI 논문 [2024-01-30]

[1/136] Learning to Manipulate under Limited Information Keywords: voting_methods_resistant, voting_methods_borda, manipulate_given_voting Abstract: 사회 선택 이론의 고전적인 결과에 따르면, 합리적인 선호 투표 방법은 때때로 개인에게 불성실한 선호를 보고할 인센티브를 제공합니다. 다양한 투표 방식이 이러한 전략적 조작에 어느 정도 저항력이 있는지는 투표 방식을 비교할 때 중요한 고려 사항이 되었습니다. 여기서는 다양한 크기의 신경망이 다른 유권자가 투표하는 방식에 대한 제한된 정보가 주어졌을 때 특정 투표 방법을 예상대로 수익성 있게 조작하는 방법을 학습할 수 있는지 여부로 조작에 대한 ..

🍞 오늘의 AI 논문 [2024-01-29]

[1/57] SSDOnt: an Ontology for representing Single-Subject Design Studies Keywords: ontology_describing_annotating, results_ontology_provides, ontology_provides Abstract: 배경: 단일 주제 설계는 교육과 생물의학 등 여러 분야에서 사용됩니다. 그러나 이러한 유형의 연구에 대한 정보를 찾는 데 적합한 세분성으로 세부적인 구성과 연구 결과에 주석을 다는 데 적합한 공식 어휘는 존재하지 않습니다. 따라서 이러한 연구 설계에 대한 검색은 해당 연구에 대한 출판물의 초록, 키워드 또는 전체 텍스트에 대한 구문 검색에 크게 의존하고 있으며, 이는 몇 가지 제한 사항을 수반합니다. 목..