본문 바로가기

coursework19

LEC06: Agents for Software Development w/ Graham Neubig 뭔가 이미 잘 정리된 파워포인트를 가지고 또 내용을 정리하는 건 무의미할 것 같아서.. 그 강의에서 다룬 논문이나 플젝을 살펴보는 것으로 하겠음ㅎ 이번 강의는 code generation을 주로 다루고 있어서, 그 중에서도 SWE-bench에 대해 조금 더 찾아보았어요. 아래는 공식 사이트에서 다루고 있는 타임라인입니다.📣 [10/2024] Introducing SWE-bench Multimodal! Can AI systems "see" bugs and fix them? 👀 💻📣 [08/2024] SWE-bench x OpenAI = SWE-bench Verified, a human-validated subset of 500 problems reviewed by software engineers!.. 2024. 10. 27.
LEC05: Compound AI Systems & the DSPy Framework w/ Omar Khattab Compound AI System처음 들어보는 개념이라 메모메모📝사람과 마찬가지로 AI 또한 오류로부터 자유롭지 못한데, 단일체 AI의 경우에는 이러한 오류를 잡기 위한 디버깅이 까다롭기 때문에 통제 및 제어가 매우 어렵다고 해요. 그래서 여러 AI가 각각 특화된 구성요소 하나로서 동작하는 모듈러 시스템을 만들겠다는 의미예요. 쉽게 말해, 모든 태스크를 하나의 AI로 해결하는 대신 태스크를 세분화해서 각각 하나의 AI에게 맡기겠다는 거죠. RAG(Retrieval-Augmented Generation)도 이러한 예시 중 하나예요. 어떤 질문이 들어왔을 때, 물론 요즘 LLM은 워낙 방대한 양의 데이터로 학습해서 굳이 RAG 없이도 동작할 수 있지만.. 자사의 비공개 문서들에서 정보를 찾아야 하는 경우 .. 2024. 10. 20.
LEC04: Enterprise Trends for Generative AI w/ Burak Gokturk 네 번째 강의까지 듣고 나니 이 수업이 왜 MOOC일 수밖에 없었는지 조금이나마 이해가 갑니다.. 한 분야의 권위자들이 진행하는 1시간짜리 Ted Talks를 매주 듣기 때문에 현재 연구의 트렌드를 알기엔 제격이지만 단계적인 '커리큘럼'이라는 것이 없어서 넓고 얕게 LLM Agent 관련 지식을 음미하는 느낌? 이번 강연의 연사는 구글 클라우드에서 일하는 AI/ML 엔지니어 Gokturk입니다. 따라서 DeepMind 출신의 연사들의 강연과 달리, 제목처럼 좀 enterprise 측면에서의 LLM Agent를 엿볼 수 있었어요. LLM Evolution & Gemini강연 초반에서는 최근에 있었던 LLM의 비약적 발전을 짧게 언급하고 있습니다. 트랜스포머의 등장부터 Next token prediction.. 2024. 10. 12.
LEC03 Agentic AI Frameworks & AutoGen / Building a Multimodal Knowledge Assistant (Chi Wang & Jerry Liu) 하 연사들 라인업 무슨 일이지.. 각각 DeepMind와 LlamaIndex에서 나오심ㅜㅜAgentic AI Frameworks & AutoGen w/ Chi Wang영상 초반에 AI agent로 huggingface 모델 explore&download하는 웹사이트 만드는 거 보여줬다.. 진짜 미친 듯Agentic AI Framework로 기대하는 건 다음과 같다:유저의 프롬프트가 주어지면 commander, writer, 그리고 safeguard처럼 여러 agent간의 interaction —role-playing이라고도 하는 듯— 으로 구성되는 프레임 워크 => 사람의 개입 없이도 직관적인 프로그램 구조로 자동화를 가능하게 함! 연사 Wang은 특히 agentic programming, 즉 agent.. 2024. 10. 2.
LEC02: LLM Agents: brief history and overview w/ Shunyu Yao AgentsAgent: 주어진 환경(environment)에서의 증거(evidence)를 관찰함으로써(observation) 정보를 얻고 이에 따라 행동(action)을 취하는 지능(intelligence)를 통칭하는 말그렇다면 LLM agent는 다른 건 다 똑같고 결국 이 '지능'을 LLM으로 활용한다는 의미인데.. Yao 씨는 이를 설명하기 위해 Text agent라는 더 큰 범주의 agent부터 설명을 합니다.Reasoning Agent ⊂ LLM Agent ⊂ Text Agent요런 느낌이라고 해도 괜찮을라나.. 가장 오른쪽의 예시가 예전에 화제였던 상담챗봇 Eliza니까 이렇게 말해도 괜찮을 것 같음 ELIZA나 LSTM-DQN에 비해 LLM Agent가 좀 더 유망한 이유는, 특정 도메인에 .. 2024. 9. 30.
LEC01: LLM Reasoning w/ Denny Zhou 내맘대로 편하게 note-taking 할 것임~ LLM이란?- Zhou: 다음 토큰을 예측하도록 학습된 트랜스포머 모델을 통칭하는 말; - 근데 여기서 파라미터 수가 대체로 billion, 즉 10억은 넘어가는 편이라는 전제는 덧붙여야 할 듯함.. '거대' 언어 모델이니까.. Few-shot prompt에도 오류를 내던 LLM이, 그 few-shot prompt에 reasoning 과정을 추가해주자 one-shot만으로도 100%의 acuuracy를 달성함! 즉, 답을 내기까지의 중간단계를 어떻게 LLM에게 학습시킬 수 있는지가 하나의 중요한 문제로 대두됨. Least-to-Most Prompting (Zhou et al., 2023)핵심 아이디어: decompose-and-recombine, 즉 하나의.. 2024. 9. 27.