본문 바로가기

분류 전체보기59

[Fortnightly Tech Digest] First Half of March 3월 1-2주차 주요 뉴스Gemini Embedding by Google DeepMind갑자기 바빠져서,, 사실상 Fortnightly가 아니라 Monthly가 된 것 같지만😂 어쨌든 소식을 물고 왔습니다..오늘 포스트는 죄송하지만.. 참고문헌 표기법을 무시하고ㅜㅜ 작성하겠습니다.. 흑흑Gemini Embedding by Google DeepMindGemini는 (슬프게도 쓰는 사람을 거의 못 봤지만ㅜㅜ) 구글이 ChatGPT에 대항해(?) 내놓은 인공지능 모델이죠. 이미 나온 지 한참 됐는데, 이번에 공개된 Embedding 모델이라는 것은 무엇일까요?AI 모델이 어떤 입력(텍스트든, 이미지든)을 처리하기 위해서는, 입력을 적절한 숫자 형태로 바꿔줘야 합니다. 그런데 딸랑 숫자 하나로 나타낼 수 있는.. 2025. 3. 15.
[Fortnightly Tech Digest] Special Topic: Reasoning Model 오늘은 LLM 연구에서 핫한 주제인 추론(reasoning)에 대해 다뤄보려고 합니다. DeepSeek R1을 비롯해 많은 연구자들이 주목하고 있는 LLM의 강점(?)인데, LLM 연구의 맥락에서 추론이란 무엇인지, 어떻게 추론 능력을 향상시키는지 살펴보려고 해요. *이 포스트는 Substack.com의 Ahead of AI 소식지[1]를 참고하여 작성하였습니다.**틀린 부분이 (많이) 있을 수도 있습니다. 가감없이 피드백 부탁드립니다..What is Reasoning?서두에서 언급했다시피, reasoning을 직역하면 추론입니다. 추론은 사전적 정의에 따르면 '미루어 생각하여 논'하는 능력을 말하는데요, 이걸 LLM에게 가르친다면 가장 중요한 포인트는 '생각'이 되겠네요. 즉 LLM과 자연어처리의 맥락.. 2025. 2. 13.
[Fortnightly Tech Digest] New Year's Edition 1월 4-5주차 주요 뉴스DeepSeek R1 crushing AmericaStargate: Trump's Ambition on AI(Paper) Murre: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQLTech News BriefingThe DeepSeek Effect얼마 전 AI의 신흥 강자가 나와 미국의 빅 테크와 주식 시장을 쑥대밭으로 만들어 놓았습니다. DeepSeek 사의 최신 모델 DeepSeek-R1(이하 R1)인데요, 다양한 벤치마크에서 o1은 물론 다른 모델들보다도 월등히 뛰어난 성능을 보여주고 있어요. R1은 기존 모델들과 아래와 같은 점에서 차별점을 가져요[1, 2].모델 이름에서 R은 강화학습(Reinforc.. 2025. 2. 1.
[Fortnightly Tech Digest] Year-End to New Beginnings 12월 4주차 ~ 1월 1주차 주요 뉴스The Future of AI (@ NeurIPS 2024 Talks) by Ilya SutskeverAI & Privacy (feat. Apple)ModernBERT by Answer.AITech News BriefingThe Future of AI*이 단락은 일간 뉴스레터 The Neuron의 12월 20일자 포스트를 참고하여 작성하였습니다[1].일리야 서츠케버는 OpenAI의 공동창립자이자 SSI Inc.의 설립자입니다. 24년 노벨 물리학상의 수상자인 제프리 힌턴의 지도학생이기도 했어요. 아무튼 이 사람이 최근에 열린 NeurIPS 2024에서 AI의 미래에 대해 토크를 했었어요. 짧은 토크이기는 하지만 그래도 AI 전문가가 직접 제시하는 AI의 전망이라는 .. 2025. 1. 5.
[Fortnightly Tech Digest] December's First Half 12월 전반기 주요 뉴스Google 양자칩 Willow 공개기업들의 AI 사용 통계Meta의 Agent-as-a-Judge이번 뉴스레터부터는 Tech News Briefing 섹션과 Papers Overview 섹션 두 단락으로 나누어서 써보려고 합니다.Tech News BriefingGoogle's Willow구글이 9일 양자칩 Willow를 공개했습니다. 현존하는 연산이 가장 빠른 슈퍼컴퓨터가 10자($10^{25}$)년 걸리는 계산을 단 5분내로 해낸다고 해요[1]. 양자컴퓨터, 양자칩에 대해서는 저도 문외한이라 찾아보았는데요, 우선 양자컴퓨팅이란 쉽게 말해 '초고속 연산을 위해 양자역학의 개념을 적용한 컴퓨팅 기술'을 일컫습니다. 이걸 이해하기 위해 양자역학까지 공부할 순 없으니, 우리는 속성으로.. 2024. 12. 22.
[Fortnightly Tech Digest] Emergency Leave 혼란한 시국이라 이번 편은 쉬어가겠습니다.. 뒤틀린 것도 바로잡고 녹슨 것도 걷어내어 조속히 정세가 안정화되었으면 좋겠네요. 굳이 포스트 작성한 이유: 내가 공부하려고 시작한 뉴스레터니까^^.. 2024. 12. 9.