일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 팀네이버
- 윤성우
- 코드트리
- 파이썬
- HSAT
- reinforcement learning
- 진지한파이썬
- #코드트리 #코딩테스트 #코드트리조별과제
- docker
- 팀네이버2024
- 서평
- 코드트리조별과제
- GenAI
- 윤성우의열혈파이썬
- o1
- 엘리스 AI Edu Hackathon
- 청년주택드림청약통장
- C++
- deepseek
- 토스
- 코딩테스트
- grpo
- Slash
- ImageGeneration
- 오렌지미디어
- 개발자컨퍼런스
- 도커
- IJCAI
- AutoRL
- SeriousPython
Archives
- Today
- Total
목록grpo (1)
코딩하는 임초얀
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bGJTxo/btsLZfo5LpA/zbfLkTbrc4ZwpfpmGxh0i1/img.png)
Takeaway with Perplexity1. 복잡한 검색 알고리즘 없이도 강력한 AI 추론 모델을 만들 수 있다는 것이 입증됨.2. RL만으로도 AI가 자발적인 추론 능력을 개발할 수 있음.3. 대규모 컴퓨팅 자원 없이도 개인이나 소규모 팀이 추론 모델을 개발할 수 있는 가능성이 열림.4. 간단한 검증 시스템만으로도 효과적인 AI 훈련이 가능함을 보여줌. 원문 링크https://www.linkedin.com/posts/andrew-iain-jardine_deepseek-ais-r1-research-report-reveals-activity-7287457792418820097-z0Xb/ LinkedIn Andrew Jardine 페이지: DeepSeek AI's R1 research report re..
Studies/LinkedIn
2025. 1. 23. 16:03