컨텐츠
하버드와 구글, AI 훈련 데이터셋으로 100만 권의 공공 도메인 도서 공개
2025-03-04 14:30
언젠가 읽기
Harvard, Google, AI 학습 위한 백만 권 서적 공개
- 배경: AI 학습 데이터의 높은 비용 문제 발생
- 공개 계획: 하버드 대학교, 100만 권의 공공 도메인 서적 공개 예정
- 데이터셋 내용: 디킨스, 단테, 셰익스피어 작품 포함
- 목적: AI 모델 훈련 위해 광범위한 텍스트 데이터 제공 목표
참고 자료
- AI Training Data 중요성 강조
- 공공 도메인 이점 설명
- Google AI 이니셔티브 소개