컨텐츠

하버드와 구글, AI 훈련 데이터셋으로 100만 권의 공공 도메인 도서 공개

2025-03-04 14:30 언젠가 읽기

Harvard, Google, AI 학습 위한 백만 권 서적 공개

  • 배경: AI 학습 데이터의 높은 비용 문제 발생
  • 공개 계획: 하버드 대학교, 100만 권의 공공 도메인 서적 공개 예정
  • 데이터셋 내용: 디킨스, 단테, 셰익스피어 작품 포함
  • 목적: AI 모델 훈련 위해 광범위한 텍스트 데이터 제공 목표

참고 자료

  • AI Training Data 중요성 강조
  • 공공 도메인 이점 설명
  • Google AI 이니셔티브 소개
푸딩캠프 뉴스레터를 구독하면 학습과 성장, 기술에 관해 요약된 컨텐츠를 매주 편하게 받아보실 수 있습니다.