OpenAI’nin GPT-4’ü eğitmek için bir milyon saatten fazla YouTube videosunu metne döktüğü ortaya çıktı. Bu gelişme, YouTube CEO’su Neal Mohan’ın, YouTube videolarını AI eğitimi için metin haline getirmenin politikalarını ihlal edeceğini belirtmesinden sadece birkaç gün sonra geldi.
Mohan, geçen hafta Bloomberg’e verdiği röportajda, “Bir içerik oluşturucu, platformumuza içerik yüklediğinde belirli beklentilere sahiptir. Bu beklentilerden biri de hizmet şartlarına uyulmasıdır” dedi ve “Ancak transkript veya video parçaları gibi şeylerin indirilmesine izin vermiyoruz” şeklinde konuştu.
New York Times’ın raporuna göre, OpenAI ekibi üyeleri, başkanları Greg Brockman da dahil olmak üzere, YouTube videolarını toplamak için kişisel olarak çaba gösterdi. Rapor ayrıca, OpenAI’nin yanı sıra birçok teknoloji şirketinin, devasa yapay zeka modellerini eğitmek için yeterli veri toplamanın zorluklarını detaylarıyla ele alıyor. OpenAI’nin, GPT-4’ü eğitmek için daha fazla veri toplamak amacıyla yapay zeka transkripsiyon yazılımı Whisper’ı kullandığı iddia ediliyor.
OpenAI ve Google, Gizmodo’nun yorum taleplerine henüz yanıt vermedi.
Bu raporun, OpenAI ve Google gibi şirketlerin yapay zeka gelişimindeki mücadelesini önemli ölçüde etkileyebileceği belirtiliyor. Google’ın, OpenAI’nin ChatGPT’yi daha da geliştirmek için içeriği kullanmasına sessiz kalması pek olası görünmüyor. Ancak Google henüz böyle bir iddiada bulunmadı. Bir Google sözcüsü, The Verge’e yaptığı açıklamada sadece OpenAI’nin eğitimi hakkında “doğrulanmamış raporlar gördüğünü” ifade etti.
YouTube’un hizmet şartları, izin almadan herhangi bir kullanıcının içeriğini indirmesini yasaklıyor. Ayrıca içeriğin, hizmetin “bağımsız” kullanımı için kullanılmasını da yasaklıyor.
OpenAI’nin Baş Teknoloji Sorumlusu Mira Murati, Mart ayında The Wall Street Journal’a yaptığı açıklamada YouTube videolarının kullanılıp kullanılmadığı konusunda emin olmadığını belirtti. Ancak New York Times’ın raporunda bu konuya doğrudan değinilmiyor.
New York Times şu anda OpenAI ile bir telif hakkı savaşı içinde bulunuyor. OpenAI ve Meta ayrıca, yapay zekalarını telif hakkıyla korunan çalışmalar konusunda bir dizi yazar ve içerik evi tarafından dava ediliyor.