Modelin kod adı “Strawberry” olarak belirlendi. OpenAI, o1 modelinin zorlu fizik, kimya ve biyoloji görevlerinde, yüksek lisans öğrencileri seviyesinde performans gösterdiğini bildirdi. Ayrıca, matematik ve kodlama alanlarında da başarılı sonuçlar elde etti. Model, Uluslararası Matematik Olimpiyatı (IMO) sınavında test edildi. Bu sınavda, altı zor algoritma problemini çözmek için 10 saat süre verildi ve her problem için 50 çözüm hakkı tanındı. 

O1 modeli, bu testlerde sorunların yüzde 83'ünü çözerken, GPT-4o yalnızca yüzde 13’ünü çözebildi.

Eksiklikler ve Maliyetler

Ancak, yeni model bazı önemli özelliklerden yoksun. Örneğin, ChatGPT'de bulunan internet taraması ve dosya ile görüntü yükleme özellikleri bulunmuyor. Ayrıca, modelin görüntü analiz yetenekleri de ek testler için devre dışı bırakılmış durumda.

Maliyet açısından da model, GPT-4o’nun yaklaşık üç katı fiyatına sahip. O1-preview, 1 milyon giriş token’i için 15 dolar (13,50 Euro) ve 1 milyon çıkış token’i için 60 dolar (54 Euro) olarak fiyatlandırıldı. Token'lar, ham verileri temsil eder ve 1 milyon token yaklaşık 750,000 kelimeye denk gelir.

Modelin kullanıcılar tarafından yapılan testlerde “hayal görme” eğiliminde olduğu ve GPT-4o'ya kıyasla sorulara yanıt verememe durumunu daha az kabul ettiği belirtiliyor. OpenAI'nin kurucu ortağı ve CEO'su Sam Altman, o1 modelinin hala “kusurlu” olduğunu ve ilk kullanımda etkileyici görünse de daha uzun süreli kullanımlarda aynı etkiyi göstermediğini belirtti.

Google’a 'Chrome’ şoku: ABD Adalet Bakanlığı satış için yargıca başvuruyor Google’a 'Chrome’ şoku: ABD Adalet Bakanlığı satış için yargıca başvuruyor

Düşünce Zinciri’ Yöntemi

OpenAI, o1 modelinin “bir soruya yanıt vermeden önce uzun süre düşünme” şeklinde çalışan bir “düşünce zinciri” yöntemi kullandığını ifade etti. Ancak, bu yöntemin nasıl çalıştığı konusunda detaylı bilgi verilmedi. Şirket, modelin “düşünce zinciri” özetlerini gösterdi.

OpenAI, AI güvenliği taahhütlerini ilerletmek amacıyla ABD ve Birleşik Krallık’taki AI Güvenlik Enstitüleri ile anlaşmalar yaptığını ve bu enstitülere modelin kamuya sunulmadan önce erken erişim sağladığını açıkladı.

Kaynak: Haber Merkezi