Bilim ve teknoloji

OpenAI, yeni Multimodal Yapay Zeka Modeli'ni tanıtabilir

OpenAI, kullanıcılarla konuşabilen ve nesneleri tanıyabilen yeni birçok modlu (multimodal) yapay zeka modelini tanıtmaya başladı. The Information'ın haberine göre, bu yeni model, şirketin bugün duyurmayı planladığı bir ürünün parçası olabilir.

Abone Ol

Fatih Bekir Öztürk - Muhabir 

Yeni model, mevcut transkripsiyon ve metinden sese modellere kıyasla daha hızlı ve daha doğru görüntü ve ses yorumlaması sunuyor. Bu, müşteri hizmetleri temsilcilerinin arayanların ses tonlamalarını veya alaycılık içeren ifadelerini daha iyi anlamalarına yardımcı olabilir. Ayrıca, teorik olarak modelin matematik konusunda öğrencilere yardımcı olabileceği ve gerçek dünyadaki işaretleri tercüme edebileceği belirtiliyor.

OpenAI'DA GERÇEK ZAMANLI SES VE VİDEO SUNUCULARI

Geliştirici Ananay Arora'nın X'te paylaştığı gönderiye göre; ChatGPT'nin içinden telefon aramaları gerçekleştirmek üzere çalışıyor olması ve OpenAI'ın gerçek zamanlı ses ve video iletişimi için sunucular hazırladığına dair ipuçları bulunuyor.

Ancak, OpenAI CEO'su, yaklaşan duyurunun GPT-4'ten daha iyi olması beklenen bir modelle bir ilgisi olmadığını belirtti. Bununla birlikte, GPT-5'in yıl sonuna kadar kamuoyuna açıklanabileceği belirtiliyor.

Diğer yandan, OpenAI'ın yapay zeka arama motorunu Google I/O etkinliğinden önce tanıtacağı bilgisi paylaşılmıştı. Bu durum, şirketin Google ile rekabetine yeni bir boyut kazandırabilir. Google'ın da telefon görüşmeleri yapmak için yapay zeka kullanmayı test ettiği ve Pixie isimli bir çok modlu Google Asistan alternatifi üzerinde çalıştığı biliniyor. Pixie, bir cihazın kamerası aracılığıyla nesnelere bakarak kullanıcıları bu nesneleri satın alabilecekleri yerlere yönlendiriyor.