GPT-4o 'omni' 50 dilde simultane tercüme yapabilecek

OpenAI, ChatGPT’yi güçlendiren yeni üretken yapay zeka dil modeli GPT-4o ‘omni’ modelini piyasaya sürüyor. GPT-4o kullanıcıların ChatGPT ile daha çok bir asistan gibi etkileşime girmesine olanak tanıyor. 50 dilde simultane tercüme yapabilecek, telefon kamerasıyla çevreyi görüp algılayabilecek, kullanıcılara bir matematik probleminin çözüm sürecine özel öğretmen gibi eşlik edebilecek olan GPT-4o, önümüzdeki birkaç hafta içinde kullanıma sunulacak.

HANDE BERKTAN

OpenAI, bugün bahar güncellemesi etkinliğinde ChatGPT’yi güçlendiren yeni üretken yapay zeka dil modeli, GPT-4o’yu tanıttı.

“o”, modelin metin, konuşma ve videoyu işleme becerisine atıfta bulunan “omni” anlamına geliyor. GPT-4o, önümüzdeki birkaç hafta içinde şirketin geliştirici ve tüketiciye yönelik ürünlerinde kullanıma sunulacak.

50 dilde simultane tercüme yapabilecek, telefon kamerasıyla çevreyi görüp algılayabilecek, kullanıcılara bir matematik probleminin çözüm sürecine özel öğretmen gibi eşlik edebilecek olan GPT-4o, önümüzdeki birkaç hafta içinde kullanıma sunulacak.

OpenAI Baş Teknoloji Sorumlusu Mira Murati, ChatGPT’nin artık bellek yeteneklerine de sahip olacağını, yani kullanıcılarla yapılan önceki görüşmelerden öğrenebileceğini ve gerçek zamanlı çeviri yapabileceğini söyledi. Mira Murati, GPT-4o’nun “GPT-4 düzeyinde” zeka sağladığını ancak GPT-4’ün çeşitli yöntem ve ortamlardaki yeteneklerini geliştirdiğini söyledi.

OpenAI’nin önceki “öncü” en gelişmiş “modeli olan GPT-4 Turbo, görsel ve metin kombinasyonuyla eğitilmişti ve görsellerden metin çıkarmak ve hatta bu görsellerin içeriğini tanımlamak gibi görevleri gerçekleştirmek için görselleri ve metni analiz edebiliyordu. Ancak GPT-4o karışıma konuşmayı da ekliyor.

GPT-4o’un özellikleri neler?

GPT-4o, ChatGPT’nin metin, ses ve sözde görüntü kullanarak etkileşim kurmasını sağlayacak. Bu, kullanıcılar tarafından yüklenen ekran görüntülerini, fotoğrafları, belgeleri veya grafikleri görüntüleyebileceği ve bunlar hakkında bir şeyler söyleyebileceği anlamına geliyor. GPT-4o, metin, ses ve video alanlarında daha hızlı bir şekilde çalışıyor.

Model, kullanıcılarla gerçek zamanlı olarak konuşurken, yetenekleriyle ChatGPT’nin ses modundan ayrışıyor. Bu yetenekler kapsamında model, ses tonlamaları arasındaki farkı ayırt edebiliyor. Aynı şekilde farklı çeşitlerde sesler üretebiliyor. Modelin sesine ifadeler ekleyerek ses tonunu değiştirebildiğini de belirtelim.

Etkinlikte, ChatGPT’nin telefon kamerasıyla çevreyi görebildiği ve algılayabildiği de gösterildi. Verilen bir yazılım kodunu algılayarak, kod hakkında bilgi verebilen ve kod hakkında sorulan sorulara cevap vererek karşılıklı olarak sohbet edilebilen sistem, sesli iletişimde araya girilebildiği için gerçekten bir insanla konuşuyormuş hissiyatı oluşturuyor.

GPT-4o, özel öğretmen gibi matematik problemlerini konuşarak çözebiliyor

GPT-4o, kullanıcılara matematik problemleri çözmede de akıcı bir şekilde konuşarak destek oluyor. Gerçek zamanlı olarak videoları görebilen model, bir matematik probleminin çözüm sürecine eş zamanlı olarak adım adım bir özel öğretmen gibi eşlik etti.

GPT-4o kullanıcıların ChatGPT ile daha çok bir asistan gibi etkileşime girmesine olanak tanıyor.

GPT-4o 50 dilde simultane tercüme yapabilecek

GPT-4o, tercüme yetenekleriyle de öne çıktı. Model etkinlikte İtalyanca ve İngilizce arasında simultane tercüme yaptı. Bu arada model, 50 dili desteklemekte.
Daha akıllı ve 2 kat daha hızlı olduğu belirtilen model, sürpriz şekilde kullanıcılara ücretsiz açılacak sadece ücretsiz kısımda limitler olacak.

Kaynak URL