Yapay zeka alanında son dönemde akıllara zarar gelişmelere şahit oluyoruz. Geçtiğimiz günlerde en büyük güncellemesini alan Google Gemini yapay zeka modelinin ardından OpenAI'da karşı hamleye geçerek metinden video oluşturabilen OpenAI Sora modelini resmi olarak tanıttı.
İki model arasında inceleme fırsatı bulan uzmanlar, teknolojide bu gelişmeyle birlikte bir kritik eşiğin daha aşıldığını belirtti. Adeta sınırları zorlayacak cinsten olan bu videolara bakıldığında yapay zekanın kendisini çok iyi eğittiği görülüyor.
AY'A GİTME YARIŞINA BENZİYOR...
Yapay zekanın bu kadar kısa süre içerisinde metinden video oluşturma aşamasına geldikten sonra, iki şirketin arasındaki mücadeleyi Ay'a gitme yarışına benzetiyoruz.
Google ve OpenAI'ın içerisinde bulunduğu bu kıyasıya rekabet içerisinde yaşanan gelişmeler, gerçeklik algımızın ne şekilde değişeceğini düşündürüyor.
Bildiğiniz gibi yapay zeka alanında ilk atılım yapan şirket OpenAI'dı. Google yarışa geriden katılsa da Gemini ile önemli bir adım atmış oldu.
Gelin iki şirket hakkındaki gelişmeleri de birlikte takip edelim...
GERÇEKLİK ALGIMIZI DEĞİŞTİRECEK: OPENAI SORA'YI TANITTI!
OpenAI, Sora adını verdiği yeni bir video oluşturma modelini tanıttı. Yapay zeka şirketi Sora'nın "metin talimatlarından gerçekçi ve şaşırtıcı sahneler oluşturabildiğini" söylüyor.
Metinden videoya modeli, kullanıcıların yazdıkları talimatlara dayanarak bir dakika uzunluğunda fotogerçekçi videolar oluşturmalarına olanak tanıyor.
OpenAI'nin tanıtım blog yazısına göre Sora, "birden fazla karakter, belirli hareket türleri ve özne ile arka planın doğru ayrıntılarına sahip karmaşık sahneler" oluşturabiliyor.
MODEL, NESNELERİN FİZİKSEL DÜNYADAKİ YERİNİ RAHATLIKLA ALGILIYOR
Şirket ayrıca modelin nesnelerin "fiziksel dünyada nasıl var olduğunu" anlayabildiğini ve "sahne dekorlarını doğru bir şekilde yorumlayabildiğini ve canlı duyguları ifade eden etkileyici karakterler üretebildiğini" belirtiyor.
Birkaç yıl önce, modellerin kelimeleri görüntülere dönüştürme becerisinde ön planda olan Midjourney gibi metinden görüntüye oluşturuculardı.
Ancak son zamanlarda, video dikkat çekici bir hızla gelişmeye başladı: Runway ve Pika gibi şirketler kendi etkileyici metin-video modellerini gösterdiler ve Google'ın Lumiere'i de OpenAI'nin bu alandaki başlıca rakiplerinden biri olacak gibi görünüyor.
Sora'ya benzer şekilde, Lumiere de kullanıcılara metinden videoya araçlar sunuyor ve ayrıca hareketsiz bir görüntüden video oluşturmalarını sağlıyor.
RİSKLERDEN DIOLAYI ŞUAN SADECE BELİRLİ BİR EKİP KULLANABİLİYOR
Sora şu anda yalnızca modeli potansiyel zararlar ve riskler açısından değerlendiren "kırmızı ekip üyeleri" tarafından kullanılabiliyor. OpenAI ayrıca geri bildirim almak için bazı görsel sanatçılara, tasarımcılara ve film yapımcılarına da erişim sunuyor.
Bu ayın başlarında OpenAI, metinden görüntüye aracı DALL-E 3'e filigran eklediğini duyurdu, ancak bunların "kolayca kaldırılabileceğini" belirtti. OpenAI, diğer yapay zeka ürünleri gibi, sahte, yapay zeka fotogerçekçi videoların gerçekle karıştırılmasının sonuçlarıyla mücadele etmek zorunda kalacak.
YAPAY ZEKA KONUSUNDA GÜNDEMDEN DÜŞMEYEN TARTIŞMA!
Sora'nın lansmanının ardından, açıkça görüldüğü üzere, netizenler sakinliğini koruyamadı. 'Yapay zekanın faydadan çok zararı olduğu' yönündeki her zamanki tartışma, yapay zeka ne zaman ana akım spot ışıklarının altına girse sık sık olduğu gibi yeniden su yüzüne çıktı.
Yazılım pek çok profesyonel ve öğrenci için oyunun kurallarını değiştirmeyi vaat etse de, deepfake'lerle ilgili endişeler büyük.
KORKUTUCU SONUÇLARI ORTAYA ÇIKARABİLİR
OpenAI, etik kurallara aykırı olan istemleri otomatik olarak reddetmek için metin ve görüntü sınıflandırıcıları kullanacağını açıkça belirtmiş olsa da, teknolojinin henüz tarama aşamasında olduğu düşünüldüğünde, ortaya çıkacak risklerin boyutu korkutucu görülüyor.
Yapay zeka söz konusu olduğunda, teknoloji hala gelişmekte olduğu için kesin bir açıklama yapmak zordur. Dolayısıyla ne zaman ileriye doğru bir adım atılsa, iyimserlik ve kötümserlikten çok, bu ikisinin karışımı zihinlere hakim oluyor.
Google, Gemini GenAI modelleri ailesinin en yeni üyesi olan Gemini 1.5 Pro'nun piyasaya sürüldüğünü duyurdu.
Gemini 1.0 Pro'nun yerine geçecek şekilde tasarlanan Gemini 1.5 Pro, belki de en önemlisi işleyebildiği veri miktarı olmak üzere, selefine kıyasla birçok alanda geliştirildi.
Gemini 1.5 Pro, Gemini 1.0 Pro'nun işleyebildiği miktarın 35 katı olan 700.000 kelime veya 30.000 satır kod alabilir.
Model ayrıca metinle de sınırlı değildir. Gemini 1.5 Pro, çeşitli dillerde 11 saate kadar ses veya bir saate kadar video alabilir.
FARKLI KONULARDA UZMANLAŞMIŞ MİLYONLARCA AKLI (BİLGİYİ) KULLANIYOR
Gemini Pro 1.5, MoE olarak bilinen bir mimari ile geliştirildi. MoE, bir okul sınıfındaki çocuklara benzetilebilir. Her çocuk, farklı bir oyuncakla (uzmanlık alanı) ilgileniyor. Bir problemle karşılaştığınızda, o oyuncakta (uzmanlık alanında) en iyisi olan çocuğa (modüle) danışıyorsunuz.
Gemini Pro 1.5, yapay zekanın da aynı mantıkla çalışmasını sağlıyor. Farklı konularda uzmanlaşmış milyonlarca ‘akıl’ birlikte çalışarak problemleri çözüyor.
Bu güncelleme, yapay zekanın yeteneklerini oldukça artıran bir yenilik. OpenAI tarafından nasıl bir tepki verileceği merak konusu.
GOOGLE GEMİNİ'NİN AKILLARA ZARAR ÖZELLİKLERİ
| Hayatınızda edindiğiniz her deneyimi detaylıca hatırlayacak.
| Büyük veri bankalarını analiz ederek karmaşık bilimsel sorunlara kolaylıkla çözüm bulabiliyor.
| Yıllar içinde biriktirdiği bütün veriler ile bir amaç oluşturarak deneyimlerini geliştirebiliyor.
OPENAI SORA, VİDEO UZUNLUĞU AÇISINDAN GEMİNİ'NİN BİR ADIM ÖNÜNDE
Google gibi teknoloji devlerinden Runway gibi gelişmekte olan girişimlere kadar çeşitli şirketler, metni videoya dönüştürmeyi amaçlayan yapay zeka projelerini çoktan tanıttı.
Ancak OpenAI, Sora'nın dikkat çekici fotogerçekçiliği ve diğer modeller tarafından tipik olarak üretilen daha kısa parçacıklara kıyasla bir dakikaya kadar daha uzun video klipler üretme kapasitesi nedeniyle öne çıktığını iddia ediyor.