Google, Gemini tarafından desteklenen yaratıcı bir görüntü aracı olan Whisk'i tanıttı

Google, Gemini tarafından desteklenen yaratıcı bir görüntü aracı olan Whisk'i tanıttı
Diya Poddar
18 Ara 2024, 10:56 ÖÖ
  • Geleneksel fotoğraf editörlerinin aksine Whisk, piksel mükemmelliğinde sonuçlar yerine yaratıcı keşiflere odaklanıyor.
  • Whisk'in piyasaya sürülmesi, OpenAI'nin Sora'sıyla artan rekabetin habercisi.
  • Whisk ilk etapta ABD'li kullanıcılara sunulacak, daha fazla güncelleme planlanıyor.

Teknoloji sektörünün üretken yapay zeka yarışı, Google'ın kullanıcı tarafından yüklenen fotoğraflardan benzersiz görseller oluşturmak üzere tasarlanmış Whisk adlı aracını piyasaya sürmesiyle daha da rekabetçi bir hal aldı.

Google Labs aracılığıyla tanıtılan Whisk, ABD'deki kullanıcıların metin istemlerine ihtiyaç duymadan konuları, stilleri ve ortamları yeni görsellerle harmanlamasına olanak tanıyor.

Google DeepMind'ın yapay zeka alanındaki ilerlemelerini temel alarak Gemini ve Imagen 3 teknolojilerini sergiliyor.

Bu hamle, Google'ın OpenAI'nin Sora metin-video oluşturucusu da dahil olmak üzere tüketici ürünleri paketiyle rekabet ederken erişilebilir yapay zeka araçları sunmaya odaklandığını vurguluyor.

Whisk nedir ve nasıl çalışır?

Whisk, yapay zeka destekli yaratıcılığa yeni bir bakış açısı getiriyor.

Kullanıcılar konuları, ayarları veya stilleri temsil eden görselleri yükleyebilirler.

Platform, bu girdileri Aralık 2023'te kullanıma sunulan ve içerikler için altyazılar üreten Google'ın yapay zeka temel modeli Gemini'yi kullanarak işliyor.

Bu altyazılar DeepMind'ın metinden resme dönüştürme aracı olan Imagen 3'e aktarılıyor.

Geleneksel fotoğraf editörlerinin aksine Whisk, piksel mükemmelliğinde sonuçlar yerine yaratıcı keşiflere odaklanıyor.

Kullanıcıların, girdileri ayarlayarak veya belirli ayrıntıları yönlendirmek için metin ekleyerek kategorileri yeniden düzenlemelerine olanak tanır (örneğin bir görüntüyü peluş oyuncak, emaye rozet veya çıkartmaya dönüştürme).

Google, çıktıların bir konunun "özünü" yakaladığını, yani saç stilinde veya cilt tonunda değişiklikler gibi bazı değişikliklerin olabileceğini vurguluyor.

DeepMind'ın Nobel Ödüllü uzmanlığı Whisk'in temelini oluşturuyor

Whisk, Google'ın 2014 yılında satın aldığı yapay zeka bölümü DeepMind'ın son teknoloji geliştirmelerinden yararlanıyor.

DeepMind'ın yapay zeka araştırması, iki çalışanının protein yapısı keşifleri nedeniyle 2024 Nobel Kimya Ödülü'nü kazanmasına katkıda bulundu.

Bu, laboratuvarın teknolojik sınırları zorlama konusundaki itibarının, artık Whisk gibi yaratıcı uygulamalara kadar uzandığını gösteriyor.

Whisk ayrıca Google'ı tüketici dostu yapay zeka alanında da lider konuma getiriyor.

Başlangıçtaki metinden görüntüye dönüştürme aracı Gemini, tarihsel olarak yanlış görüntüler ürettiği için eleştirilere maruz kalırken, Whisk tam kopyalar yerine soyut, keşfedici çıktılara odaklanarak benzer tuzaklardan kaçınmayı amaçlıyor.

Yapay zeka inovasyonu teknoloji devleri arasındaki rekabeti teşvik ediyor

Google'ın Whisk'i tanıtması, şirketin yapay zeka destekli tüketici ürünlerine hakim olma yönündeki daha geniş stratejisini gözler önüne seriyor.

Rekabet kızıştı ve OpenAI yakın zamanda metinden videoya dönüştürme aracı Sora'yı tanıttı.

Google, Whisk'i Gemini'nin yetenekleri ve Imagen 3 ile entegre ederek üstünlüğünü sağlamlaştırmayı hedefliyor ve bu, dinamik, çok modlu yapay zeka araçlarına doğru bir geçişin sinyalini veriyor.

Wedbush Securities'de hisse senedi analisti olan Dan Ives, Whisk'i Google'ın 2025 tekliflerinin "hazine sandığı"nın bir parçası olarak görüyor; ayrıca Samsung ve Qualcomm ile yeni bir Android işletim sistemi üzerinde yaptığı iş birliğini de değerlendiriyor.

Bu girişimler, Google'ın son derece kazançlı ve rekabetçi yapay zeka alanında üstünlüğünü sürdürme çabasını ortaya koyuyor.

Whisk gibi üretken yapay zeka araçları kamuoyunun ilgisini çekse de aynı zamanda incelemeye de maruz kalıyor.

Örneğin, Gemini'nin daha önce tarihsel olarak yanlış görüntü çıktılarıyla ilgili yaşadığı sorunlar, yapay zekanın güvenilirliği konusunda endişelere yol açmıştı.

Whisk, yaratıcı ve kullanıcı odaklı yaratımlara odaklanarak bu zorlukların üstesinden gelmeyi amaçlıyor.

Google tekliflerini geliştirmeye devam ederken, aracın ABD'li kullanıcılar için bir web sitesi olarak ilk lansmanı, gelecekteki güncellemeler ve yinelemeler için kritik bir test ortamı sağlayacak.

Google'ın yapay zeka hedefleri

Whisk'in ilk çıkışı, yapay zekanın tüketici yaratıcılığı için nasıl kullanıldığına dair daha geniş bir evrimin sinyalini veriyor.

Google, kullanıcı dostu arayüzlere odaklanarak ve Gemini gibi gelişmiş teknolojileri entegre ederek üretken yapay zekaya erişimi demokratikleştirmeyi amaçlıyor.

Ancak rekabet hala yoğun ve rakip platformlar yapay zekanın neler başarabileceğinin sınırlarını zorluyor.