ChatGPT’nin artık gözleri var! Görme yetisi kazandı
Bir geliştirici, yazdığı yazılımlar ve kullandığı farklı yapay zeka araçlarıyla ChatGPT'nin görmesini sağlıyor.
cumhuriyet.com.trÜretken yapay zekalar arasında en ön plana çıkanlardan birisi olan ChatGPT ancak aktif olarak sunulan sürümünde henüz görselleri ve videoları analiz edemiyor. Peki, edebilseydi neler yapabilirdi?
İşte bu sorunun cevabı, yapay zeka geliştiricisi Mckay Wrigley tarafından verildi. Wrigley, iPhone ve MacBook kullanarak, yazdığı yazılım sayesinde ChatGPT’ye ‘göz’ verdi. ChatGPT, etraftaki nesnelere göre öneriler de yaptı.
CHATGPT'NİN GÖZLERE SAHİP OLDUĞU O VİDEO
I used my iPhone to give GPT-4 eyes.
— Mckay Wrigley (@mckaywrigley) May 2, 2023
My AI vision assistant:
- learned what a Keto diet is
- identified Keto foods in my fridge
- searched the internet
- found a recipe with the ingredients
The future is here! pic.twitter.com/bOMhJfWRP0
Webtekno'da yer alan habere göre Wrigley’nin etrafındaki tüm nesneler ve buzdolabındaki yiyecek ve içecekler, farklı bir yapay zeka ile tanınıyor. Daha sonrasında bu veriler ChatGPT’ye sunuluyor. ChatGPT, bir soruyla önce hangi nesnelerin etrafta olduğunu öğreniyor, ardından bu nesnelere ilişkin bir diğer soruyu da cevaplıyor.
Wrigley, bu yöntem ile ChatGPT’ye buzdolabındaki nesneleri gösteriyor, öğretiyor. Sonrasında ise ChatGPT’den buzdolabındaki içeriklere uygun bir tarif vermesini istiyor. ChatGPT, internette kısa bir arama yaptıktan sonra uygun tarifi anlatıyor.
Videodaki sesli konuşma da elbette ChatGPT’nin yapabildiği bir şey değil. Wrigley, yazının anlık olarak sese dönüştürülmesi için OpenAI’ın Whisper yapay zekasından faydalanıyor. Kendisinin kullandığı tüm yapay zekalar ve kullanım amaçları ise şu şekilde:
- GPT-4: ChatGPT’yi oluşturan dil modeli
- YoloV8: Kameraya gözüken nesneleri tanımlayan yapay zeka
- Whisper: Metnin sese dönüştürülmesi
- Google Custom Search Engine: ChatGPT’nin internette arama yapmasını sağlayan araç
Wrigley, bu yapay zekaları Python ile yazdığı kodlar ile bir arada çalıştırıyor ve ortaya böyle bir sonuç çıkıyor. Wrigley, Apple’ın piyasaya sürmeye hazırlandığı artırılmış gerçeklik gözlükleri için de araçlar geliştirmeye hazırlandığını söylüyor.
Bir diğer deyişle yukarıdaki video, artırılmış gerçeklik gözlüklerinin halihazırda bildiğimiz bir potansiyelinin somut bir şekilde sunumu.