Teknoloji

ChatGPT [Video] Görmeye Başladı

Üretken yapay zekanın ortasında en öne çıkanlardan biri, ChatGPT Ne yazık ki bize açılan versiyondaki görselleri ve görselleri analiz edemiyor. Peki, yapabilseydi ne yapabilirdi?

Bu sorunun cevabını yapay zeka geliştiricisi Mckay Wrigley verdi. Wrigley, yazdığı yazılım sayesinde iPhone ve MacBook kullanıyor ChatGPT’ye bir “göz” verdi.ChatGPT, çevredeki nesnelere göre de teklifler yaptı.

İşte ChatGPT’nin gözlere sahip olduğu görüntü:

Wrigley’in etrafındaki tüm nesneler ve buzdolabındaki yiyecek ve içecekler, ayırt edici bir yapay zeka tarafından tanınır. Bu veriler daha sonra ChatGPT’ye sunulur. ChatGPT, önce bir soruyla Etrafta hangi nesnelerin olduğunu öğrenir., ardından bu nesnelerle ilgili başka bir soruyu yanıtlar.

Bu sistemle Wrigley, ChatGPT’ye buzdolabındaki nesneleri gösterir ve öğretir. Daha sonra ChatGPT’den buzdolabının içindekilerin uygun bir tanımını vermesini ister. ChatGPT, internette kısa bir arama yaptıktan sonra uygun tanımı açıklar.

Videodaki sesli konuşma, elbette ChatGPT’nin yapabileceği bir şey değil. Wrigley, metnin anında sese dönüştürülmesi için OpenAI kullandı. Whisper AI’dan Avantaj kazanmak. Kullandığı tüm yapay zekalar ve kullanım amaçları şu şekildedir:

  • GPT-4:ChatGPT oluşturan dil modeli
  • YoloV8:Kamera tarafından görülebilen nesneleri tanımlayan yapay zeka
  • Fısıltı:Metni sese dönüştürme
  • Google Özel Arama Motoru:ChatGPT’nin internette arama yapmasına izin veren araç

Wrigley Python’da yazdığı kodlar ile bu yapay zekaları ortada çalıştırıyor ve bu şekilde bir sonuç çıkıyor. Wrigley ayrıca Apple’ın piyasaya sürmeye hazırlandığı artırılmış gerçeklik gözlükleri için de geçerli. araçları geliştirmeye hazırdiyor.

Başka bir deyişle, yukarıdaki görsel, zaten bildiğimiz artırılmış gerçeklik gözlüğü potansiyelinin somut bir temsilidir.

arabanhaber.com.tr

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu