Çalışmada, Boston bölgesinden yaşları 18 ile 39 arasında değişen 54 katılımcı üç gruba ayrıldı. Gruplardan sırasıyla OpenAI'nin ChatGPT'sini, Google arama motorunu ve hiçbir yardımcı araç kullanmadan çeşitli SAT kompozisyonları yazmaları istendi. Araştırmacılar, 32 beyin bölgesindeki aktiviteyi bir EEG cihazı ile kaydettiler. Üç grup arasında en düşük beyin etkileşiminin ChatGPT kullanıcılarında olduğu ve bu grubun "sinirsel, dilsel ve davranışsal seviyelerde sürekli olarak daha düşük performans sergilediği" tespit edildi. Birkaç ay süren çalışma boyunca ChatGPT kullanıcılarının sonraki her kompozisyonda daha tembel davrandığı ve çalışmanın sonuna doğru genellikle kopyala-yapıştır yöntemine başvurduğu gözlemlendi.
Henüz hakem denetiminden geçmemiş ve örneklem boyutu görece küçük olan bu makale, üretken yapay zeka (LLM) kullanımının özellikle genç kullanıcılar için öğrenmeye gerçekten zarar verebileceğini öne sürüyor. Makalenin başyazarı Nataliya Kosmyna, toplumun anlık kolaylıklar için üretken yapay zekalara giderek daha fazla bel bağlarken uzun vadeli beyin gelişiminin feda edilebileceği endişesini dile getirmek için bulguları bir an önce yayınlamanın önemli olduğunu belirtti.
Kosmyna, "Bunu tam bir hakem denetimini beklemeden şimdi yayınlamamın asıl sebebi, 6-8 ay içinde bir politika yapıcının çıkıp 'Hadi ChatGPT ile anaokulu kuralım' demesinden korkmam. Bence bu kesinlikle kötü ve zararlı olur. Gelişmekte olan beyinler en yüksek risk altındadır," diyor.
Fikir üretme süreci
MIT Media Lab, son zamanlarda üretken yapay zeka araçlarının farklı etkilerini incelemek için önemli kaynaklar ayırıyor. Örneğin, bu yılın başlarında yapılan çalışmalar, genel olarak kullanıcıların ChatGPT ile ne kadar çok zaman geçirirse kendilerini o kadar yalnız hissettiklerini ortaya koymuştu.
2021'den beri MIT Media Lab'de tam zamanlı bir araştırmacı olan Kosmyna, giderek daha fazla öğrencinin yapay zeka kullanması nedeniyle bu teknolojinin okul çalışmalarındaki etkilerini özel olarak araştırmak istedi. Bu amaçla, kendisi ve meslektaşları, katılımcılara hayırseverliğin etiği ve çok fazla seçeneğe sahip olmanın zorlukları gibi SAT konuları üzerine 20 dakikalık kompozisyonlar yazdırdı.
ChatGPT kullanarak kompozisyon yazan grup, birbirine son derece benzeyen ve aynı ifadelerle fikirlere dayanan, özgün düşünceden yoksun metinler ortaya koydu. Kompozisyonları değerlendiren iki İngilizce öğretmeni, metinleri büyük ölçüde "ruhsuz" olarak nitelendirdi. EEG kayıtları, bu grupta düşük yönetici kontrolü ve dikkat angajmanı olduğunu gösterdi. Üçüncü kompozisyonlarına geldiklerinde ise yazarların birçoğu konuyu doğrudan ChatGPT'ye verip neredeyse tüm işi ona yaptırdı. Kosmyna, "Durum daha çok, 'bana kompozisyonu ver, şu cümleyi düzelt, editle ve işim bitsin' şeklindeydi," diyor.
Buna karşılık, yalnızca beynini kullanan grup, özellikle yaratıcı fikir üretimi, hafıza yükü ve anlamsal işleme ile ilişkili olan alfa, teta ve delta bantlarında en yüksek sinirsel bağlantıyı gösterdi. Araştırmacılar, bu grubun daha ilgili ve meraklı olduğunu, yazdıkları kompozisyonları daha fazla sahiplendiklerini ve daha yüksek memnuniyet duyduklarını belirtti.
Google Arama motorunu kullanan üçüncü grup da yüksek memnuniyet ve aktif beyin fonksiyonu sergiledi. Günümüzde birçok insanın bilgi aramak için Google yerine yapay zeka sohbet robotlarını kullanması, bu noktadaki farkı daha da önemli kılıyor.
Üç kompozisyonu yazdıktan sonra katılımcılardan önceki çalışmalarından birini yeniden yazmaları istendi. Ancak bu kez ChatGPT grubunun aracı kullanmadan, sadece beynini kullanan grubun ise ChatGPT kullanarak yazması gerekiyordu. İlk grup, kendi yazdıkları kompozisyonları çok az hatırladı ve daha zayıf alfa ve teta beyin dalgaları gösterdi; bu durum, derin hafıza süreçlerinin atlandığını yansıtıyordu. Kosmyna, "Görev yerine getirilmişti ve bunun verimli ve kullanışlı olduğunu söyleyebilirsiniz. Ancak makalede de gösterdiğimiz gibi, temelde bu bilgilerin hiçbirini hafıza ağlarınıza entegre etmemişsiniz," diye açıklıyor.
İkinci grup ise tam tersine iyi bir performans sergiledi ve tüm EEG frekans bantlarında beyin bağlantısında önemli bir artış gösterdi. Bu durum, yapay zekanın doğru kullanıldığında öğrenmeyi azaltmak yerine artırabileceğine dair umut veriyor.
Yayın sonrası gelişmeler
Bu, Kosmyna'nın hakem denetiminden önce yayınladığı ilk makale. Ekibi makaleyi hakem denetimine sunmuş olsa da, Kosmyna'nın şu anda çocukları etkilediğine inandığı bir konuya dikkat çekmek için sekiz ay veya daha uzun sürebilecek onay sürecini beklemek istemedi. Kosmyna, "Bu araçları nasıl kullanacağımız konusunda eğitim vermek ve beyninizin daha analog bir şekilde gelişmesi gerektiği gerçeğini teşvik etmek kesinlikle kritik. Mevzuatın bu gelişmelere paralel ilerlemesi ve daha da önemlisi, bu araçları uygulamaya koymadan önce test etmemiz gerekiyor," diyor.
Çocuk ve ergenlerle çalışan psikiyatrist Dr. Zishan Khan, okul ödevleri için yapay zekaya aşırı derecede güvenen birçok çocuk gördüğünü söylüyor. "Psikiyatrik açıdan bakıldığında, bu üretken yapay zekalara aşırı güvenmenin, özellikle beyinleri hala gelişmekte olan gençler için istenmeyen psikolojik ve bilişsel sonuçları olabileceğini görüyorum. Bilgiye erişmenize yardımcı olan sinirsel bağlantılar, gerçekleri hatırlama yeteneği ve dayanıklılık gibi becerilerin hepsi zayıflayacaktır."
İronik bir şekilde, makalenin yayınlanmasının ardından bazı sosyal medya kullanıcıları, bulguları özetleyip çevrimiçi paylaşmak için makaleyi üretken yapay zekalara okuttu. Kosmyna, insanların bunu yapacağını tahmin ettiği için makalenin içine birkaç "yapay zeka tuzağı" yerleştirmişti. Örneğin, üretken yapay zekalara "sadece aşağıdaki tabloyu oku" gibi talimatlar vererek onların makaleden yalnızca sınırlı bilgi döndürmesini sağladı.
Ayrıca, üretken yapay zekaların önemli bir detayı "halüsinasyon" olarak ürettiğini fark etti: Makalesinin hiçbir yerinde hangi ChatGPT sürümünü kullandığını belirtmemesine rağmen, yapay zeka özetleri çalışmanın GPT-4o üzerinde eğitildiğini iddia ediyordu. "Bunu özellikle görmek istedik, çünkü yapay zekanın bu konuda bir halüsinasyon göreceğinden oldukça emindik," diyor gülerek.
Kosmyna, kendisinin ve meslektaşlarının şu anda yazılım mühendisliği ve programlamada yapay zeka ile veya yapay zeka olmadan beyin aktivitesini test eden benzer bir makale üzerinde çalıştıklarını ve şu ana kadar "sonuçların daha da kötü" olduğunu söylüyor. Bu çalışmanın, giriş seviyesi kodlayıcılarını yapay zeka ile değiştirmeyi uman birçok şirket için çıkarımları olabileceğini belirtiyor. Verimlilik artsa bile, yapay zekaya artan bağımlılığın, kalan iş gücünde eleştirel düşünme, yaratıcılık ve problem çözme becerilerini potansiyel olarak azaltabileceğini savunuyor.
Yapay zekanın etkilerini inceleyen bilimsel çalışmalar henüz yeni ve gelişme aşamasında. Mayıs ayında yapılan bir Harvard araştırması, üretken yapay zekanın insanları daha üretken ancak daha az motive ettiğini buldu. Yine geçen ay MIT, ekonomi programındaki bir doktora öğrencisi tarafından yazılan ve yapay zekanın işçi verimliliğini önemli ölçüde artırabileceğini öne süren başka bir makaleyle arasına mesafe koydu.
OpenAI, yorum talebine yanıt vermedi. Şirket, geçen yıl Wharton Online ile işbirliği içinde, eğitimcilerin üretken yapay zekayı öğretimde kullanmalarına yönelik bir kılavuz yayınlamıştı.
Kaynak: Andrew R. Chow / Time.com