Dolar 32,6610
Euro 35,4440
Altın 2.506,82
BİST 10.851,78
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul 31°C
Açık
İstanbul
31°C
Açık
Pts 32°C
Sal 32°C
Çar 32°C
Per 31°C

Meta, yapay zeka çevirisini 200 dile genişletiyor ancak uzmanlar anadili İngilizce olan kişilerle konuşmayı öneriyor

Yakında Facebook ve Instagram gönderilerini daha az konuşulan küresel dillerde görmek daha kolay olacak, ancak bir uzman, aracı geliştirmek için Meta’nın anadili İngilizce olan kişilerle konuşması gerektiğini öne sürüyor.

Meta, yapay zeka çevirisini 200 dile genişletiyor ancak uzmanlar anadili İngilizce olan kişilerle konuşmayı öneriyor
19 Haziran 2024 09:11

Yakında dünya çapında daha az konuşulan 200 dilde Facebook ve Instagram gönderilerini görmek daha kolay olacak.

Meta’nın Geride Kalan Dil Yok (NLLB) projesi, bu ay yayınlanan bir makalede orijinal teknolojilerini ölçeklendirdiklerini duyurdu.

Proje, İskoç Galcesi, Galiçyaca, İrlandaca, Lingurca, Boşnakça, İzlandaca ve Galce gibi bir düzine “düşük kaynaklı” Avrupa dilini içeriyor.

Meta’ya göre bu, kullanılabilecek verilerde bir milyondan az cümle içeren bir dil.

Uzmanlar, aracı geliştirmek için Meta’nın anadili İngilizce olan kişilere ve dil uzmanlarına danışması gerektiğini çünkü aracın hâlâ üzerinde çalışılması gerektiğini söylüyor.

Proje nasıl çalışıyor?

Meta, yapay zekasını (AI), makine öğrenimini programlayabilen çeşitli diller için özgün konuşma veya yazma metinleri koleksiyonuna sahip açık kaynaklı bir platform olan Opus deposundan gelen verilerle eğitiyor.

Veri kümesine katkıda bulunanlar, doğal dil işleme (NLP) uzmanlarıdır: bilgisayarlara insan dilini tercüme etme ve anlama yeteneği veren yapay zeka araştırmasının alt kümesi.

Meta, veritabanlarında Wikipedia gibi kaynaklardan elde edilen verilerin bir kombinasyonunu da kullandıklarını söyledi.

Veriler, Meta’nın çok dilli dil modeli (MLM) olarak adlandırdığı modeli oluşturmak için kullanılıyor; burada yapay zeka, web sitelerine göre “İngilizce verilere dayanmadan herhangi bir dil çifti arasında” çeviri yapabiliyor.

NLLB ekibi, çevirilerinin kalitesini, oluşturdukları ve yine açık kaynak olan, insanlar tarafından çevrilmiş cümlelerin karşılaştırmasıyla değerlendiriyor. Bu, insanların yazılıma metin çevirirken filtrelemeyi öğretebileceği “zehirli” kelimelerin veya ifadelerin bir listesini içerir.

Son makalelerine göre NLLB ekibi, çevirilerin doğruluğunu 2020’de piyasaya sürülen ilk modele göre yüzde 44 artırdı.

Teknoloji tam olarak uygulandığında Meta, Facebook Haber Kaynağı, Instagram ve diğer platformlarda her gün 25 milyardan fazla çeviri olacağını tahmin ediyor.

‘Halkla konuşun’

Edinburgh Üniversitesi’nde Galce etnolojisi ve dilbilimi profesörü William Lamb, Meta’nın NLLB projesinde belirlediği düşük kaynaklı dillerden biri olan İskoç Galcesi konusunda uzmandır.

İskoçya nüfusunun yaklaşık yüzde 2,5’i, yani yaklaşık 130.000 kişi, 2022 nüfus sayımına göre 13. yüzyıl Kelt dilinde bazı becerilere sahip olduklarını söyledi.

Azınlık dili olan doğu Kanada’da da yaklaşık 2.000 Galce konuşan kişi var. UNESCO, az sayıda insanın düzenli olarak konuşması nedeniyle dili “yok olma tehlikesiyle karşı karşıya” olarak sınıflandırıyor.

“Yapmaları gereken şey… eğer çeviriyi gerçekten geliştirmek istiyorlarsa, insanlarla, yani hala bu dili yaşayan ve soluyan anadili Galce olan insanlarla konuşmaktır.”
William Kuzu
Edinburgh Üniversitesi’nde Gal etnolojisi ve dilbilimi profesörü

Lamb, Meta’nın İskoç Galcesi çevirilerinin, “kalpleri doğru yerde olmasına” rağmen, kullandıkları kitle kaynaklı veriler nedeniyle “henüz pek iyi olmadığını” belirtti.

Lamb, “Yapmaları gereken şey… eğer çeviriyi gerçekten geliştirmek istiyorlarsa, hala bu dili yaşayan ve soluyan anadili Galce olan insanlarla konuşmaktır” dedi.

Bunu söylemek yapmaktan daha kolay, diye devam etti Lamb. Anadili konuşanların çoğu 70’li yaşlarında ve bilgisayar kullanmıyorlar ve genç konuşmacılar “Galceyi büyükanne ve büyükbabalarının yaptığı gibi değil alışkanlıkla kullanıyorlar”.

Bunun yerine iyi bir alternatif, Meta’nın, içinde yüksek kaliteli çevrimiçi içerik oluşturarak dili korumaya çalışan BBC ile bir lisans anlaşması yapması olabilir.

‘Bunun uzmanlar tarafından yapılması gerekiyor’

İspanya’daki Santiago de Compostela Üniversitesi’nde yapay zeka profesörü olan Alberto Bugarín-Diz, Lamb gibi dilbilimcilerin, kendilerine sunulan veri setlerini iyileştirmek için Büyük Teknoloji şirketleriyle birlikte çalışması gerektiğine inanıyor.

Bugarin-Diz, “Bunun, metinleri gözden geçirebilecek, düzeltebilecek ve kullanabileceğimiz meta verilerle güncelleyebilecek uzmanlar tarafından yapılması gerekiyor” dedi.

“Beşeri bilimlerden ve mühendisler gibi teknik altyapıdan gelen insanların birlikte çalışması gerekiyor, bu gerçek bir ihtiyaç” diye ekledi.

Bugarin-Diz, Vikipedi kullanmanın Meta için bir avantaj olduğunu sözlerine ekledi, çünkü veriler “insan yaşamının hemen hemen her yönünü” yansıtacak, bu da dilin kalitesinin daha resmi metinler kullanmaktan çok daha iyi olabileceği anlamına geliyor.

Ancak Bugarin-Diz, Meta ve diğer yapay zeka şirketlerinin çevrimiçi olarak kaliteli veri aramaya zaman ayırdığını ve ardından fikri mülkiyet yasalarını ihlal etmeden bu verileri kullanmak için gerekli yasal gereklilikleri yerine getirdiğini öne sürüyor.

Bu arada Lamb, Meta veri setinde bazı değişiklikler yapmadığı sürece, verilerdeki hatalar nedeniyle insanların bunu kullanmasını tavsiye etmeyeceğini söyledi.

Lamb, “Çeviri yeteneklerinin, araçların gerçekten kullanışlı olduğu noktada olduğunu söyleyemem” dedi.

“Henüz kimseyi güvenilir dil araçları olarak tavsiye etmem; Bunu da açıkça söyleyeceklerini düşünüyorum.”

Bugarín-Diz farklı bir duruş sergiliyor.

Eğer hiç kimse Meta çevirilerini kullanmazsa, onları geliştirmek için zaman ve kaynak yatırmaya “istekli olmayacaklarına” inanıyor.

Diğer yapay zeka araçları gibi Bugarin-Diz de bunun, teknolojiyi kullanmadan önce zayıf yönlerini bilmek meselesi olduğuna inanıyor.

ETİKETLER: , , , ,
YORUMLAR

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.