Tuğçe Huy – Diriliş Postası

AMD, yapay zeka pazarındaki rekabetini artırmak için önemli bir yenilik sunarak ilk küçük dil modeli AMD-135M'yi tanıttı. Bu model, özellikle özel işletmelere yönelik olarak tasarlandı ve Llama ailesinin bir parçası olarak öne çıkıyor. Tahminsel kod çözme teknolojisi sayesinde, kullanıcılar daha hızlı ve verimli sonuçlar elde edebilecek. İki farklı versiyonuyla sunulan AMD-135M, güçlü performansı ile dikkat çekiyor.

Yüksek hız ve tahminsel kod çözme

Yeni dil modeli, "Tahminsel kod çözme" özelliği ile dikkat çekiyor. Bu yöntem sayesinde, model tek seferde birden fazla aday token (jeton) üretebiliyor. Bu token'lar, daha büyük ve daha doğru olan "hedef model"e iletilerek doğrulanıyor veya düzeltiliyor. Bu süreç, her işlemde birden fazla token üretildiği için, kullanıcılar daha hızlı ve verimli sonuçlar elde edebiliyor. AMD’nin iddiasına göre, yeni model aynı donanımda 2 ila 3 kat hız artışı sağlıyor. Ancak, artan veri işleme süreçleri, güç tüketiminde de bir artışa neden oluyor.

İki farklı versiyon ile sunuluyor

AMD'nin yeni modeli, iki farklı versiyon ile piyasaya sunuluyor: AMD-Llama-135M ve AMD-Llama-135M-code. Her iki model de tahminsel kod çözme teknolojisini kullanarak çıkarım performansını hızlandırmayı hedefliyor.

İnsan saçından 200 kat ince: Hayat kurtarabilecek spagetti İnsan saçından 200 kat ince: Hayat kurtarabilecek spagetti

- AMD-Llama-135M, 670 milyar genel veri token'ı üzerinde sıfırdan eğitildi. Bu eğitim süreci, dört adet 8 yollu AMD Instinct MI250 tabanlı sistem kullanılarak 6 günde tamamlandı.

- AMD-Llama-135M-code ise, özellikle kodlamaya odaklanan 20 milyar ek token ile ince ayarlandı ve bu görev de aynı donanım kullanılarak 4 günde gerçekleştirildi.

AMD, gelecekte yapay zeka modelinin daha fazla optimizasyonla daha iyi performans sağlayabileceğini belirtiyor.

Bu gelişmeler, AMD'nin yapay zeka pazarındaki rekabet gücünü artıracak ve kullanıcılar için daha hızlı ve verimli çözümler sunacaktır.

Editör: Tuğçe Huy