Prompt mühendisliği, RAG ve fine-tuning: hangisi ne zaman?

Prompt mühendisliği, RAG ve fine-tuning nedir, farkları ne? Bir LLM'i işine yaramasının üç yolunu ve hangisini ne zaman seçeceğini sade bir dille anlatıyoruz.

Kaan Dülgar··4 dk okuma
Prompt mühendisliği, RAG ve fine-tuning: hangisi ne zaman?

Hazır bir yapay zeka modeli dili bilir, genel kültürü vardır, ama senin işine, verine ya da üslubuna özel değildir. Onu kendine ayarlamanın üç yolu var: prompt mühendisliği, RAG ve fine-tuning. Bu üçü sık sık karıştırılıyor, oysa maliyetleri, zorlukları ve ne zaman işe yaradıkları tamamen farklı. Hafiften ağıra doğru dizilirler. Bu yazıda üçünü netçe ayıracak ve hangi durumda hangisini seçeceğini göstereceğim.

Prompt mühendisliği: modeli değiştirmeden yönlendirmek

En hafif ve en yaygın yol bu. Prompt mühendisliği, modele hiç dokunmadan, ona verdiğin talimatı (prompt) ustaca kurarak istediğin sonucu almaktır. Modelin içini değiştirmezsin, sadece nasıl konuştuğunu yönlendirirsin.

Karşında yetenekli ama senin özel ihtiyacını bilmeyen bir uzman olduğunu düşün. Ona ne kadar net bağlam verir, rolünü ne kadar iyi tarif eder, beklentini ne kadar açık söylersen o kadar isabetli sonuç alırsın. "Bir e-posta yaz" demek ile "Geç kalan bir ödeme için, nazik ama kararlı bir tonda, kısa bir hatırlatma e-postası yaz" demek tamamen farklı çıktılar verir.

Avantajı büyük: ücretsiz ya da çok ucuz, anında uygulanabilir ve teknik bilgi gerektirmez. Bugün çoğu kullanıcının yapay zekadan iyi sonuç almasının yolu büyük ölçüde buradan geçiyor. Çoğu ihtiyaç da aslında burada çözülür.

RAG: modele dışarıdan bilgi beslemek

Prompt mühendisliği modelin nasıl davranacağını ayarlar ama bilmediği bir bilgiyi ona öğretmez. İşte ikinci yol burada devreye girer. Bir dil modelinin iki büyük kör noktası vardır: eğitim verisinin kesildiği tarihten sonrasını bilmez ve senin şirketinin iç belgelerini, kişisel notlarını hiç görmemiştir. RAG bu boşluğu doldurur.

RAG, 2020'de tanıtılan "Retrieval-Augmented Generation" ifadesinin kısaltması, yani getirmeyle zenginleştirilmiş üretim. Temel fikir basit: model cevap vermeden önce, ilgili bilgileri bir kaynaktan çekip okur ve cevabını o bilgilere dayandırır. Modelin sadece ezberinden cevap vermesi kapalı kitap sınava benzer; bildiği kadarını söyler, bilmediğini uydurabilir. RAG ise açık kitap sınavıdır: model soruyu görünce önce doğru sayfayı açar, oradaki bilgiyi okur, cevabını ona göre verir.

Süreç kabaca üç adımdır. Önce getirme: kullanıcının sorusuyla en alakalı belge parçaları, anlam benzerliğine göre (metinler embedding denen sayısal temsillere çevrilerek) bulunur. Sonra zenginleştirme: bu parçalar soruyla birlikte modele bağlam olarak verilir. En son üretim: model artık havadan değil, önüne konan kaynaktan konuşur ve çoğu sistemde cevabın hangi belgeye dayandığını da gösterebilir.

RAG'in cazibesi, modeli yeniden eğitmeden güncel ve özel bilgi kazandırması; belge havuzunu güncellemen yeterli. Model kaynaktan konuştuğu için halüsinasyon da belirgin biçimde azalır. Bu yüzden kurumsal dünyada neredeyse standart oldu: şirket içi soru-cevap asistanları, müşteri destek botları, döküman arama sistemleri büyük ölçüde böyle çalışıyor. Tek şartı, eline tutuşturulan belgeler kadar iyi olması; havuz eksik ya da arama isabetsizse cevap da zayıflar.

Fine-tuning: modeli yeniden eğitmek

Üçüncü ve en ağır yol. Fine-tuning, yani ince ayar, hazır bir modeli kendi özel verinle ek bir eğitimden geçirip davranışını kalıcı olarak değiştirmektir. Burada artık modelin iç ayarlarına dokunursun.

Aynı uzman örneğiyle: prompt mühendisliği uzmana iyi brief vermekse, fine-tuning o uzmanı haftalarca senin şirketinin diline, üslubuna ve süreçlerine özel eğitmektir. Sonuçta her seferinde uzun uzun açıklamana gerek kalmaz, çünkü model o davranışı içselleştirmiştir. Modeli hep belirli bir markanın ses tonuyla yazması ya da çok özel bir formatta çıktı vermesi için eğitebilirsin.

Bedeli de buna göre. Fine-tuning kaliteli ve etiketli veri, işlem gücü ve teknik bilgi ister. Hem pahalı hem zaman alan bir süreçtir. İlginç bir not: aslında ChatGPT ve Claude gibi modeller de bizim kullandığımız haline gelmeden önce bir tür fine-tuning'den geçer; ham model, insan geri bildirimiyle yardımcı ve güvenli olacak şekilde ince ayarlanır.

Hangisi ne zaman?

Pratik kural net: önce prompt mühendisliğini dene, yetmezse RAG ekle, o da yetmezse fine-tuning'i düşün. Sırayı atlamak çoğu zaman gereksiz maliyet demek.

Prompt mühendisliği RAG Fine-tuning
Ne yapar Talimatı iyileştirir Dışarıdan bilgi besler Modeli yeniden eğitir
Modele dokunur mu Hayır Hayır Evet
Maliyet Çok düşük Orta Yüksek
Teknik bilgi Gerekmez Orta Gerekir
En iyi olduğu yer Genel kullanım, üslup Güncel/özel bilgi Sabit üslup, özel format

Senaryoyla bakalım. Modelin bilmediği güncel ya da özel bir bilgiye ihtiyacın varsa, mesela şirket dökümanların üzerinden cevap vermesi gerekiyorsa, doğru cevap RAG. Modelin her seferinde aynı dar görevi, sabit bir formatta ya da çok belirli bir üslupla yapması gerekiyorsa fine-tuning anlamlı olur. Bunların ikisi de gerekmiyorsa, ki çoğu zaman gerekmiyor, iyi bir prompt zaten işini görür.

İkisinin birlikte kullanılması da mümkün: bir model hem fine-tuning ile belirli bir üsluba oturtulup hem RAG ile güncel bilgiyle beslenebilir. Ama hangi modeli kullanırsan kullan, önce ucuz ve hızlı olanı denemek neredeyse her zaman daha mantıklı. Pratikte birçok kişi, hazır yapay zeka araçlarıyla sadece promptunu iyileştirerek ihtiyacının büyük kısmını zaten karşılıyor.

Sık sorulan sorular

RAG mı fine-tuning mi daha iyi? Farklı işler için. RAG modele güncel ve özel bilgi kazandırır, modeli değiştirmez, ucuzdur ve sık değişen bilgi için idealdir. Fine-tuning ise modelin davranışını kalıcı değiştirir, sabit üslup ve özel format gerektiren dar görevler için anlamlıdır. Sık değişen bilgi söz konusuysa genelde RAG daha pratiktir.

Sıradan bir kullanıcı fine-tuning yapmalı mı? Çoğu durumda hayır. Bireysel kullanıcılar ve küçük işletmeler ihtiyaçlarının neredeyse tamamını iyi bir prompt ve gerektiğinde RAG ile karşılayabilir. Fine-tuning daha çok özel proje ve ürün geliştiren ekipler için anlamlı.

Prompt mühendisliği gerçek bir beceri mi? Evet. Modele ne istediğini net, bağlamlı ve yapılandırılmış biçimde anlatabilmek, alınan sonucun kalitesini doğrudan belirler. Aynı modelden iyi ve kötü prompt ile alınan çıktılar arasında uçurum olabilir.

Haftalık özet bültenimize katıl

Teknoloji, yapay zeka, kripto ve borsadaki haftanın özetini Pazar sabahı e-postana gönderelim. Spam yok.