Giriş

CoT Review

Veri Katmanları — RAG ve SFT Yönetimi

Sistemde iki ana veri tipi var: RAG (canli LLM cevaplarinda kullanilan context) ve SFT (modele yeni davranis ogretmek icin fine-tuning datasetleri). Bu sayfada hangi dosya ne icin kullaniliyor, hangileri prod'da aktif gorebilirsin.

Veri Akışı (üst düzey)

1. Kullanıcı LLM'ye soru sorar → 2. RAG sistemi (rag_lab_only.jsonl) en alakalı 3-5 kaydı çeker → 3. LLM bu context + soru ile cevap üretir.

Yeni veriler şu yolla ekleniyor: SFT generator scriptlerisft_v7_literature_v4.jsonl üretir → add_v7_to_rag.py RAG dosyalarına aktarır → API restart embedding cache'i yeniden hesaplar.

┌──────────────────┐ ┌──────────────────┐ ┌─────────────────┐ │ SFT Generator │ → │ v7 SFT Dataset │ → │ RAG Datasets │ → LLM Context │ (scripts) │ │ (training-only) │ │ (runtime) │ └──────────────────┘ └──────────────────┘ └─────────────────┘ │ │ │ │ │ └→ rag.py her sorguda │ │ en alakali 3-5 kayit │ │ │ └→ SageMaker / Bedrock fine-tune (ayri akis) │ └→ generate_v7_sft_v4.py uretir (322 derin CoT)

Yükleniyor...

Toplam
Onaylı
Düzeltildi
Reddedildi
Bekleyen
0%
Kaynak Durum
1 Onayla 2 Düzelt 3 Reddet Enter Kaydet ←→ Gezin
Yükleniyor…
— / —
Kalite Puanı
Karar
Yorum (isteğe bağlı)

Önceki Değerlendirmen

Henüz değerlendirilmedi