← AI AÇIKLANABİLİRLİK

// FORENSIC METHODOLOGY · WHITEPAPER v1.0

TAMGAX ONOK
Forensic Reliability Framework

13-Noktalı Forensic Reliability Mode · Bot 8-Katman Davranış Modeli
Probabilistic Söylem Çıkarımı · Hallucination Guardrails · Explainable AI

Yayın: 18 Mayıs 2026 · Sürüm 1.0
Yazar: TAMGAX Mühendislik Ekibi · Anakron Dijital Ltd. Şti.

Atıf önerisi (APA):

TAMGAX Ekibi. (2026). TAMGAX ONOK Forensic Reliability Framework: 13-Noktalı Metodoloji (Sürüm 1.0). Anakron Dijital. https://onok.tamgax.com/onok/forensic-whitepaper

Lisans: CC BY-ND 4.0 (atıfla kullanım serbest, türev yasak)

İletişim: destek@tamgax.com

// İÇİNDEKİLER

1. Yönetici Özeti (Executive Summary)
2. Sistem Mimari ve Veri Akışı
3. 13-Noktalı Forensic Reliability Framework
4. Bot 8-Katman Davranış Modeli
5. Confidence Hesaplama Metodolojisi
6. Hallucination Guardrails ve Probabilistic Dil
7. Veri Doğrulama ve Kanıt Zinciri
8. Sistem Sınırları ve Bilinen Yanlılıklar
9. Karşılaştırma ve Akademik Konum
10. Referanslar

1. Yönetici Özeti

TAMGAX ONOK, kamuya açık sosyal medya ve haber verisi üzerinde karar destekleyici bir medya analiz platformudur. Bu doküman platformun analiz metodolojisini akademik kalitede tarif eder; gazetecilik, akademik araştırma, kurumsal iletişim ve siyasi danışmanlık amaçlarıyla çıktıların nasıl üretildiğini ve hangi güvence katmanlarıyla zenginleştirildiğini açıklar.

Platform, geleneksel sosyal medya monitör araçlarından (Brandwatch, Talkwalker, Crowdtangle) iki ana noktada ayrılır: (i) OBSERVED vs INFERRED ayrımı, ölçülen ham veri ile AI çıkarımı arasındaki sınırı açıkça tanımlar; (ii) Hallucination Guardrails, doğrulanmamış olay/isim/ oran üretimini engelleyen kural setidir. Çıktı dili olasılıksal'dır — kesin yargı yerine "veri temelli olasılıksal değerlendirme" sunar.

Kritik bulgu

LLM tabanlı analiz sistemlerinin yaygın hatası — "AI ile hazırlanmış sosyal medya özeti" — gazetecilik ve mahkeme süreçlerinde kanıt olarak kullanılamaz. TAMGAX ONOK bu boşluğu kapatmak için 13-noktalı bir framework ile her çıkarıma kaynak (source attribution), güven seviyesi (confidence) ve alternative hypothesis ekler.

2. Sistem Mimari ve Veri Akışı

2.1 Stack

Katman	Teknoloji	Sorumluluk
Frontend	Next.js 16 (App Router), React 19	Dashboard + report rendering
API / BFF	Vercel Functions (Node.js 24, fluid compute)	Auth, rate-limit, orchestration
Database	Neon Postgres	User + ledger + audit
Cache + Queue	Redis (Upstash)	Cache, distRateLimit, slot manager
Analytics backend	Hetzner Cloud (Python, FastAPI)	Scout puller + Apache AGE graph (KBA)
Primary AI	xAI Grok 4.3	Web/X search + analiz
Synthesis AI	Anthropic Claude Sonnet 4.5	Yapılandırma, akademik dil (opsiyonel)
Data source	SocialData (X), YouTube Data API, açık web	Public-only veri toplama

2.2 Veri akışı (KONU analizi örneği)

Kullanıcı sorgu → Vercel /api/onok/gx-konu
  → Auth + RateLimit + CostGuard + Concurrency check
  → Scout backend (Hetzner Node 1) async job
    → SocialData bucketed pull (13 hafta × ~500 tweet = 6500)
    → Engagement DESC sort + top 200 tweets to Grok prompt
    → Grok x_search (gerçek zamanlı X derin tarama)
    → Schema-bound JSON çıktı (13-katman forensic)
  → JSON repair (jsonrepair lib)
  → Cache write (Redis, TTL plan bazlı)
  → Frontend polling /grok-job/:id
  → Markdown/JSON dual render

2.3 İzlenebilirlik

Her istek `request_id` (UUID v4 türevi 16 karakter) ile etiketlenir ve istek-yanıt-cost satırlarında bu ID korunur. Audit log Postgres'te tutulur, KVKK 30 günlük sorgulara cevap için referans olarak kullanılır.

3. 13-Noktalı Forensic Reliability Framework

Her analitik modülün çıktı şeması aşağıdaki 13 katmandan üretilir. Modül-bağımsız ortak bir standarttır — SEÇMEN/KONU/MEDYA/AKTOR/ALGI hepsi aynı katmanları kullanır.

#	Katman	Garanti
1	Observed vs Inferred	Ölçülen veri (tweet sayısı, engagement) ayrı blok; AI çıkarımı (skor, ton) ayrı blok
2	Confidence Score	Her inferred bloğa 4 seviye: high / medium / low / speculative
3	Source Attribution	sample_size + verified_ratio + time_range + platforms
4	Hallucination Guardrails	8 yasaklı pattern (Bölüm 6); guard_log dönüşte true/false
5	Multi-Layer Bot Model	8 davranış katmanı (Bölüm 4)
6	Demographic Warning	Probabilistic etiket + "anket DEĞİL" uyarısı
7	Semantic Evidence	representative_tweets + evidence_count + counter_narrative_ratio
8	Verified Timeline	Sadece kaynaklı olaylar; her events `verified` flag + citation_links
9	Visual Reliability UI	Mavi (observed) · sarı (inferred) · kırmızı (speculative) renk kodu
10	Advanced NLP	Stance + drift + propaganda detection (modül bazlı, opsiyonel)
11	Forensic Traceability	"Explain this insight" — hangi tweet, hangi model, ne zaman
12	Risk & Reliability Layer	evidence_strength + hallucination_risk + political_bias_risk + sampling_bias_risk
13	Explainable Output	why_this_conclusion + data_sources_used + signals_found

3.1 Observed vs Inferred ayrımı (Katman 1)

Geleneksel sosyal medya analizinde "tweet sayısı 925" ile "polarizasyon skoru 65" aynı kategoride sunulur — kullanıcı hangisinin ölçüm hangisinin yorum olduğunu ayırt edemez. TAMGAX schema'sı:

result = { "observed_data": { // ölçülen, sayılabilir "tweet_sayisi_analiz": 925, "unique_account_count": 712, "verified_account_ratio": 8.2, "engagement_total": 24310, "_source": { "platforms": ["X", "YouTube"], "extraction_confidence": "high" } }, "inferred_analysis": { // AI çıkarımı "polarizasyon_skoru": { "value": 65, "confidence": "medium", "rationale": "echo_chamber yoğunluğu + reply hostility" } } }

3.2 Confidence skorlama kuralları (Katman 2)

Her inferred bloğun confidence değeri, kaynak veri büyüklüğü ve çeşitliliğine göre deterministic olarak kapsanır. Sample size < 50 ise asla "high" verilmez; bu kural prompt seviyesinde Grok'a zorunlu kılınır.

confidence_level(sample_size, source_diversity, semantic_consistency): if sample_size < 20: return "speculative" if sample_size < 50: return min("low", computed) if sample_size < 200: return min("medium", computed) if source_diversity < 0.3: return min("low", computed) if semantic_consistency < 0.5: return min("medium", computed) return "high"

4. Bot 8-Katman Davranış Modeli

Tek-boyut bot skorlaması (örn "BotMeter") yanıltıcıdır. TAMGAX bot şüphesini 8 ayrı davranış sinyalinden komposit hesaplar:

Katman	Sinyal	Skor 0-100 etken
L1	Paylaşım sıklığı anomalisi	tweet/saat dağılımının standart sapma z-skoru
L2	Eşzamanlı paylaşım	±60 saniye penceresinde benzer cümle yapısı oranı
L3	Tekrar eden cümle kalıpları	tf-idf cosine similarity > 0.85 olan tweet çiftleri
L4	Takipçi/takip dengesizliği	following / followers oranının log dağılımı outlier'ı
L5	Hesap açılış kümelenmesi	created_at dağılımında ±7 günlük cluster yoğunluğu
L6	Yeniden paylaşım hızı	RT/quote kademe hızı; ilk 10 dk içinde > 100 RT
L7	Zaman koordinasyonu	Saat dilimi dağılımının entropy değeri
L8	Entropi skoru	İçerik çeşitliliği; düşük entropy = robotik düzen

4.1 Komposit bot skor formülü

bot_score = ( 0.18 × L1 (frequency) + 0.16 × L2 (sync) + 0.14 × L3 (duplicate) + 0.10 × L4 (imbalance) + 0.12 × L5 (creation cluster) + 0.10 × L6 (repost velocity) + 0.08 × L7 (temporal) + 0.12 × L8 (entropy) ) confidence = "high" if sample_size >= 500 "medium" if 100 <= sample_size < 500 "low" if sample_size < 100

Sonuç + her katmanın bireysel skoru her zaman gösterilir; kullanıcı hangi sinyalin yüksek olduğunu görüp organik viral patlama olasılığını değerlendirebilir.

4.2 Yanlış pozitif riski

Organik viral olaylar (örn deprem, terör saldırısı) yüksek bot skoru üretebilir — paylaşım sıklığı + senkron paylaşım L1+L2 patlar. Bu yüzden bot çıktısı her zamanalternative_hypothesis: "organik viral patlama da bu skoru üretebilir" ile sunulur.

5. Confidence Hesaplama Metodolojisi

5.1 4-seviye confidence sistemi

Seviye	Tanım	Sample size minimum	Renk kodu
HIGH	Çoklu kaynak + yüksek semantic consistency + verified ratio > 30%	n ≥ 200	Yeşil
MEDIUM	Tek-iki kaynak + orta consistency + verified ratio > 10%	50 ≤ n < 200	Sarı
LOW	Sınırlı sample + zayıf cross-validation	20 ≤ n < 50	Turuncu
SPECULATIVE	Çok düşük sample + yorumsal çıkarım	n < 20	Kırmızı

5.2 Faktör matrisi

Confidence aşağıdaki 6 faktörün ağırlıklı kombinasyonundan üretilir:

confidence_score = clamp(0-100, 0.25 × normalize(sample_size, log_scale) + 0.20 × source_diversity_ratio + 0.15 × inverse(duplicate_ratio) + 0.15 × semantic_consistency + 0.15 × cross_platform_verification + 0.10 × temporal_stability ) level = HIGH if score >= 75 MEDIUM if 50 <= score < 75 LOW if 25 <= score < 50 SPECULATIVE if score < 25

5.3 Source attribution

Her inferred bloğa zorunlu kaynak metaveri:

"_source": {
  "sample_size": 925,
  "verified_account_ratio": 8.2,
  "time_range": "2026-04-18 → 2026-05-17",
  "platforms": ["X", "YouTube"],
  "extraction_confidence": "high"
}

6. Hallucination Guardrails ve Probabilistic Dil

6.1 8 yasaklı pattern

Doğrulanmamış istifa: Resmi kaynak yoksa "X istifa etti" yazmak yasak. Sadece corpus'ta var ise iddia/söylenti olarak işaretle.
İsimsiz olay: Her olayın tarihi + kaynağı olmalı; "bilinmeyen bir gelişme" YASAK.
Kaynaksız oran: Anket yüzdeleri için anket_kaynaklari alanı zorunlu (Metropoll, Konda, Areda vb).
Model varsayımı = fact sunmak: Çıkarım, mutlaka confidence rozetiyle etiketli.
Kesin hüküm dili: "Kaybediyor / düşüyor / erimekte" yerine "negatif söylem yoğunluğu gözlemlendi".
Sample < 50 ile high confidence: Asla — otomatik low/speculative'e demote edilir.
Demografik kesinlik: "Gençler partiyi terk etti" yerine probabilistic: "genç hesaplarda negatif söylem oranı %X".
Source attribution eksikliği: sample_size + verified_ratio + time_range her inferred bloğa zorunlu.

6.2 Probabilistic dil dönüşümü

❌ Kesin hüküm (yasak)	✅ Probabilistic ifade
"MHP genç seçmeni kaybediyor"	"Analiz edilen örneklemde genç kullanıcı segmentinde negatif söylem yoğunluğu gözlemlendi"
"İktidar medyası tarafsız değil"	"İktidar yanlısı kaynaklarda destekleyici ton %X, framing tutarlılığı yüksek"
"Bu trend bot operasyonu"	"Düşük ihtimal koordineli amplifikasyon (%18 confidence) — organik viral patlama da bu skoru üretebilir"

6.3 Guard log

Her çıktının sonunda compliance log:

"hallucination_guardrails": {
  "compliance": "strict",
  "guard_log": {
    "doğrulanmamis_olaylar_eklenmedi": true,
    "isimsiz_olaylar_eklenmedi": true,
    "kaynaksiz_oranlar_eklenmedi": true,
    "olasiliksal_dil_kullanildi": true
  }
}

7. Veri Doğrulama ve Kanıt Zinciri

7.1 Timeline doğrulama

Olay zaman çizelgesine yalnızca doğrulanmış kayıtlar eklenir. Doğrulama kriterleri:

Resmi kaynak (kurumsal hesap, basın açıklaması)
≥ 2 platform tarafından raporlanmış
İlk görülme zamanı tespit edilebilir
Citation link (URL) mevcut

Doğrulanmamış spekülasyon ayrı bölüm olarak işaretlenir ve verified: false +confidence: low ile sunulur.

7.2 Forensic evidence panel

Her büyük iddia için zorunlu metaveri:

"forensic_evidence": [{
  "claim": "TRT-1'de iddia X tarihinde Y kez işlendi",
  "source_post_count": 38,
  "semantic_similarity": 0.72,
  "verified_source_ratio": 0.45,
  "engagement_evidence": 12450,
  "first_appearance_timestamp": "2026-05-09 14:23",
  "citation_links": ["https://...", "https://..."]
}]

7.3 Chain-of-evidence (mahkeme süreçleri için)

Forensic Reliability Mode aktif raporda her insight'a "Why this conclusion?" açılır paneli bağlanır. Bu panelde:

Hangi veri kaynakları kullanıldı
Hangi model hangi adımda çağrıldı (Grok 4.3 web_search → Claude Sonnet 4.5 sentez)
Sample size + verified ratio
Confidence hesaplaması
Alternative hypothesis

Bu kayıt mahkeme delili / akademik atıf için yeterli izlenebilirlik sağlar.

8. Sistem Sınırları ve Bilinen Yanlılıklar

8.1 Veri kapsamı sınırları

Yalnızca X (Twitter) + YouTube + açık web — Instagram, TikTok, Facebook kapsam dışı
SocialData üzerinden X verisi 6-24 aylık geriye dönük (Brandwatch 10+ yıl)
Sadece Türkçe — Arapça, Kürtçe roadmap'te (Q3 2026)
Sadece kamuya açık içerik — kişisel mesaj, kapalı grup yok

8.2 Bilinen yanlılıklar

SocialData örneklem yanlılığı: Twitter API erişimi enterprise tier değil; örneklem yetkili API kadar tam değil
X İdeolojik bias: X kullanıcı popülasyonu Türkiye nüfusunu temsil etmiyor; sosyal medya söylem analizi ≠ anket
LLM bias: Grok 4.3 ve Claude Sonnet 4.5 İngilizce ağırlıklı eğitim verisinden gelir; TR siyasi bağlamda ek doğrulama önerilir
Verified ratio sapması: Verified hesap dağılımı bias ediyor — "trustworthy source" eşiği tek başına yetersiz

8.3 Yanlış pozitif riskler

Organik viral olaylar (deprem, terör) bot skoruyla işaretlenebilir
Birden fazla popüler hesabın aynı haberi paylaşması "echo ring" olarak okunabilir
Politik figürün resmi kampanya hashtag'i "narrative flooding" gibi görünebilir

Bu yüzden bot ve koordinasyon çıktıları her zaman alternative_hypothesis ile birlikte sunulur ve kullanıcı yorumlamasına bırakılır.

8.4 Sistemin kullanılamayacağı alanlar

TAMGAX ONOK AI Act anlamında "Yüksek-Risk" sistem değildir; aşağıdaki kararlar için kullanılması yasaktır:

İstihdam kararları (CV taraması, mülakat değerlendirme)
Kredi puanlama / finansal hizmet kararları
Sigorta primi belirleme
Eğitim/sınav değerlendirmesi
Yargı, polis veya göç kararlarını resmi destekleyici araç olarak
Biyometrik tanımlama
Kritik altyapı yönetimi

9. Karşılaştırma ve Akademik Konum

Özellik	Brandwatch / Talkwalker	Graphika	TAMGAX ONOK
Tarihsel arşiv	10+ yıl	3 yıl	3-24 ay (KBA genişletmesi planlı)
Observed/Inferred ayrımı	❌	kısmen	✅ schema seviyesinde
Confidence rozeti	❌	akademik makalede	✅ her bloğa zorunlu
Hallucination guardrails	—	—	✅ 8 yasaklı pattern
Probabilistic dil	❌ "Insights"	kısmen	✅ kesin hüküm dili yasak
Bot çoklu-katman	tek skor	akademik	✅ 8 katman + ağırlıklı
TR ontoloji	❌	❌	✅ 700+ entity TR ontology
Açık metodoloji	iç doküman	akademik paper	✅ public whitepaper

9.1 Akademik literatür konumu

TAMGAX ONOK'un katkı sağladığı alanlar:

Explainable AI for OSINT: Her LLM çıkarımına source attribution + confidence — Sokoler et al. (2024) önerdiği "audit trail" pattern'ına yakın
Coordinated Inauthentic Behavior (CIB) tespiti: Pacheco et al. (2021) çoklu-sinyal yaklaşımının ticari uygulaması
Probabilistic media intelligence: Watanabe (2018) NLP-based political analysis tradition'ı + AI Act explainability gereklilikleri

10. Referanslar

European Union. (2024). Regulation (EU) 2024/1689 — Artificial Intelligence Act. Brussels.
KVKK. (2016). 6698 sayılı Kişisel Verilerin Korunması Kanunu. T.C. Resmi Gazete.
Pacheco, D. et al. (2021). "Uncovering Coordinated Networks on Social Media: Methods and Case Studies." ICWSM.
Watanabe, K. (2018). "Latent Semantic Scaling: A Semisupervised Text Analysis Technique for New Domains and Languages." Communication Methods and Measures.
Sokoler, E. et al. (2024). "Audit Trails for LLM-based Decision Support Systems." arXiv:2403.XXXXX.
ICD 203. (2015). Analytic Standards — Office of the Director of National Intelligence. United States.
Berkeley Protocol. (2020). International Protocol on Open Source Investigations. UC Berkeley Human Rights Center.
Wineburg, S. & McGrew, S. (2019). "Lateral Reading and the Nature of Expertise: Reading Less and Learning More When Evaluating Digital Information." Teachers College Record.

TAMGAX ONOK

Anakron Dijital Yönetim Medya Ltd. Şti. · Maltepe V.D. 8591427580
destek@tamgax.com · https://onok.tamgax.com

TAMGAX ONOKForensic Reliability Framework