← AI AÇIKLANABİLİRLİK
// FORENSIC METHODOLOGY · WHITEPAPER v1.0

TAMGAX ONOK
Forensic Reliability Framework

13-Noktalı Forensic Reliability Mode · Bot 8-Katman Davranış Modeli
Probabilistic Söylem Çıkarımı · Hallucination Guardrails · Explainable AI
Yayın: 18 Mayıs 2026 · Sürüm 1.0
Yazar: TAMGAX Mühendislik Ekibi · Anakron Dijital Ltd. Şti.
Atıf önerisi (APA):
TAMGAX Ekibi. (2026). TAMGAX ONOK Forensic Reliability Framework: 13-Noktalı Metodoloji (Sürüm 1.0). Anakron Dijital. https://onok.tamgax.com/onok/forensic-whitepaper
Lisans: CC BY-ND 4.0 (atıfla kullanım serbest, türev yasak)
İletişim: destek@tamgax.com
// İÇİNDEKİLER
  1. 1. Yönetici Özeti (Executive Summary)
  2. 2. Sistem Mimari ve Veri Akışı
  3. 3. 13-Noktalı Forensic Reliability Framework
  4. 4. Bot 8-Katman Davranış Modeli
  5. 5. Confidence Hesaplama Metodolojisi
  6. 6. Hallucination Guardrails ve Probabilistic Dil
  7. 7. Veri Doğrulama ve Kanıt Zinciri
  8. 8. Sistem Sınırları ve Bilinen Yanlılıklar
  9. 9. Karşılaştırma ve Akademik Konum
  10. 10. Referanslar

1. Yönetici Özeti

TAMGAX ONOK, kamuya açık sosyal medya ve haber verisi üzerinde karar destekleyici bir medya istihbarat platformudur. Bu doküman platformun analiz metodolojisini akademik kalitede tarif eder; gazetecilik, akademik araştırma, kurumsal iletişim ve siyasi danışmanlık amaçlarıyla çıktıların nasıl üretildiğini ve hangi güvence katmanlarıyla zenginleştirildiğini açıklar.

Platform, geleneksel sosyal medya monitör araçlarından (Brandwatch, Talkwalker, Crowdtangle) iki ana noktada ayrılır: (i) OBSERVED vs INFERRED ayrımı, ölçülen ham veri ile AI çıkarımı arasındaki sınırı açıkça tanımlar; (ii) Hallucination Guardrails, doğrulanmamış olay/isim/ oran üretimini engelleyen kural setidir. Çıktı dili olasılıksal'dır — kesin yargı yerine "veri temelli olasılıksal değerlendirme" sunar.

Kritik bulgu

LLM tabanlı analiz sistemlerinin yaygın hatası — "AI ile hazırlanmış sosyal medya özeti" — gazetecilik ve mahkeme süreçlerinde kanıt olarak kullanılamaz. TAMGAX ONOK bu boşluğu kapatmak için 13-noktalı bir framework ile her çıkarıma kaynak (source attribution), güven seviyesi (confidence) ve alternative hypothesis ekler.

2. Sistem Mimari ve Veri Akışı

2.1 Stack

KatmanTeknolojiSorumluluk
FrontendNext.js 16 (App Router), React 19Dashboard + report rendering
API / BFFVercel Functions (Node.js 24, fluid compute)Auth, rate-limit, orchestration
DatabaseNeon PostgresUser + ledger + audit
Cache + QueueRedis (Upstash)Cache, distRateLimit, slot manager
Analytics backendHetzner Cloud (Python, FastAPI)Scout puller + Apache AGE graph (KBA)
Primary AIxAI Grok 4.3Web/X search + analiz
Synthesis AIAnthropic Claude Sonnet 4.5Yapılandırma, akademik dil (opsiyonel)
Data sourceSocialData (X), YouTube Data API, açık webPublic-only veri toplama

2.2 Veri akışı (KONU analizi örneği)

Kullanıcı sorgu → Vercel /api/onok/gx-konu
  → Auth + RateLimit + CostGuard + Concurrency check
  → Scout backend (Hetzner Node 1) async job
    → SocialData bucketed pull (13 hafta × ~500 tweet = 6500)
    → Engagement DESC sort + top 200 tweets to Grok prompt
    → Grok x_search (gerçek zamanlı X derin tarama)
    → Schema-bound JSON çıktı (13-katman forensic)
  → JSON repair (jsonrepair lib)
  → Cache write (Redis, TTL plan bazlı)
  → Frontend polling /grok-job/:id
  → Markdown/JSON dual render

2.3 İzlenebilirlik

Her istek `request_id` (UUID v4 türevi 16 karakter) ile etiketlenir ve istek-yanıt-cost satırlarında bu ID korunur. Audit log Postgres'te tutulur, KVKK 30 günlük sorgulara cevap için referans olarak kullanılır.

3. 13-Noktalı Forensic Reliability Framework

Her analitik modülün çıktı şeması aşağıdaki 13 katmandan üretilir. Modül-bağımsız ortak bir standarttır — SEÇMEN/KONU/MEDYA/AKTOR/ALGI hepsi aynı katmanları kullanır.

#KatmanGaranti
1Observed vs InferredÖlçülen veri (tweet sayısı, engagement) ayrı blok; AI çıkarımı (skor, ton) ayrı blok
2Confidence ScoreHer inferred bloğa 4 seviye: high / medium / low / speculative
3Source Attributionsample_size + verified_ratio + time_range + platforms
4Hallucination Guardrails8 yasaklı pattern (Bölüm 6); guard_log dönüşte true/false
5Multi-Layer Bot Model8 davranış katmanı (Bölüm 4)
6Demographic WarningProbabilistic etiket + "anket DEĞİL" uyarısı
7Semantic Evidencerepresentative_tweets + evidence_count + counter_narrative_ratio
8Verified TimelineSadece kaynaklı olaylar; her events `verified` flag + citation_links
9Visual Reliability UIMavi (observed) · sarı (inferred) · kırmızı (speculative) renk kodu
10Advanced NLPStance + drift + propaganda detection (modül bazlı, opsiyonel)
11Forensic Traceability"Explain this insight" — hangi tweet, hangi model, ne zaman
12Risk & Reliability Layerevidence_strength + hallucination_risk + political_bias_risk + sampling_bias_risk
13Explainable Outputwhy_this_conclusion + data_sources_used + signals_found

3.1 Observed vs Inferred ayrımı (Katman 1)

Geleneksel sosyal medya analizinde "tweet sayısı 925" ile "polarizasyon skoru 65" aynı kategoride sunulur — kullanıcı hangisinin ölçüm hangisinin yorum olduğunu ayırt edemez. TAMGAX schema'sı:

result = { "observed_data": { // ölçülen, sayılabilir "tweet_sayisi_analiz": 925, "unique_account_count": 712, "verified_account_ratio": 8.2, "engagement_total": 24310, "_source": { "platforms": ["X", "YouTube"], "extraction_confidence": "high" } }, "inferred_analysis": { // AI çıkarımı "polarizasyon_skoru": { "value": 65, "confidence": "medium", "rationale": "echo_chamber yoğunluğu + reply hostility" } } }

3.2 Confidence skorlama kuralları (Katman 2)

Her inferred bloğun confidence değeri, kaynak veri büyüklüğü ve çeşitliliğine göre deterministic olarak kapsanır. Sample size < 50 ise asla "high" verilmez; bu kural prompt seviyesinde Grok'a zorunlu kılınır.

confidence_level(sample_size, source_diversity, semantic_consistency): if sample_size < 20: return "speculative" if sample_size < 50: return min("low", computed) if sample_size < 200: return min("medium", computed) if source_diversity < 0.3: return min("low", computed) if semantic_consistency < 0.5: return min("medium", computed) return "high"

4. Bot 8-Katman Davranış Modeli

Tek-boyut bot skorlaması (örn "BotMeter") yanıltıcıdır. TAMGAX bot şüphesini 8 ayrı davranış sinyalinden komposit hesaplar:

KatmanSinyalSkor 0-100 etken
L1Paylaşım sıklığı anomalisitweet/saat dağılımının standart sapma z-skoru
L2Eşzamanlı paylaşım±60 saniye penceresinde benzer cümle yapısı oranı
L3Tekrar eden cümle kalıplarıtf-idf cosine similarity > 0.85 olan tweet çiftleri
L4Takipçi/takip dengesizliğifollowing / followers oranının log dağılımı outlier'ı
L5Hesap açılış kümelenmesicreated_at dağılımında ±7 günlük cluster yoğunluğu
L6Yeniden paylaşım hızıRT/quote kademe hızı; ilk 10 dk içinde > 100 RT
L7Zaman koordinasyonuSaat dilimi dağılımının entropy değeri
L8Entropi skoruİçerik çeşitliliği; düşük entropy = robotik düzen

4.1 Komposit bot skor formülü

bot_score = ( 0.18 × L1 (frequency) + 0.16 × L2 (sync) + 0.14 × L3 (duplicate) + 0.10 × L4 (imbalance) + 0.12 × L5 (creation cluster) + 0.10 × L6 (repost velocity) + 0.08 × L7 (temporal) + 0.12 × L8 (entropy) ) confidence = "high" if sample_size >= 500 "medium" if 100 <= sample_size < 500 "low" if sample_size < 100

Sonuç + her katmanın bireysel skoru her zaman gösterilir; kullanıcı hangi sinyalin yüksek olduğunu görüp organik viral patlama olasılığını değerlendirebilir.

4.2 Yanlış pozitif riski

Organik viral olaylar (örn deprem, terör saldırısı) yüksek bot skoru üretebilir — paylaşım sıklığı + senkron paylaşım L1+L2 patlar. Bu yüzden bot çıktısı her zamanalternative_hypothesis: "organik viral patlama da bu skoru üretebilir" ile sunulur.

5. Confidence Hesaplama Metodolojisi

5.1 4-seviye confidence sistemi

SeviyeTanımSample size minimumRenk kodu
HIGHÇoklu kaynak + yüksek semantic consistency + verified ratio > 30%n 200Yeşil
MEDIUMTek-iki kaynak + orta consistency + verified ratio > 10%50 n < 200Sarı
LOWSınırlı sample + zayıf cross-validation20 n < 50Turuncu
SPECULATIVEÇok düşük sample + yorumsal çıkarımn < 20Kırmızı

5.2 Faktör matrisi

Confidence aşağıdaki 6 faktörün ağırlıklı kombinasyonundan üretilir:

confidence_score = clamp(0-100, 0.25 × normalize(sample_size, log_scale) + 0.20 × source_diversity_ratio + 0.15 × inverse(duplicate_ratio) + 0.15 × semantic_consistency + 0.15 × cross_platform_verification + 0.10 × temporal_stability ) level = HIGH if score >= 75 MEDIUM if 50 <= score < 75 LOW if 25 <= score < 50 SPECULATIVE if score < 25

5.3 Source attribution

Her inferred bloğa zorunlu kaynak metaveri:

"_source": {
  "sample_size": 925,
  "verified_account_ratio": 8.2,
  "time_range": "2026-04-18 → 2026-05-17",
  "platforms": ["X", "YouTube"],
  "extraction_confidence": "high"
}

6. Hallucination Guardrails ve Probabilistic Dil

6.1 8 yasaklı pattern

  1. Doğrulanmamış istifa: Resmi kaynak yoksa "X istifa etti" yazmak yasak. Sadece corpus'ta var ise iddia/söylenti olarak işaretle.
  2. İsimsiz olay: Her olayın tarihi + kaynağı olmalı; "bilinmeyen bir gelişme" YASAK.
  3. Kaynaksız oran: Anket yüzdeleri için anket_kaynaklari alanı zorunlu (Metropoll, Konda, Areda vb).
  4. Model varsayımı = fact sunmak: Çıkarım, mutlaka confidence rozetiyle etiketli.
  5. Kesin hüküm dili: "Kaybediyor / düşüyor / erimekte" yerine "negatif söylem yoğunluğu gözlemlendi".
  6. Sample < 50 ile high confidence: Asla — otomatik low/speculative'e demote edilir.
  7. Demografik kesinlik: "Gençler partiyi terk etti" yerine probabilistic: "genç hesaplarda negatif söylem oranı %X".
  8. Source attribution eksikliği: sample_size + verified_ratio + time_range her inferred bloğa zorunlu.

6.2 Probabilistic dil dönüşümü

❌ Kesin hüküm (yasak)✅ Probabilistic ifade
"MHP genç seçmeni kaybediyor""Analiz edilen örneklemde genç kullanıcı segmentinde negatif söylem yoğunluğu gözlemlendi"
"İktidar medyası tarafsız değil""İktidar yanlısı kaynaklarda destekleyici ton %X, framing tutarlılığı yüksek"
"Bu trend bot operasyonu""Düşük ihtimal koordineli amplifikasyon (%18 confidence) — organik viral patlama da bu skoru üretebilir"

6.3 Guard log

Her çıktının sonunda compliance log:

"hallucination_guardrails": {
  "compliance": "strict",
  "guard_log": {
    "doğrulanmamis_olaylar_eklenmedi": true,
    "isimsiz_olaylar_eklenmedi": true,
    "kaynaksiz_oranlar_eklenmedi": true,
    "olasiliksal_dil_kullanildi": true
  }
}

7. Veri Doğrulama ve Kanıt Zinciri

7.1 Timeline doğrulama

Olay zaman çizelgesine yalnızca doğrulanmış kayıtlar eklenir. Doğrulama kriterleri:

Doğrulanmamış spekülasyon ayrı bölüm olarak işaretlenir ve verified: false +confidence: low ile sunulur.

7.2 Forensic evidence panel

Her büyük iddia için zorunlu metaveri:

"forensic_evidence": [{
  "claim": "TRT-1'de iddia X tarihinde Y kez işlendi",
  "source_post_count": 38,
  "semantic_similarity": 0.72,
  "verified_source_ratio": 0.45,
  "engagement_evidence": 12450,
  "first_appearance_timestamp": "2026-05-09 14:23",
  "citation_links": ["https://...", "https://..."]
}]

7.3 Chain-of-evidence (mahkeme süreçleri için)

Forensic Reliability Mode aktif raporda her insight'a "Why this conclusion?" açılır paneli bağlanır. Bu panelde:

Bu kayıt mahkeme delili / akademik atıf için yeterli izlenebilirlik sağlar.

8. Sistem Sınırları ve Bilinen Yanlılıklar

8.1 Veri kapsamı sınırları

8.2 Bilinen yanlılıklar

8.3 Yanlış pozitif riskler

Bu yüzden bot ve koordinasyon çıktıları her zaman alternative_hypothesis ile birlikte sunulur ve kullanıcı yorumlamasına bırakılır.

8.4 Sistemin kullanılamayacağı alanlar

TAMGAX ONOK AI Act anlamında "Yüksek-Risk" sistem değildir; aşağıdaki kararlar için kullanılması yasaktır:

9. Karşılaştırma ve Akademik Konum

ÖzellikBrandwatch / TalkwalkerGraphikaTAMGAX ONOK
Tarihsel arşiv10+ yıl3 yıl3-24 ay (KBA genişletmesi planlı)
Observed/Inferred ayrımıkısmen✅ schema seviyesinde
Confidence rozetiakademik makalede✅ her bloğa zorunlu
Hallucination guardrails✅ 8 yasaklı pattern
Probabilistic dil❌ "Insights"kısmen✅ kesin hüküm dili yasak
Bot çoklu-katmantek skorakademik✅ 8 katman + ağırlıklı
TR ontoloji✅ 700+ entity TR ontology
Açık metodolojiiç dokümanakademik paper✅ public whitepaper

9.1 Akademik literatür konumu

TAMGAX ONOK'un katkı sağladığı alanlar:

10. Referanslar

  1. European Union. (2024). Regulation (EU) 2024/1689 — Artificial Intelligence Act. Brussels.
  2. KVKK. (2016). 6698 sayılı Kişisel Verilerin Korunması Kanunu. T.C. Resmi Gazete.
  3. Pacheco, D. et al. (2021). "Uncovering Coordinated Networks on Social Media: Methods and Case Studies." ICWSM.
  4. Watanabe, K. (2018). "Latent Semantic Scaling: A Semisupervised Text Analysis Technique for New Domains and Languages." Communication Methods and Measures.
  5. Sokoler, E. et al. (2024). "Audit Trails for LLM-based Decision Support Systems." arXiv:2403.XXXXX.
  6. ICD 203. (2015). Analytic Standards — Office of the Director of National Intelligence. United States.
  7. Berkeley Protocol. (2020). International Protocol on Open Source Investigations. UC Berkeley Human Rights Center.
  8. Wineburg, S. & McGrew, S. (2019). "Lateral Reading and the Nature of Expertise: Reading Less and Learning More When Evaluating Digital Information." Teachers College Record.
TAMGAX ONOK
Anakron Dijital Yönetim Medya Ltd. Şti. · Maltepe V.D. 8591427580
destek@tamgax.com · https://onok.tamgax.com
© 2026 ANAKRON DİJİTAL · CC BY-ND 4.0 · v1.0