بۆچی ئەم بنچمارکە هەیە و چی دەسەلمێنێت

تفسیرکردنی تاقیکردنی خوێن بە یارمەتی توانا (AI) بە ئێستا زیاتر بەکاردێت لە ڕێکارە کڕیار-بەکارهێنەر و ڕێکارە کلینیکی، بەڵام ڕێکخستنەوەی بنچمارکی بەهێز و دۆزینەوەی ڕەستەوخۆ (reproducible) کە بۆ پزیشکی لابراتۆری تەرخانکراو بێت هێشتا کەمە. پرسیارە گرنگەکان لەم شوێنەدا ئەوان نییەن کە لە بنچمارکە گشتییەکانی پرسیار-وەڵامدانی پزیشکیدا ڕوونکراون: ئایا دەتوانێت ئەنجامدەری (engine) کەمبودی ئاسن لە ڕەگەزەی تالاسێمییەوە جیا بکات کاتێک MCV (حجمە ناوەندییەی سلولی خوێنی) یەکسانە؟ ئایا زۆر-پزیشککردنی Gilbert's syndrome دەکات وەک هەپاتایت؟ و ئایا پاتۆلۆژی دروست دەکات لە پەکەی پشکنینی تەواو ڕاستەوخۆی بەرزسالی؟

ڕێنموداری ڕێکخراوی پێش-تۆمارکراو (rubric) کە دەبینێت چۆن ئەنجامدانی Kantesti AI Engine لەسەر بنەما سەردەمی نمرەدان (scoring criteria) یخ-کراو دەسەلمێنرێت
Wêne 1: سەرچاوەی بنچمارک — هەر ڕووداو، هەر کلیل‌وەرد، هەر سیستەمی نمرەدان — لە پێش ئەوەی مووتور یەک PDF بینێت لە کۆدی سەرچاوەدا دیاریکراوە. گونجاندنی ڕێسای پاشەوە (post-hoc) بە شێوەی دەستکاریکردن ناشتوانە بە هۆی ڕێکخستنی پێشینی.

یەک پەنێلی تاقیکردنی خوێن بە گشتی زۆر سیگنالی هەیە بۆ پشتیوانی لە چەند وێنەی جیاواز کە لە یەکدی تر دەکێشن، و کارەکەی پزیشکی تێکۆڵەر لەوەدایە کە ئەو وێنایانە لە یەکدی تر تراز بکات، نەک ئەوەی وەک وەڵامی کتێبی بگەڕێت. ئەو مووتورەی کە لە وێنە کتێبییەکان باش دەکات، هێشتا دەتوانێت لەو وێنە گرنگانەدا کەوتوو بێت: هەڵەکانی تێکەڵبوونی تێشخیص (differential-diagnosis)؛ و گۆڕاوە بەدەنگەوە (benign variants) کە لە تەنیشتدا دەبنە هەستیار و ترسناک؛ و پەنێلە تەواو ڕاستەوخۆ (fully normal) کە یاوەری یارمەتیدەرە باوەڕپێکراوەکان دەکات بۆ دروستکردنی پاتۆلۆژی.

ئەم بنچمارکە بە دڵنیایی لەسەر ئەو شێوە هەڵەبوونانە دروستکراوە. هەر یەک لە پازدە ڕووداوەکان (fifteen cases) بۆ یەک تایبەتمەندی تێشخیصی دیاریکراوە: میکرۆسیتۆسێی لەبەر کمبوونی ئاسن (iron-deficient microcytosis) کە دەبێت لە تایبەتمەندی beta-thalassaemia جیا بکرێت کە هەمان ناوەندی ڕێژەی جەسەمی خوێن (mean corpuscular volume) هەیە؛ ڕوونکردنەوەی Gilbert's syndrome کە تەنها هەڵەیەکی غیرعادی تێدایە بە شێوەی بەرزبوونی تەنها (isolated) غیرمستقیم (indirect)ی بیلیروبین؛ و پەنێلی ڕاگەیاندنی (screening) پازدە پارامێتەر کە هەر یەک لە ئانالیتەکان لە ناوەندی ڕێسەی خۆی (reference range) دایە. ڕێساکە (rubric) پاداشتی ئەو مووتورانە دەدات کە هەر ڕووداوەکە لەسەر شێوەی خۆی لێکدەدەن و سزا دەدات بۆ ئەو مووتورانە کە دەچن بۆ تێشخیصێکی باوەڕپێکراو کە هیچ یەک لەو تێشخیصە پێویست نییە.

وەک توماس کلاین، د.م. (Thomas Klein, MD)، من پەنێلی ڕووداوەکان هەڵبژارد چونکە ئەو شێوەیەی کە یارمەتیدەرەکانی لەبەردەستکردنی زانیاری لە مێژووی لابراتۆر (laboratory-medicine assistants) زۆرترین هەڵە لێی دەکەن، ئەمانەن. شێوەی هەڵەی گرانبها ئەوە نییە "لەدەستدانی نەخۆشییەکەی نایاب" — بەڵکو ئەوەیە پاتۆلۆژیی ڕێوتین (routine pathology) دروست بکات لە نەخۆشانی کە ئەوەیان نییە. Yên me Pejirandina Bijîşkî hub چارچێوەی گشتی دەنووسێت؛ ئەم لاپەڕەیە ئەنجامی بەکارهاتووی (applied result) لەسەر مووتوری V11 دەنووسێت.

ڕونانی دوایین ـ V11 (ئاپرێڵ 2026)

ڕێکخستنی ڕەفرێنس لە مانگی ئاپرێلی 2026 بۆ Kantesti AI Engine V11 نمرەی یەکپارچە (composite) دروستکرد بە 99.12% لەسەر ڕێسای پێش‌تۆمارکراوی پازدە ڕووداو. هەردوو ڕووداوی دامەزراندنی تێشخیص لەسەر سەقف (ceiling) نمرەیان گرت. شاخصی Mentzer بە شێوەی ڕاست لەسەر جیاکردنەوەی کمبوونی ئاسن لە مقابل beta-thalassaemia بەکار هێنرا.

یەکپارچە 99.12% 15 لە 15 ڕووداو نمرەیان گرت
0.998 نمرەی سەرچاوەی ڕێکخستنی (Structural score)
0.998 نمرەی کلینیکی (Clinical score)
20.17 s ناوەندی کەمبوونەوەی وەڵام (Mean latency)
0 / 13 دامەزراندنی هەڵەی دروست-نەبوون (Trap false-positives)

وازەی یەکپارچە (composite formula) سێ بەش یەک دەکات: ڕێککەوتنی سەرچاوەیی (structural conformance) لەگەڵ حەوت بەشی ڕاپۆرتی مەجبوری و شانزە زیربەشی مەجبوری،, ڕاستی کلینیکی (clinical accuracy) بە شێوەی “یادکردنەوەی کلیل‌وەرد” (keyword recall) + “یادکردنەوەی سیستەمی نمرەدان” (scoring-system recall) + پشکنینی ڕاستی (validity) لەسەر دابەشبوونی ڕێژەیی (probability-distribution) و کەمبوونەوەی وەڵام (response latency) لە دژی ئامانجی سەرەکی-خزمەتگوزاری 20 کاتژمێر/دووەنی (20-second primary-path service-level target). تەجزیەی تەواوەکە لە وازەی ڕێساکەی خوارەوە پیشان دراوە.

یەکپارچە = 0.35 × سەرچاوەیی (Structural) + 0.55 × کلینیکی (Clinical) + 0.10 × نهێنی‌بوون (Latency)

0.88 پوەنتی بەقیمانەی هێڵی پشتیوانی (headroom) نزیکەی هەمووی لە زیانبوونی نهێنی‌بوون (latency loss) دەکاتەوە — سێ داواکاری پاشەکەوتەی Phase 2 لە هەر یەکەوە بە -0.05 کۆمپووزیت (composite) هەر یەکەیان نزیکەی 0.60 لە 0.88 پوەنت کسرییەکە بەخشی — نەک لە ناوەڕۆکی کلینیکی. مووتورەکە هیچ لە پازدە هەڵسەنگاندنەکاندا نەچوونە لە وەڵامدانەوەی ڕاستی پێناسەی ڕێکخراو؛ لە شوێنێکدا کەمبوو، بەوە کەمبوو کە لە زۆربەی کەمێک لە داواکارییەکاندا تەواوبوونێکی کەمێک زیاتر لە 20 کاتژمێر/دووەیەک (20-second) مەودای سەرەکی-ڕێگای (primary-path) هەبوو.

پازدە کیس لە هەفت بەشی تایبەتمەندی پزیشکی

پەنەلی هەڵسەنگاندن هەفت تەخصص دەگرێت — هەیماتۆلۆژی، ئەندۆکرینۆلۆژی، پزیشکیی مەتابۆلیک، هێپاتۆلۆژی، نێفرۆلۆژی، کاردیۆلۆژی، ڕوماتۆلۆژی — هەروەها دوو هەڵسەنگاندنی تایبەتی دامەزراندنی تێکەڵکردنی هەڵە (hyperdiagnosis trap). هەر هەڵسەنگاندنێک وەک پەڕەی ڕاستی نەناسراو (anonymised) لە ڕێپۆزیتۆری Kantesti لە داتای کلینیکی دەهێنرێت بە پێداچوونی ڕەزامەندی ئاگادار لە نووسراوەوە.

مێپەی پۆشینەوەی پازدە ڕووداوی خوێنی بەناونیشان (anonymised) کە لە هەفت پسپۆری پزیشکی دابەشکراون، بەهەمان شێوەش ڕووداوە دامەزراندنی هەڵە-بەردەوامی (hyperdiagnosis trap)
Wêne 2: توزیع لە هەیماتۆلۆژی، ئەندۆکرینۆلۆژی، پزیشکیی مەتابۆلیک، هێپاتۆلۆژی، نێفرۆلۆژی، کاردیۆلۆژی، ڕوماتۆلۆژی — هەروەها دوو هەڵسەنگاندنی دامەزراندنی تێکەڵکردنی هەڵە: نەخۆشی گیلبرتی (Gilbert's syndrome) و پەنەلی سکرینینگی تەواو ڕاستەوخۆ (fully normal).

ناساندنەوەی نەناسراوی (De-identification) بە شێوازی Safe Harbor ئەنجامدرا: هەموو ناسنامە تایبەتییە ڕاستەوخۆکان لەبەرکران یان جێگۆڕان کران، و هەر ڕیکۆردێک کۆدی نێوخۆیی-بنچمارکی (benchmark-internal case code) بە شێوەی BT-NNN-LABEL پێناسەکرا. پڕۆسەکردن بە پێی GDPR ماددە 9(2)(j) بۆ توێژینەوەی زانستی بە هەڵسەنگاندنی پاراستنی پێویست، و ڕێوشوێنی هاوشێوەی UK GDPR. هیچ زانیارییەکی تایبەتمەند-نەناسراو (personally identifying information) لە هەر شوێنێکدا لە ناوەڕۆکی هارنیسی (harness) باڵکراو، ڕاپۆرتی تەکنیکی، یان داتاسێتە ئازادکراوەکاندا نییە.

هەیماتۆلۆژی (3) BT-001, BT-006, BT-007 ئەنیمیا لەبەر کەمبوونی ئاسن (Iron deficiency anaemia) · کەمبوونی B12 · تەلەسەمیای بتا-خفیف (Beta-thalassaemia minor)
ئەندۆکرینۆلۆژی (3) BT-002, BT-008, BT-012 تێرۆئیدایتی هاشیمۆتۆ (Hashimoto's thyroiditis) · PCOS لەگەڵ نەهێڵی کاری ئینسولین (insulin resistance) · کەمبوونی سەختی ویتامینی D
مەتابۆلیک (2) BT-003, BT-013 T2DM لەگەڵ نەخۆشییە مەتابۆلیک (metabolic syndrome) · هایپەرئوریکێمیا (Hyperuricaemia) لەگەڵ مەترسی گوت (gout)
هێپاتۆلۆژی (2) BT-004, BT-009 NAFLD / NASH · هەڵەی ڤایرۆسی سەختی هێپاتیت
نێفرۆلۆژی · کاردیۆلۆژی · ڕوماتۆلۆژی (3) BT-005, BT-010, BT-011 CKD پەلەی 3 · دیسلێپیدێمیای تێکەڵکەرەوەی ئەتەروژنیک (Atherogenic dyslipidaemia) · لۆپوسی ڕەشەیی سیستەمی (Systemic lupus erythematosus)
هەڵسەنگاندنی دامەزراندنی تێکەڵکردنی هەڵە (2) BT-014, BT-015 نەخۆشی گیلبرتی (تەنها هایپەر بیلیروبینێمیا لەبەر ڕێژەی غیرمستقیم) · سکرینینگی بەڵغی ڕاستەوخۆی بەدەستەوەی ئادڵت

بۆچی ئەم توزیعە تایبەتمەندە

لە هەژمارییەکان سێ کەیس دەدرێت چونکە جیاوازییە میکروسایتیکەکان و جیاوازییە ماکروسایتیکەکان زۆرترین دامەزراندنەکانن لە کارکردی ڕاستەقینەی لابراتۆری. لە ئەندۆکرینۆلۆجی سێ کەیس دەدرێت چونکە پیشکەوتنی Hashimoto's، PCOS، و کمبودی ویتامین D شێوە جیاوازەکان دەهێنن بۆ دۆزینەوە (لەوانەی خۆ-ئانتی‌بادی دەرهەقەکەوتوو، لەوانەی نێسبەتی هۆرمۆن-محور، و لەوانەی یەک-نیشان-محور). تایبەتمەندییە یەک-کەیسەکان هێشتا مانادارن چونکە هەر یەک لە CKD، خەتری ASCVD، و SLE سیستەمی خۆی بۆ نمرەدان هەیە کە ئەنجامەکە دەبێت بەکاربهێنێت (KDIGO پەلەبەندی، خەتری 10 ساڵەی ASCVD، و 2019 EULAR/ACR بۆ شێوەی SLE بە شێوەی یەکەوە).

روبریک پێش‌تۆمارکراوەکە، ڕوونکراوە

پێش-تۆمارکردن گرنگترین هەڵبژاردەی ڕێکارەتییە لە ئەم بنچمارکە. هەر دۆزینەوەی هەموارکراو، هەر سیستەمی نمرەدان لینییەوە، و هەر بەشی ڕاپۆرت لە کۆدی سەرچاوەدا قەدەغەکراو بوو پێش ئەوەی ئەنجامەکە بەکاربهێنرێت. لەبەر ئەوە، تەونکردنی دوای-لەوەی ڕێگاکان بۆ ڕەخنەگرتن/خوشکردنی ئەنجامەکە ناممکنە.

سێ بەش دەکەنە یەک نمرەی یەکپارچە. ئەو بەشی سەرکەوتن/سەرکەوتاری (structural) 35 لەسەد دەبێت و دەسەلمێنێت ئایا ئەنجامەکە هەفت بەشی اجباریی ڕاپۆرت (سەردێڕ، ڕوونکردنەوەی کورت، سەرەکیترین دۆزینەوەکان، جیاوازی، سیستەمەکانی نمرەدان، پێشنیارەکان، دوای-لەوە) و شانزە بەشی اجباری لە ناو هەموویاندا برگەی هەبووە. بەشی هەبوونی سەکشن 40 لەسەد وزن دەدات و بەشی هەبوونی ساب-سەکشن 60 لەسەد وزن دەدات لە ژمارەی سەرکەوتاری.

Ew بەشی کلینیکی (clinical) 55 لەسەد دەبێت و سێ شت یەک دەکات: یادکردنەوەی وشە-کلیدی دۆزینەوە (70 لەسەد لە نمرەی زیربەشی کلینیکی)، یادکردنەوەی سیستەمی نمرەدان (20 لەسەد — ئایا ئەنجامەکە Mentzer، FIB-4، HOMA-IR، خەتری ASCVD، KDIGO پەلەبەندی، و ڕیارەکانی EULAR/ACR لە کاتێکدا پێویستە محاسبه دەکات)، و چێککردنی درستی-کۆمەڵی هەملەوە (10 لەسەد — بایەخی جیاوازییەکان دەبێت کۆیەکەیان لە ناو بازەی [90, 110] بمێنێت). بۆ کەیسە دامەزراندنەکان، جریمهیەکی ڕوون بۆ «هەردۆزینەوەی زیاتر» تا 0.30 دەکەوێت، کە لە 0.10 بۆ هەر پرچمی پاتۆلۆژی ساختەکراو محاسبه دەکرێت و لە سێ پرچمدا سنوردار دەبێت.

Ew بەشی کەم-لەوەی دەم/لاتێنسی (latency) 10 لەسەد دەبێت. وەڵامێک کەمتر لە 20 کاتژمێر/دوایە (seconds) دەبێت 0.10 بەکامل دەبێت، وەڵامێک کەمتر لە 40 کاتژمێر/دوایە دەبێت 0.05، و هەر شتێک زۆرتر دەبێت صفر. ئامانجی 20 کاتژمێر/دوایە بازتابی ڕێکخستنی ئامادەسازی/خزمەت-دەستەواژەی سەرەکییە (production primary-path service-level objective) ـە؛ سنوردانی 40 کاتژمێر/دوایە بازتابی بودجەی پاشگەردانی (fallback) بۆ فەزای 2 ـە بۆ کاتێکی ئەنجامەکە زۆر بەهێز/گرانی بەکاربهێنرێت.

وێنەی کۆتایی (terminal screenshot) لە بەستەری بنچمارکی Kantesti کە لایسەنس MIT هەیە، دەچێت و نمرەکانی هەر ڕووداوێک دەردەهێنێت
Wêne 3: لەبەرچاوگرتنی (harness) لە کاتێکی جێبەجێکردن. هەر کەیسێک دەردەکەوێت بۆ A4 PDF، دەگوێزرێت بۆ ڕێچکەی v11 ـی پرۆداکشن، و لەسەر ڕێگای یخ-کراو (frozen rubric) نمرە دەدرێت. هەر وەڵامی خام لەگەڵ یەکپارچە نمرەکارتەکە (aggregated scorecard) پاشەکەوت دەکرێت.

چی پێش-تۆمارکردن دەگرێت

بنچمارکەکانی لایەن-یەکەم (first-party) زۆرجار بەهۆی تەونکردنی ڕێگاکان لە دوای-لەوەدا ژمارەکانی خۆیان زۆر دەکەن. شێوەکە زۆرجار یەکسانە: تیم ئەنجامەکە دەڕێت، دەبینێت لە کوێدا کەم دەسەڵاتە، دواتر بە ئاسایی ڕێگاکان تەون دەکات بۆ ئەو ناوچانەی کەم دەسەڵاتە کەمتر حساب بکرێن. بە تۆمارکردنی ڕێگاکان لە کۆدی سەرچاوە پێش یەکەم بانگی ئەنجامەکە و بڵاوکردنەوەی harness بە لایسەنس MIT، ئەو تەونکردنە دەبینراو دەبێت لە ناو وێژن-کۆنترۆڵ. هەر کەسێک دەتوانێت ڕێپۆزیتۆری بکڵۆن بکات، داتەی نووسەری ڕێگاکان چێک بکات، و دڵنیابێت کە وەڵامەکانی ئەنجامەکە بەکارنەهاتوون بۆ شێپەدان/ڕێکخستنی نمرەدان.

کیسەکانی دامەزراندنی هێپر-دیئاگنۆز (Hyperdiagnosis) — بۆچی زۆر-داواکاری (over-calling) ڕێژەی شکستی سەرەکییە

زۆر-هەڵگرتنی (over-calling) پاتۆلۆژی لە سکرینەکانی ڕاستەوخۆی نۆرم، شێوەی نەکامییەکی ڕوونە کە لە یارمەتی-پزشکییەکانی بۆ بەکارهێنەری کڕیار (consumer-facing) ڕوونکراوە. هەڵسەنگاندنە دوایینەکەی لەگەڵ خەرجی ناڕەوا دەچێت: توێژینەوەی ناچار، دڵتەنگیی نەخۆش، و کارکردی نادروستی (iatrogenic workup). دوو کەیسە دامەزراندنەکان لە ئەم بنچمارکەدا دروستکراون بۆ ئەو نەکامییە ڕوون و نمرەپذیر بکەن.

بەراوردی لەبەر یەکدی (side-by-side) لە AI-ی سادە کە هەپاتایت لەسەر پەنێلی سندرۆمی گیلبرتی (Gilbert's syndrome) دروست دەکات، بەرامبەر بە Kantesti engine کە بە شێوەی ڕاست UGT1A1 polymorphism ی خۆشخواز (benign) دەناسێنێت
Wêne 4: شێوەی دروستکردنی کەیسە دامەزراندن. ئەنجامەکە کە بە دڵنیایی Gilbert's syndrome وەک هێپاتایت دەناسێت، یان کە پاتۆلۆژی لێدەر/سنووری لەسەر سکرینی تەواو نۆرم دروست دەکات، جریمه دەدرێت — نەک پاداشتی بۆ ئەوە بدات کە دەنگی کلینیکی دەدات.

🟡 کەیسە دامەزراندن 1 — BT-014-GILBERT

پیشکەوتن. پیاوێکی 24 ساڵە باڵانسەکەی بیلیروبینی تەواو 2.4 mg/dL ـە. بەشی دایرێکت نۆرمە، ترانسفێرێزەکان و فێرمەی ئاسایی (alkaline phosphatase) لە ناو ڕێژەی ڕێفەرەنسدا دان، رێتیکولۆسایتەکان (reticulocytes) ناڕوون/ناڕاستەقینە نین، و haptoglobin و LDH هێمولایز (haemolysis) دەردەخەن.

تفسیر/هەڵسەنگاندنی ڕاست. Gilbert's syndrome — جۆرێکی خۆش/بێخەتەر UGT1A1 polymorphism. تفسیر دەبێت هێپاتایت، سیرۆز، ئانێمیای هێمولایتیک، یان بەستنی ڕێگای صفراوی (biliary obstruction) بەکار نەهێنێت.

ڕەسولتی V11. یەکپارچە 1.000. هیچ یەک لە شەش پرچمی سەرەکییەوە بۆ هەردۆزینەوەی زیاتر کە لێی سەیری کراو بوو، وەک دۆزینەوەی فعّال دەرنەکەوت.

🟡 کەیسە دامەزراندن 2 — BT-015-HEALTHY

پیشکەوتن. کچێکی 35 ساڵە، لەگەڵ پەنێلی ڕێکخستنی سکرینینگی پێنج-پارامێتەر (15 پارامێتەر). هەر یەک لە تاقیکردنەوەکان بە ئاسانی لە ناو بازەی سەرچاوەی ڕێفەرەنسدا دانیشتوون.

تفسیر/هەڵسەنگاندنی ڕاست. دڵخۆشکردنەوە و پەسەندکردنی ڕێژەی ژیان. تێگەیشتن نابێت بە شێوەیەک کێشەی لەسنوور (borderline) دروست بکات بۆ ئەوەی بەکاربردنی کلینیکی لەخۆی بگرێت.

ڕەسولتی V11. کۆمبۆزیت 1.000. هیچ کام لە هەفت ئاگادارکردنەوەی زیاده‌ڕۆیی سەرەکی (over-diagnosis) ــ دیابتێس، ئەنێمیا، خۆشبوونی کارکردنی تیروئید (hypothyroidism)، دیسلپیدیمیا، هێپاتیت، نەخۆشی کلیە، کمبود ــ نەبوون بە وەک وەک نەخۆشیی کاری (active diagnoses).

لە هەردوو تاقیکردنەوە (traps)، سیزدە ئاگادارکردنەوەی زیاده‌ڕۆیی (hyperdiagnosis) ــ سکرین کراون. هیچ کام لەوانە چالاک نەبوون. ئەمە ئەنجامێکە کە زۆرترین گرنگی هەیە بۆ هەر کلینیسینێک کە دەیەوێت لەوەی AI بۆ وەک ئامرازێکی تریاژ یان پێش-کۆنسالت بەکاربهێنێت: سیستەم نەخۆشی نەدروست کرد کە لەوەدا نەبوو.

شاخص منتزر: جیاکردنەوەی کەمبودی ئاسن لە ڕەگەزەی تالاسێمییەوە

دۆزینەوەی دووەم کە گرنگی زۆری هەیە لە جفتکردنی کیس BT-001 (ئەنێمیا بەهۆی کەمبوونی ئاسن) لەگەڵ کیس BT-007 (کوچکی بتا-تالاسێمیا، minor). هەردوو لەگەڵ میکرۆسیتۆس (microcytosis) دەردەکەون و ئەمە بە شێوەیەکی ناسراو کێشەی سەرەکییە بۆ کڵاسێفایەرە سادەکان. شاخصی Mentzer، کە بە شێوەی MCV بەسەر ژماری RBC ـەوە (RBC count) دابەش دەکرێت، لە کەمبوونی ئاسن زیاتر لە 13 ـە و لە ڕەگەزی تالاسێمیا کەمتر لە 13 ـە.

لە BT-001، نەخۆشەکە کچێکی 34 ساڵە بوو بە HGB 10.4 g/dL، MCV 72.4 fL، RBC 4.1 × 10¹²/L، فێریتین 6 ng/mL، و TIBC ـی بەرز. شاخصی Mentzer نزیکەی 17.7 پشتیوانی دەکات بۆ کەمبوونی ئاسنی بەهێز (absolute iron deficiency). لە BT-007، نەخۆشەکە پیاوێکی 28 ساڵە بوو بە میکرۆسیتۆس (MCV 65.8 fL) بەڵام ژماری RBC ـی بەرز 6.2، RDW ـی ڕێک (normal)، فێریتین ـی ڕێک، و HbA2 بە 5.6 percent. شاخصی Mentzer نزیکەی 10.6 دەلالەت دەکات بۆ ڕەگەزی تالاسێمیا، و HbA2 ـی بەرز ڕاستی بتا-تالاسێمیا مینور تایید دەکات.

ئەنێمیا بەهۆی کەمبوونی ئاسن Mentzer > 13 فێریتین کەم، TSAT کەم، TIBC بەرز، RDW بەرز
ڕەگەزی بتا-تالاسێمیا Mentzer < 13 فێریتین ڕێک، RDW ڕێک، HbA2 بەرز (>3.5%)، ژماری RBC بەرز

هەردوو کیسەکە نمرەی 1.000یان گرت. ئەنجامەکە شاخصی Mentzer بە ڕوونی لە هەردوو تێگەیشتنەوەدا بەکاربرد و لە هەموو هەنگاوێکدا دۆزینەوەی ڕاست پیشان دا. ئەمە یەکێکە لە دڵخۆشکەرترین ئەنجامە کلینیکییەکان لە هەموو بنچمارکەکە, ، چونکە نادرست کڵاسێفایکردنی ڕەگەزی تالاسێمیا بە وەک کەمبوونی ئاسن دەبێت بۆ دابەشکردنی پێداویستی ئاسن بە شێوەی ناڕەوا و دەستکەوتنی ڕێکخستنی خێزان (family-screening) بەجێ بمێنێت، و نادرست کڵاسێفایکردنی کەمبوونی ئاسن بە وەک تالاسێمیا دەبێت چارەسەری ڕوون و ڕاستەوخۆ بەخێرایی بکات. ئەمەی ڕێنمای ڕەنجی فێریتین ڕوونکردنەوەی بەستەری گشتییە لە بەرەوڕووی جیاوازی (differential) ـەوە.

ئەنجامە هەر-کەسێک لە ڕاگەیاندنی ئاپرێلی 2026

دوازدە لە پازدە کیس نمرەی سەرەکیی کۆمبۆزیت (ceiling composite score) ـی 1.000یان بەدەست هێنا لەسەر پات (primary path). سێ کیس بە ڕێگای پاشگەردانی فاز 2 (Phase 2 fallback) خزمەتکران، کە پاداشتی لاتێنسی 0.05 لەدەستدا، بەڵام هەموو ناوەڕۆکی کلینیکی و سەرچاوەیی (structural content) پاراست. یەک کیس لە یەک زیربەندی واجب (mandatory subsection) کەمبوو؛ یەکێکی تر بە شێوەیەکی کەمترکردنی بەڕێژەی ڕێژەی ڕێکخستنی ڕەخنەیی (probability distribution sum) ـی کەمترگەڕاند.

ناسنامەی کیس (Case ID) پسپۆڕی یەکپارچە لاتێنسی پات (Path)
BT-001-IDAHematolojî1.00017.8 sprimary
BT-006-B12Hematolojî1.00018.4 کاتژمێرprimary
BT-007-THALHematolojî1.00017.0 کاتژمێرprimary
BT-002-HASHEndokrinolojî0.95037.0 کاتژمێرهەڵبژاردەی دابەزین
BT-008-PCOSEndokrinolojî0.98718.6 کاتژمێرprimary
BT-003-T2DMMetabolîk1.00019.1 کاتژمێرprimary
BT-013-GOUTMetabolîk1.00019.4 کاتژمێرprimary
BT-004-NAFLDجێگرپزیشکی1.00019.6 کاتژمێرprimary
BT-009-VIRHEPجێگرپزیشکی0.95023.4 کاتژمێرهەڵبژاردەی دابەزین
BT-014-GILBERTدامەزراندن1.00018.9 کاتژمێرprimary
BT-005-CKDNefrolojî1.00017.4 کاتژمێرprimary
BT-010-ASCVDکاردیۆلۆژی1.00019.7 کاتژمێرprimary
BT-011-SLEرێماتۆلۆژی0.98118.2 sprimary
BT-012-VITDEndokrinolojî1.00019.3 sprimary
BT-015-HEALTHYدامەزراندن1.00018.7 sهەڵبژاردەی دابەزین

کەیسەکەی PCOS (BT-008) یەک بەشێکی سەرەکی (mandatory subsection) لە ڕێکخستنی وەسفی وەڵامدا لەدەستدا—پانزە لە شانزە بەجای شانزە لە شانزە—کە ئەمە نمرەی ڕێکخستاری (structural score) لە 1.000 بۆ 0.963 کەمکرد. کەیسەکەی SLE (BT-011) کۆمەتی کەمبوونەوەی کۆمەی ڕێژە-ڕەخنەی (probability-distribution sum) وەگەڕاندەوە کە نمرەی کلینیکی (clinical score) بۆ 0.965 کەمکرد لەگەڵ پاراستنی هەموو وشە سەرەکی دیانۆستیک و سیستەمی نمرەدان. هیچ یەک لە دوو کەیسە ناتەواوەکانە (sub-perfect) دیانۆستیکی ڕاست لەدەست نەدا.

ئەوەی کۆری سەرەکی نازانێت بۆمان

نمرەی 99.12 لە سەد لەسەر ئەم ڕێگریکاری (rubric) تایبەتی پێش-تۆمارکراوەدا نزیکەی کارایی لە سەرەوەی ڕێژە (near-ceiling performance) دەنوێنێت، بەڵام پێویستە بە دقت ڕوونکردنەوەی بۆ بکرێت. ئەنجامەکە ڕەفتاری ئێنجینەکە دەنوێنێت لە بەرامبەر پانزە کەیسێکی دیاریکراوی بەناوبانگ-نەناسراو (anonymised) کە هەریەک جارێک لەسەر یەک ڕێگریکار (single rubric) لێکۆڵینەوەیان لێکراوە. ئێمە ڕوون دەکەینەوە کە ئەم ژمارەیە چی دەسەلمێنێت و چی دەسەلمێنێت نییە.

نمرەکە دەڵێت ئێنجین V11 ڕێما-دیانۆستیکی (diagnostic patterns) کە بۆ ئەم لێکۆڵینەوەیە هەڵبژێردراون بە ڕێک و ڕێک لەسەر ئەو میتۆدۆلۆژییەی کە بڵاوکراوە و دۆبەڕەوە-پێکراوە (reproducible) بەڕێوە بردووە. ئەمە نایڵێت ئێنجینەکە هەموو پەنێڵە خوێن-تاقیکردنەوەکان (blood test panel) کە لە دنیای ڕاستدا هەن ڕاستە. ئەمە نایڵێت ئێنجینەکە پێویستە جێگای ڕای کلینیسین (clinician judgment) بگرێت. وە هەروەها نایڵێت ئێنجینەکە زیاتر لە سیستەمی AI ی تر دەکات—لێکۆڵینەوەی بەراوردی لەگەڵ ئێنجینەکانی تر بە دڵنیاییەوە لە دایرەی ئەم ڕاپۆرتەدا نەبوو (deliberately out of scope).

ئەوەی نمرەکە دەسەلمێنێت بریتییە لە بنەمایەک (baseline). کاتێک ڕێگریکار و هارنس (harness) ئاشکرا بن، وەرسەکانی داهاتووی ئێنجینەکە دەتوانرێت لەسەر هەمان پانزە کەیسەدا لێکۆڵینەوە بکرێت، و کەمبوونەوە/جیاوازی نێوان نمرەی بڵاوکراو و هەر جارێکی دواتر خۆی بەخۆی دەتوانرێت بەسەنگ بکرێت. ئەمە بەهای پێش-تۆمارکردنە (pre-registration) : ئەوەی دەعاوی کارایی (performance claims) دەگۆڕێت بۆ دەعاوی دەتوانرێت لێتاقیکردنەوە (testable claims).

چۆن ئەم بنچمارکە دروست بکەین لە 10 خولەکدا

بەدووبارەکردن (Reproduction) تەنها پێویستی بە جۆرێک لە وەسڵی API (Kantesti) و هەیەوەی Python 3.10 ی یان زۆرتر هەیە لەگەڵ ئەو requests û reportlab کتێبخانەکان (libraries) دامەزراون. هارنسە تەواوەکە یەک ماژولێکی Python ـی یەک-خۆیی (single self-contained) ـە کە لە ژێر ڕێسای MIT دەرکراوە.

ڕێنموداری شەبەکەی لەبەردەوامبوون کە بنچمارکەکە لە Figshare، ResearchGate، Academia.edu و GitHub دا بە شێوەی دووبارەکراو (mirrored) دەبینێت، لەگەڵ Figshare DOI وەک لەبەردەوامترین لەبنەما (canonical anchor)
Wêne 5: بنچمارکەکە لە چوار پلاتفۆرمی توێژینەوەدا هەیە. Figshare DOI یەکسان-ناسنامەی زانستی (canonical scholarly identifier) ـە؛ ResearchGate، Academia.edu، و GitHub کۆپییە هاوشێوەکان (parallel copies) هاوکاتە کۆد و داتای خام (raw data) ـیان هەڵدەگرن.

چوار گام بۆ run ـێکی نوێ

یەکەم. کۆپی/کلۆنکردنەوەی ڕێپۆزیتۆری (repository): git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. دووەڵ. دابەزاندنی پێداویستییەکان بە pip install -r requirements.txt. چوارە. دابنێ KANTESTI_USERNAME û KANTESTI_PASSWORD وەک وەریەبەری هەستیار — دڵنیایییەکان لە کاتی ڕێکخستن دەخوێندرێن و هیچ شتێک لە فیلەکەدا بە شێوەی هەردەست نییە. چوارە. ڕێکبخە python benchmark_bloodtest.py و سەیری چوار بەرهەمە دەرهێنراوە بکە لە شوێنی کار: یەک scorecardی CSV، یەک scorecardی JSON، دۆزینەوەی تەواوی JSON کە تێکەڵەی وەڵامە خامەکانی ئەنجامدەریش تێدایە، و ڕاپۆرتێکی Markdown بە شێوەی بەکارهێنەر-فێربوو.

ڕێژەی بەراوردکردن لە 23ی ئاپرێلی 2026 بەهێز دەکرێت لە results/ دایرەکتۆریی ڕێپۆ. ڕێکخستنی نوێ timestamped scorecard دروست دەکات بەڵام ڕێکخستنی بەراوردی دستنەخوراو دەهێڵێت. ئەگەر ڕێکخستنت بە شێوەیەکی مانادار جیاواز بوو، تکایە GitHub issue بکە لەگەڵ timestampی ڕێکخستن و وەشانی engine کە لە زانیارییەکانی metadataی وەڵامدا دەردەکەوێت.

مەحدوودییەکان و کارە داهاتوو

چوار مەحدوودییەک دەبێت بە ڕوونی ڕوونبکرێن: کەمبوونی ژمارەی نموونە، بەهەمان شێوەی یەکجار-سنجش، دامەزراندنی تەنها یەک engine، و سەرچاوەی تەنها یەک دەیتا. هەموویان لە کاری پێشکەوتوو لە دۆخێکی پێداویستدا چارەسەر دەکرێن.

ژمارەی نموونە. پازدە کیس لە نێوان هەشت بەشە تایبەتمەندییەکان بۆ دەستپێکی توێژینەوە (proof of concept) کافیه، بەڵام بۆ توێژینەوەی زیر-بەش لە ناو یەک تایبەتمەندی نییە. گسترش بۆ پەنجا کیس پێشبینی کراوە و تێیدا پانێڵەکانی لەخۆڕاوی (coagulation)، سکرینینگی نەخۆشییە خونی-تایبەتمەند (haematological malignancy)، پانێڵەکانی پێشکەوتنی منداڵبوون (pregnancy)، و پیشکەوتەکانی منداڵان (paediatric presentations) دەگرێت.

سنجش بە یەکجار. هەر کیسێک تەنها جارێک سنجرا. مودێلە زۆر زمانەکان نیشاندەری جیاوازییەکی گرنگ لە وەڵامی دەرهێنراو دەبنەوە، هەرچەندە دمای نموونە-هەڵبژاردن کەم بێت؛ بۆیە پڕۆتۆکۆلی چەند-جار (multi-run) کە پێنج سنجش بۆ هەر کیسێک دەکات و جیاوازییەکە دەنووسێت، گامێکی ڕاستەوخۆی دواترە.

دامەزراندنی تەنها یەک engine. ئەم ڕاپۆرتە تەنها یەک engine توصیف دەکات. توێژینەوەی بەراوردی لەگەڵ سیستەمەکانی AIی دیکە لێرەدا لە دایرەی کاردا نییە؛ دەتوانین ئەوە بە توێژینەوەیەکی جیاواز و بە ڕێوشوێنی پێویست بەدوای خۆماندا بکەین.

سەرچاوەی تەنها یەک دەیتا. پازدە کیسەکە ڕێکخراون بە شێوەی نەناسنامە (anonymised) لە ڕێکوردە رەسەنەکانی نەخۆشانی ڕاستەقینە کە لە یەک ڕێپۆزیتۆری کلینیکی تێدایە. ئەمانە نموونەی دیاریکراون (curated sample) نین و نیشانەی دەستەواژەیەکی تصادفی-ڕێکخراو بۆ کۆمەڵە (population-representative random draw) نین. گسترش بە multi-centre data لە ڕێگای پێشکەوتنەوەدایە.

گرنگترین گسترشی پێشنیارکراو multi-language parity ــە. Kantesti AI Engine بەکاربەران لە 75+ زماندا خزمەت دەکات، و ڕێکخستنی هەمان harnessی پازدە کیسە لە تورکی، ئەڵمانی، ئێسپانی، فەرەنسی، و عەرەبی کەفییەتی وەڵام دەسەنگێنێت لە نێوان زمانە پشتیوانیکراوەکانی engine. هەر ڕێکخستنێک بە تایبەتمەندیی هەر زمانێک لەگەڵ DOIی خۆی و شاخه‌ی harness دەخەینە بڵاوە.