Kantesti AI قان تەكشۈرۈش ئۆلچىمى — كلىنىكىلىق دەلىللەش

ئاپتوماتىك بنچمارك ئالدىن تىزىمغا ئېلىنغان ئۆلچەملىك سىناق V11 ئىككىنچى قېتىم يېڭىلانما — 2026-يىل 4-ئاي MIT ئىجازەتنامىسى بىلەن قايتا ئىشلەتكىلى بولىدىغان · ئوچۇق سانلىق مەلۇمات 100K بىرىكمە كوھورت · 127 دۆلەت بەلگىسى

99.80% ئالدىن تىزىمغا ئېلىنغان رۇبىرىكە بويىچە بىرىكمە نومۇر — V11 ئىككىنچى يېڭىلاش، 127 دۆلەت بەلگىسى ئارىسىدا 100,000-دېلو كوھورت

ئالدىن تىزىمغا ئېلىنغان، رۇبرىك ئاساسىدىكى ئاپتوماتىك تېخنىكىلىق بېنچمارك Kantesti ماتورىنى 127 دۆلەت بەلگىسى بىلەن تاقالغان 100,000 دانە سۈنئىي قان تەكشۈرۈش دېلوسى ئۈستىدە سىنايدۇ. ئۇ دىئاگنوز توغرىلىقىنى ئەمەس، چىقىرىش ماسلىشىشچانلىقىنى ئۆلچەيدۇ. رۇبرىك V11 دەسلەپكى ئېلان قىلىنىشتىن بۇرۇن مەنبە كودىدا توڭلىتىلغان بولۇپ، بۇ ئىككىنچى يېڭىلانمىدا بىت-بىت ئوخشاش ھالەتتە ساقلانغان؛ باھالاش سۇپىسى MIT ئىجازەتنامىسىدە؛ ماتورنىڭ خام جاۋابلىرىدىن قەۋەتلىك تاسادىپىي ئەۋرىشكە ئېلىنىپ تەكشۈرۈش ئۈچۈن ئېلان قىلىنغان. بارلىق دېلولار سۈنئىي؛ ھېچقانداق شەخسىي سانلىق مەلۇمات ئىشلىتىلمەيدۇ.

📖 ~14 مىنۇت 📅 2026-يىل 23-ئاپرېل ئېلان قىلىنغان · 2026-يىل 26-ئاپرېل يېڭىلانغان (V11 ئىككىنچى قېتىم يېڭىلانما) 🔗 DOI: 10.6084/m9.figshare.32095435

📝 ئېلان قىلىنغان: 2026-يىلى 23-ئاپرېل 🔄 V11 ئىككىنچى قېتىم يېڭىلانما: 2026-يىلى 26-ئاپرېل 🩺 داۋالاش جەھەتتىن تەكشۈرۈلگەن: 2026-يىلى 26-ئاپرېل ✅ ئالدىن تىزىمغا ئېلىنغان Rubric (Byte-تەڭ) 🔓 ئوچۇق كود ۋە سانلىق مەلۇمات

بۇ ئاپتوماتىك بنچمارك لايىھەلەنگەن ۋە ئىجرا قىلىنغان Julian Emirhan Bulut, ، Kantesti Ltd نىڭ يۇقىرى دەرىجىلىك AI ئىنژېنېرى ۋە باش ئىجرائىيە ئەمەلدارى. نومۇرلاش پۈتۈنلەي كود ئىچىدە ئاپتوماتىك قىلىنغان؛ نومۇرلاش ئۆلچىمى ۋە سەھنىلىك مۇھىت (case panel) كلىنىكىلىق تەكلىپ بىلەن دوكتور توماس كلېين، تېببىي پەنلەر دوكتورى, ، Kantesti AI نىڭ باش داۋالاش ئەمەلدارى تەرىپىدىن تۈزۈلگەن، ھەمدە كانتېستى سۈنئىي ئەقىل داۋالاش مەسلىھەتچىلەر كېڭىشى. بۇ ئۆزى ئىجرا قىلغان ئىچكى ئۆلچەم سىنىقى بولۇپ، مۇستەقىل ياكى تورداش-تەكشۈرۈلگەن ئاپتوماتىك تېخنىكىلىق سىناق ئەمەس.

باش ئاپتور & كلىنىكىلىق نازارەت

توماس كلېين، دوكتور

كانتېستى AI باش تېببىي خادىمى

دوكتور توماس كلېين مۇدىرىيەت تەرىپىدىن گۇۋاھنامە ئالغان كلىنىكىلىق گېماتولوگ ۋە ئىچكى كېسەللىكلەر دوختۇرى بولۇپ، تەجرىبىخانا تېبابىتىدە 15 يىلدىن ئارتۇق تەجرىبىسى بار. Kantesti AI نىڭ باش داۋالاش ئەمەلدارى سۈپىتىدە، ئۇ بۇ سىناق ئۈچۈن دېلو پەنلىنى تاللىدى، بىرىكمە دېلولارنىڭ كلىنىكىلىق مەزمۇنى ۋە مۆلچەرلەنگەن جاۋابلىرىنى تەكشۈردى، ھەمدە ماتور تۇنجى قېتىم چاقىرىلىشتىن ئىلگىرى ئالدىن تىزىمغا ئېلىنغان رۇبىرىكەنى تەستىقلىدى.

ORCID 0009-0009-1490-1321 تەتقىقات دەرۋازىسى Google ئالىمى

بىرلەشمە ئاپتور & يولغا قويۇش

Julian Emirhan Bulut

يۇقىرى دەرىجىلىك AI ئىنژېنېرى & CEO, Kantesti Ltd

جۇلىيان ئەمىرخان بۇلۇت Kantesti Ltd نىڭ قۇرغۇچىسى ۋە باش ئىجرائىيە ئەمەلدارى. ئۇ باھالاش سىناق رامكىسىنى — V11 ئىككىنچى قېتىم يېڭىلانمىغا قوشۇلغان SQL دېلو يۈكلىگۈچنىمۇ ئۆز ئىچىگە ئالغان ھالدا — لايىھەلەپ ۋە يولغا قويغان، API بىرلەشتۈرۈشنى ئىشلىگەن، V11 دەسلەپكى پايدىلىنىش (reference) قېتىم ئىجراسىنى ۋە V11 ئىككىنچى قېتىم يېڭىلانمىدىكى 100,000 دېلو قېتىم ئىجراسىنى ئېلىپ بارغان، شۇنداقلا ستاتىستىكىلىق يىغىپ-بىرلەشتۈرۈشنى تەييارلىغان. 2019-يىلدىن باشلاپ سۇپىنىڭ قۇرغۇچىسى.

GitHub Kantesti ھەققىدە

⚡ قىسقىچە خۇلاسە V11 ئىككىنچى قېتىم يېڭىلانما — 2026-يىلى 26-ئاپرېل

99.80% بىرىكمە نومۇر 127 دۆلەت بەلگىسى بىلەن سەككىز دانە داۋالاش كەسپى بويىچە 100,000 دانە سۈنئىي قان تەكشۈرۈش دېلوسى ئۈستىدە (V11 ئىككىنچى يېڭىلانما).
نۆل قېتىمدا ھەددىدىن زىيادە دىئاگنوز قويۇشتىن كېلىپ چىققان خاتا مۇسبەتلىك 87,412 دانە نازارەت قىلىنغان «trap-case» بايراق پۇرسىتى ئارىسىدا — V11 دەسلەپكى قېتىم بىلەن ئوخشاش «trap-case» ئۇسۇلى، نوپۇس دەرىجىسىگە كېڭەيتىلگەن.
ئالدىن تىزىمغا ئېلىنغان رۇبرىك V11 دەسلەپكى قېتىم ئىجراسىدىن بۇرۇن مەنبە كودىدا توڭلىتىلغان ۋە Byte-تەڭ ساقلانغان بۇ ئىككىنچى قېتىم يېڭىلانمىدا — كېيىنچە (post-hoc) تەڭشەش مۇمكىن بولمىدى.
مېنتزېر ئىندېكسى توغرا قوللىنىلدى V11 دەسلەپكى ئېلان قىلىنىشىدا تۆمۈر يېتىشمەسلىك ئانېمىيەسىنى beta-thalassaemia minor دىن ئايرىش ئۈچۈن؛ ئايرىش ھەرىكىتى نوپۇس دەرىجىسىدە ساقلانغان.
پەقەت ئىشلەپچىقىرىش نۇقتىسى (production endpoint) — ھېچقانداق ئىمتىيازلىق يۆتكەش (privileged routing) يوق؛ ئۇ پەقەت تۆلەيدىغان خېرىدارنىڭ زىيارەت قىلغاندەكلا ئېنىق باھالاندى.
ئوتتۇرىچە كېچىكىش 13.26 سېكۇنت ئاخىرىدىن ئاخىرغىچە (9.0–16.94 س ئارىلىقىدا)، بارلىق 100,000 دېلو ماتورنىڭ ئاساسىي يولىدا تاماملاندى.
بىرىكمە كوھورت. ئىجرا ۋاقتىدا يۈكلەنگەن 100,000 دانە بىرىكمە ياسالغان سىناق دېلوسى. ھېچقانداق بىرىكمە سانلىق مەلۇمات ۋە ھېچقانداق شەخسىي سانلىق مەلۇمات ئىشلىتىلمەيدۇ.
MIT ئىجازەتنامىلىق سىناق رامكىسى (harness) GitHub دا ئېلان قىلىنغان بولۇپ، تەكشۈرۈش ئۈچۈن ماتورنىڭ تولۇق خام جاۋابلىرىدىن قەۋەتلىك تاسادىپىي ئەۋرىشكە (n = 201) تەمىنلەنگەن.
Figshare DOI: 10.6084/m9.figshare.32095435 · ResearchGate، Academia.edu، GitHub دا ئەينەك قىلىنغان.

نېمىشقا بۇ ئۆلچەملىك سىناق مەۋجۇت ۋە ئۇ نېمىنى سىنايدۇ

AI ياردەملىك قان تەكشۈرۈش نەتىجىسىنى قانداق ئوقۇش ئىستېمالچىلار ۋە بالىيات/كلىنىكىلىق خىزمەت ئېقىمىدا بارغانسېرى كۆپ ئىشلىتىلىۋاتىدۇ، ئەمما تەجرىبىخانا داۋالاشقا ماسلاشتۇرۇلغان، قايتا ئىشلەپ باھالاشقا بولىدىغان باھالاش رامكىلىرى يەنىلا ئاز ئۇچرايدۇ. بۇ ئەھۋالدا ئەڭ مۇھىم بولغان سوئاللار ئادەتتىكى داۋالاش سوئال-جاۋاب ئۆلچەملىرىدە يېپىلمايدىغان سوئاللار: ئوتتۇرىچە ئېرىتروسىت ھەجىمى (MCV) ئوخشاش بولغاندا، ماتور تۆمۈر يېتىشمەسلىكىنى تالاسسېمىيە خاسلىقىدىن ئايرىيالامدۇ؟ ئۇ گىلبېرت كېسەللىكىنى جىگەر ياللۇغىغا ئوخشاتىپ خاتا دىئاگنوز قويامدۇ؟ ھەمدە پۈتۈنلەي نورمال تەكشۈرۈش پىروگراممىسىدا كېسەللىك پەيدا قىلىپ قويامدۇ؟

بىرلا قان تەكشۈرۈش تاختىسى ئادەتتە بىر نەچچە رىقابەتچى چۈشەندۈرۈشنى قوللايدىغان يېتەرلىك سىگنالنى ئۆز ئىچىگە ئالىدۇ، چۈشەندۈرىدىغان دوختۇرنىڭ ۋەزىپىسى بولسا ئۇ چۈشەندۈرۈشلەرنى بىر-بىرىگە سېلىشتۇرۇپ تارازىلاش، دەرسلىكتىكى جاۋابنى قايتۇرۇپ بېرىش ئەمەس. دەرسلىكتىكى ئەھۋاللاردا ياخشى نەتىجە كۆرسەتكەن ماتور ئەڭ مۇھىم بولغان ئەھۋاللاردا يەنىلا مەغلۇپ بولۇشى مۇمكىن: دىففېرېنسىيال دىئاگنوز (پەرقلەندۈرۈش دىئاگنوزى)دىكى تۇزاقلار، يالغۇز كۆرۈنگەندە ئالارمادەك كۆرۈنىدىغان زىيانسىز ۋارىيانتلار، ۋە تولۇق نورمال تاختىلار بولۇپ، ئىشەنچلىك ياردەمچى پروگراممىلارنى كېسەللىك پاتولوگىيەسىنى «ياساپ چىقىرىش»قا قىزىقتۇرىدۇ.

بۇ ئۆلچەملىك سىناق دەل شۇ مەغلۇپ بولۇش شەكىللىرىنى ئاساس قىلغان. 15 ئەھۋالنىڭ ھەر بىرى مەلۇم بىر دىئاگنوز خۇسۇسىيىتى ئۈچۈن تاللانغان: تۆمۈر يېتىشمەسلىكىدىن بولغان مىكروسىتوز بولۇپ، ئوخشاش mean corpuscular volume (ئوتتۇرىچە ئېرىتروسىت ھەجىمى) بار beta-thalassaemia خاسلىقىدىن ئايرىم ساقلىنىشى كېرەك؛ پەقەت يالغۇز ئىزولياتسىيە قىلىنغان ۋاسىتىلىك يۇقىرى قان بىليروبىنى (indirect hyperbilirubinaemia)لا نورمالسىز بولغان Gilbert's syndrome كۆرۈنۈشى؛ ۋە 15 پارامېتىرلىق تەكشۈرۈش تاختىسىدا ھەر بىر ئانالىت ئۆزىنىڭ پايدىلىنىش دائىرىسى (reference range) ئىچىدە تۇرىدىغان ئەھۋال. ئۆلچەم (rubric) ھەر بىر ئەھۋالنى ئۆزىنىڭ شەرتى بويىچە ئوقۇغان ماتورلارنى مۇكاپاتلايدۇ، ھەمدە مۇشۇنداق دىئاگنوزنىڭ ھاجىتى يوق ۋاقىتتا ئىشەنچلىك دىئاگنوزغا يېتىپ بارغان ماتورلارنى جازالايدۇ.

دوكتور توماس كلېين (MD) بولۇش سۈپىتىم بىلەن، مەن بۇ ئەھۋال تاختىسىنى تاللىدىم، چۈنكى مەن تەجرىبىخانا-مېدىتسىنا ياردەمچى پروگراممىلىرىنىڭ ئەڭ كۆپ خاتا قىلىدىغان ئەندىزىلىرى مۇشۇلار دەپ قارايمەن. ئەڭ قىممەت مەغلۇپ بولۇش شەكلى "كەم ئۇچرايدىغان كېسەللىكنى قولدىن بېرىپ قويۇش" ئەمەس — بەلكى ئۇنى يوق بىمارلاردا ئادەتتىكى پاتولوگىيەنى توقۇپ چىقىرىش. بىزنىڭ Medical Validation hub تېخىمۇ كەڭ رامكىنى چۈشەندۈرىدۇ؛ بۇ بەت V11 دەسلەپكى ئىسپات-ئۇقۇمى ۋە V11 ئىككىنچى يېڭىلاشنى چۈشەندۈرىدۇ — ئۇنى 127 دۆلەت بەلگىسىنى ئۆز ئىچىگە ئالغان بىرىكمە دېلو توپلىمىدىن تاللانغان 100,000 بىرىكمە دېلوغا كېڭەيتتى — ئوخشاش نومۇرلاش رۇبىرىكىنى ئىشلىتىپ، byte-تەڭ، post-hoc تەڭشەش رۇخسەت قىلىنمايدۇ.

2026-يىلى 26-ئاپرېلدىكى V11 ئىككىنچى يېڭىلاش پايدىلىنىش قېتىم ئىجراسى بىرىكمە نومۇرنى ھاسىل قىلدى

V11 دەسلەپكى تارقىتىلىشىدا ئىشلىتىلگەن ئوخشاش ئالدىن تىزىملىتىلگەن رۇبىرىكىغا ئاساسەن، باھالاندى 99.80% 100,000 دانە نامسىزلاشتۇرۇلغان دېلو 100,000 بىرىكمە دېلو Kantesti بىرىكمە دېلو توپلىمىدىن تاللانغان ۋە 127 دۆلەت بەلگىسى . دەسلەپكى V11 قېتىمى 2026-يىلى 23-ئاپرېلدا 15 دانە قولدا تاللانغان دېلونى (بىرىكمە 99.12%) ئۆز ئىچىگە ئالغان ۋە رۇبىرىكىنى دەلىللەگەن؛ ئىككىنچى يېڭىلاش شۇ رۇبىرىكىنى بايت-بىردەك ساقلاپ، باھالاشنى نوپۇس كۆلىمىدىكى توپقا كېڭەيتتى. 0 / 87,412. 100,000 دېلونىڭ 100,000 ى نومۇر ئالدى.

بىرىكمە 99.80% 13.26 s

1.000 قۇرۇلما نومۇرى

0.996 كلىنىكىلىق نومۇر

ئاساسىي يولدىكى مۇلازىمەت-دەرىجە نىشانىغا قارىتا. ئېنىق پارچىلىنىش تۆۋەندىكى رۇبىرىكا فورمۇلاسىدا كۆرسىتىلگەن — بۇ ئىككىنچى يېڭىلاش ئۈچۈن بۇ ئېغىرلىقلار ياكى كىچىك رۇبىرىكىلارنىڭ ھېچقايسىسى ئۆزگەرتىلمىدى. ئوتتۇرىچە كېچىكىش ۋاقتى

0 / 87,412 تۇزاقتىكى يالغان مۇسبەتلەر

بىرىكمە فورمۇلا ئۈچ تەركىبنى بىرلەشتۈرىدۇ: قۇرۇلما ماسلىشىش يەتتە مەجبۇرىي دوكلات بۆلىكى ۋە 16 مەجبۇرىي تارماق بۆلەكنىڭ بىلەن،, مەزمۇننىڭ توغرىلىقى ئاچقۇچلۇق سۆزنى ئەسلەش (keyword recall) + نومۇرلاش سىستېمىسىنى ئەسلەش (scoring-system recall) + ئېھتىماللىق-تەقسىملەشنىڭ توغرىلىق تەكشۈرۈشى (probability-distribution validity check) ئارقىلىق ئۆلچەنىدۇ، ۋە جاۋاب كېچىكىشى قالغان 0.20 پىرسەنت نۇقتىلىق «headroom» دېگۈدەك پۈتۈنلەي كلىنىكىلىق كىچىك نومۇرغا پارچىلىنىدۇ — ئاز بىر قىسىم دېلولار (ئاساسلىقى گېپاتولوگىيە ۋە رېماتولوگىيەدە) ماتورنىڭ «interpretation» ىدە بىر مۆلچەرلەنگەن نومۇرلاش-سىستېما ئاچقۇچلۇق سۆزى يوق بولغان، گەرچە دىئاگنوز مەزمۇنى توغرا بولسىمۇ.

بىرىكمە = 0.35 × قۇرۇلما + 0.55 × كلىنىكىلىق + 0.10 × كېچىكىش

100,000 دېلو ئىچىدىكى ئىككىنچى يېڭىلاش توپىدا ھېچقانداق دېلو ئۆزىنىڭ دىئاگنوزىنى ئۆتكۈزۈپ قويمىدى. كېچىكىش V11 دەسلەپكى تارقىتىلىشىدىكى ئوتتۇرىچە 20.17 s دىن ئىككىنچى يېڭىلاشتىكى 13.26 s گە ياخشىلاندى — ئىككى قېتىم ئىجرا ئارىسىدىكى ئىشلەپچىقىرىش ماتورىنى ئەلالاشتۇرۇشنى ئەكس ئەتتۈرىدۇ؛ رۇبىرىكا، نومۇرلاش كودى ۋە API نۇقتىسى ئۆزگەرمىدى. دۆلەت بويىچە بىرىكمە نومۇرلار ئەڭ تۆۋەن 0.9971 (ھىندىستان) دىن ئەڭ يۇقىرى 0.9985 (شىۋېيتسارىيە) گىچە بولدى — ئەڭ كۆپ ۋەكىللىك قىلغان 30 دۆلەت ئىچىدە. قالغان 97 دۆلەتنىڭ ئۇزۇن قۇيرۇقى (≈7,300 دېلو بىرلىكتە) ھېچقانداق سىستېمىلىق تۆۋەنلەشنى كۆرسەتمىدى. دېلو سانى بويىچە ئەڭ چوڭ تۆھپىكارلار: ئامېرىكا (10,500)، بىرازىلىيە (9,500)، ئىسپانىيە (9,000)، ئىتالىيە (8,000)، گېرمانىيە (7,800)، فرانسىيە (7,400)، پورتۇگالىيە (5,800)، تۈركىيە (3,400)، ئەنگىلىيە (2,900) ۋە مېكسىكا (2,500).

بەلگە بويىچە بىرىكمە نومۇرلار ئەڭ كۆپ ئۇچرايدىغان 30 دۆلەت بەلگىسىدە 0.9971 دىن 0.9985 گىچە بولدى. قالغان 97 قوشۇمچە بەلگىدىن تەركىب تاپقان ئۇزۇن قۇيرۇق (تەخمىنەن 7,300 دېلو بىرلەشتۈرۈلگەن) ھېچقانداق سىستېمىلىق تۆۋەنلەشنى كۆرسەتمىدى. دېلو سانى بويىچە ئەڭ كۆپ ئۇچرايدىغان بەلگىلەر: ئامېرىكا (10,500)، بىرازىلىيە (9,500)، ئىسپانىيە (9,000)، ئىتالىيە (8,000)، گېرمانىيە (7,800)، فرانسىيە (7,400)، پورتۇگالىيە (5,800)، Türkiye (3,400)، ئەنگلىيە (2,900) ۋە مېكسىكا (2,500). بەلگە بويىچە بىرىكمە نومۇرلار 0.9971 دىن 0.9985 گىچە بولدى.

15 دېلودىن 100,000 گىچە: 127 دۆلەت بەلگىسى ئارىسىدا كوھورتنىڭ تەرەققىي قىلىشى

ئەسلى V11 دېلو پەنلى يەتتە كەسپنى — گېماتولوگىيە، ئېندروكرىنولوگىيە، مېتابولىزم تېبابىتى، گېپاتولوگىيە، نېفرولوگىيە، كاردىئولوگىيە، روماتولوگىيە — شۇنداقلا ئىككى دانە مەخسۇس hyperdiagnosis تۇزاق دېلوسىنى ئۆز ئىچىگە ئالغان؛ ھەر بىر دېلو بىرىكمە ياسالغان قان تەكشۈرۈش پەنلى ئىدى. V11 ئىككىنچى يېڭىلاش باھالاشنى 127 دۆلەت بەلگىسى ئارىسىدا 100,000 بىرىكمە دېلوغا كېڭەيتىدۇ, V11 دەسلەپكى دېلو تاختىسى: گېماتولوگىيە، ئېندوكرىنولوگىيە، مېتابولىك داۋالاش، گېپاتولوگىيە، نېفرولوگىيە، كاردىئولوگىيە، رېماتولوگىيە — شۇنداقلا ئىككى دانە «trap» دېلو: گىلبېرت كېسەللىكى (Gilbert's syndrome) ۋە پۈتۈنلەي نورمال تەكشۈرۈش تاختىسى. ئىككىنچى يېڭىلاش بۇ رۇبىرىكىنى بايت-بىردەك ساقلاپ، توپنى Kantesti SQL ساقلىغۇچتىن ئېلىنغان 100,000 دېلوغا كېڭەيتتى.

بارلىق دېلولار بىرىكمە ياسالغان بولغاچقا، چىقىرىپ تاشلايدىغان ھەقىقىي پەرقلىگۈچ يوق ۋە شەخسىي سانلىق مەلۇماتمۇ يوق. ھەر بىر بىرىكمە دېلوغا سىناق ئىچىدىكى دېلو كودى (V11 دەسلەپكى توپلامدا BT-NNN-LABEL، ئىككىنچى يېڭىلاشتىا مۇقىم . بىر تەرەپ قىلىش V11 دەسلەپكى تارقىتىلىشىغا ماس ھالدا ئېلىپ بېرىلدى — 15 دانە قولدا تاللانغان دېلو ). ئېلان قىلىنغان باھالاش قورالىدا، تېخنىكىلىق دوكلاتتا ياكى ئېلان قىلىنغان سانلىق مەلۇمات توپلاملىرىدا ھېچقانداق شەخسىي سانلىق مەلۇمات كۆرۈنمەيدۇ.

V11 initial release — 15 hand-curated cases

ئەسلىدىكى V11 دېلو تاختىسىنى دوكتور توماس كلېين قولدا تاللاپ تەييارلىغان بولۇپ، ئۇ تەجرىبىخانا-مېدىتسىنا ياردەمچىلىرى ئەڭ كۆپ خاتا قىلىدىغان دىئاگنوز پەترەنلىرىنى چېنىقتۇرۇش ئۈچۈن ئىشلىتىلگەن. ئون بەش دېلونىڭ ھەر بىرى تۆۋەندە كۆرسىتىلگەن مەلۇم بىر دىئاگنوز خۇسۇسىيىتى ئۈچۈن تاللانغان.

قان كېسەللىكلىرى (3) BT-001, BT-006, BT-007 تۆمۈر يېتىشمەسلىك ئانېمىيەسى · B12 يېتىشمەسلىكى · كىچىك β-تالاسسېمىيە

ئىچكى ئاجراتما كېسەللىكلىرى (3) BT-002, BT-008, BT-012 خاشىموتو قالقانسىمان بەز ياللۇغى · ئىنسۇلىنغا قارشى تۇرۇش بىلەن PCOS · ئېغىر D ۋىتامىن يېتىشمەسلىكى

مېتابولىك (2) BT-003, BT-013 مېتابولىك بىمارلىق بىلەن T2DM · بوغۇم ياللۇغى (گوت) خەۋىپى بىلەن يۇقىرى سۈيدۈك كىسلاتاسى

بېغىر كېسەللىكلىرى (2) BT-004, BT-009 NAFLD / NASH · ئۆتكۈر ۋىرۇسلۇق جىگەر ياللۇغى

بۆرەك كېسەللىكلىرى · يۈرەك كېسەللىكلىرى · رېماتىزم كېسەللىكلىرى (3) BT-005, BT-010, BT-011 CKD 3-باسقۇچ · ئاتېرروگېنلىق دىسلىپېدىيە · سىستېمىلىق قىزىل يۈرەك كېسىلى (SLE)

تۇزاق ئەھۋاللىرى (2) BT-014, BT-015 گىلبېرت كېسەللىكى (يالغۇز ئىندىرېكتلىق يۇقىرى بىليروبىن) · پۈتۈنلەي نورمال قۇرامىغا يەتكەنلەر تەكشۈرۈشى

نېمىشقا بۇ ئالاھىدە تەقسىمات

گېماتولوگىيە ئۈچ خىل ئەھۋالغا ئېرىشىدۇ، چۈنكى مىكروسىتىك پەرقلەندۈرۈش ۋە ماكرۆسىتىك پەرقلەندۈرۈش ھەقىقىي دۇنيا تەجرىبىخانىلىق ئەمەلىيەتتە ئەڭ كۆپ ئۇچرايدىغان «قىستۇرما تۇزاق» لار. ئېندوكروinولوگىيە ئۈچ خىل ئەھۋالغا ئېرىشىدۇ، چۈنكى Hashimoto كېسىلى، PCOS ۋە D ۋىتامىن يېتىشمەسلىكى كۆرۈنۈشلىرى ئوخشىمىغان دىئاگنوز شەكىللىرىنى چېنىقتۇرىدۇ (ئاپتومۇخادىرە-ئاساسلىق، ھورمون نىسبىتى-ئاساسلىق، يەككە بەلگە-ئاساسلىق). يەككە ئەھۋاللىق كەسىپلەر يەنىلا ئەھمىيەتلىك، چۈنكى ھەر بىرى CKD، ASCVD خەۋىپى ۋە SLE نىڭ ئۆزىگە خاس نومۇرلاش سىستېمىسى بار بولۇپ، ماتور چوقۇم شۇنى چاقىرىشى كېرەك (KDIGO باسقۇچلىشى، ASCVD 10 يىللىق خەۋىپ، ۋە 2019 EULAR/ACR SLE ئۆلچىمى).

V11 ئىككىنچى يېڭىلاش — 127 دۆلەت بەلگىسى ئارىسىدا 100,000 بىرىكمە دېلو

ئىككىنچى يېڭىلاش ئەسلى V11 نىڭ قاتتىق كودلانغان 15 دېلو Python لىتىرالنى تېخىمۇ چوڭراق، پروگرامما ئارقىلىق ياسالغان بىرىكمە دېلو توپلىمى بىلەن ئالماشتۇرىدۇ. دېلو توپلىمى ھەر قېتىملىق ئىجرا باشلىنىشىدا يۈكلىنىدۇ ۋە سەپلىمە سۈزۈكلۈك ئۈچۈن خاتىرىلىنىدۇ. كوھورتنىڭ مەزمۇن رايونى بويىچە تەقسىماتى تۆۋەندە كۆرسىتىلگەن.

ئىچكى ئاجراتما 23,900 دېلو (23.9%) قالقانسىمان بەز، PCOS، D ۋىتامىن يېتىشمەسلىكى، جىنسىي ئەزا ئوقى، قان تومۇر ئۈستى بەز (pituitary)

مېتابولىزم مېدىتسىنا 21,900 دېلو (21.9%) T2DM، مېتابولىك بىمەنىلىك، لىپېد تاختىسى، يۇقىرى سۈيدۈك كىسلاتاسى (hyperuricaemia)

Hematology 15,400 دېلو (15.4%) مىكروسىتلىق ۋە ماكروسىتلىق پەرقلىگۈچلەر، B12/فولات، تۆمۈر تەتقىقاتى

جىگەر كېسەللىكلىرى 12,400 دېلو (12.4%) NAFLD/NASH، ۋىرۇسلۇق جىگەر ياللۇغى، FIB-4، ئۆت-ئېقىش توسۇلۇش (cholestasis)

ئىچكى كېسەللىكلەر (ئۆز ئىچىگە ئالغان trap كىچىك گۇرۇپپىسى) 9,000 دېلو (9.0%) ئارىلاشما كۆرۈنۈشلەر ۋە 8,723 دانە مەخسۇس «hyperdiagnosis trap» دېلوسى

يۈرەك-قان تومۇر كېسەللىكلىرى 7,500 دېلو (7.5%) ASCVD خەۋىپى، ئاتېرروگېنلىق دىسلىپېدەميا، hs-CRP

رېماتولوگىيە 6,000 دېلو (6.0%) SLE، RA، ۋاسكۇلىت، ئاپتومۇئانتىتېلا تاختىسى (EULAR/ACR ئۆلچەملىرى)

نېفرولوگىيە 4,000 دېلو (4.0%) CKD باسقۇچلاش (KDIGO)، eGFR يۈزلىنىشى، ئېلېكترولىت قالايمىقانچىلىقى

سۈنئىي دۆلەت-بەلگە تەقسىماتى — ئالدىنقى 10 بەلگە

100,000 سۈنئىي دېلو 127 دۆلەت بەلگىسىنى (ISO 3166-1 alpha-2) ئېلىپ، يەرلىك (locale) بىر تەرەپ قىلىشنى سىنايدۇ. بەلگە تەقسىملەش: ياۋروپا 57.7%، ئامېرىكىلار 25.4%، ئاسىيا-تىنچ ئوكيان 6.2%، ئاتالغان ئوتتۇرا شەرق/ئافرىقا بەلگىلىرى 3.4%، ۋە قالغان 97 قوشۇمچە بەلگىدىن تەركىب تاپقان ئۇزۇن قۇيرۇق تەخمىنەن 7.3% بىرلەشتۈرۈلگەن. دېلو سانى بويىچە ئەڭ كۆپ ئۇچرايدىغان ئون بەلگە: ئامېرىكا (10,500)، بىرازىلىيە (9,500)، ئىسپانىيە (9,000)، ئىتالىيە (8,000)، گېرمانىيە (7,800)، فرانسىيە (7,400)، پورتۇگالىيە (5,800)، Türkiye (3,400)، ئەنگلىيە (2,900) ۋە مېكسىكا (2,500). بەلگە بويىچە بىرىكمە نومۇرلار 0.9971 دىن 0.9985 گىچە. بۇ بەلگە سانلىرى يەرلىك بىر تەرەپ قىلىشنى سىناش ئۈچۈن ئىشلىتىلگەن ياسالغان دېلولارنىڭ خاسلىقى — ئۇلار ھەقىقىي ئىشلەتكۈچىلەر ئەمەس، ھەمدە ھەقىقىي دۇنيا جۇغراپىيىلىك قاپلاشنى ئەكس ئەتتۈرمەيدۇ.

ئالدىن تىزىمغا ئېلىنغان rubric نى چۈشەندۈرۈش

ئالدىن تىزىملىتىش بۇ سىناق-بەنجامدا ئەڭ مۇھىم مېتودولوگىيەلىك تاللاش. ھەر بىر مۆلچەر دىئاگنوز، ھەر بىر كلىنىكىلىق نومۇرلاش سىستېمىسى، ۋە ھەر بىر دوكلات بۆلىكى مەنبە كودقا باغلانغان ماتور چاقىرىلغانغا قەدەر. شۇڭا رۇبرىكنى ماتورنى «ياقتۇرۇپ» كېيىنچە تەڭشەش مۇمكىن ئەمەس.

بىرىكمە نومۇرنى ئۈچ تەركىب تەشكىل قىلىدۇ. قۇرۇلمىلىق تەركىب 35 پىرسەنت تۆھپە قوشىدۇ ۋە ماتورنىڭ يەتتە مەجبۇرىي دوكلات بۆلىكىنى (ماۋزۇ/بېشى، قىسقىچە خۇلاسە، مۇھىم بايقاشلار، پەرقلەندۈرۈش، نومۇرلاش سىستېمىلىرى، تەۋسىيەلەر، كېيىنكى قەدەملەر) ۋە ئۇلار ئىچىدىكى 16 مەجبۇرىي تارماق بۆلەكنى قايتۇرغان-قايتۇرمىغانلىقىنى ئۆلچەيدۇ. بۆلەك بار-يوقلۇقى قۇرۇلمىلىق ھېسابتا 40 پىرسەنت، تارماق بۆلەك بار-يوقلۇقى 60 پىرسەنت ئېغىرلىققا ئىگە.

The كلىنىكىلىق تەركىب 55 پىرسەنت تۆھپە قوشىدۇ ۋە ئۈچ نەرسىنى بىرلەشتۈرىدۇ: دىئاگنوز-ئاچقۇچلۇق سۆزنى ئەسلىگە كەلتۈرۈش (كلىنىكىلىق تارماق نومۇرنىڭ 70 پىرسەنتى)، نومۇرلاش سىستېمىسىنى ئەسلىگە كەلتۈرۈش (20 پىرسەنت — ماتور مۇناسىپ بولغاندا Mentzer، FIB-4، HOMA-IR، ASCVD خەۋىپى، KDIGO باسقۇچلىشى، EULAR/ACR ئۆلچىملىرىنى ھېسابلاپ چىقامدۇ)، ۋە ئېھتىماللىق-يىغىندىسىنىڭ توغرىلىق تەكشۈرۈشى (10 پىرسەنت — پەرقلەندۈرۈش ئېھتىماللىقلىرى [90, 110] ئارىلىقى ئىچىدە يىغىلىشى كېرەك). تۇزاق ئەھۋاللىرى ئۈچۈن، ئەنىق بولمىغان «ھەددىدىن زىيادە دىئاگنوز» جازاسى ئەڭ كۆپ 0.30 بولۇپ چېكىنىدۇ؛ ئۇ 0.10 ھەر بىر توقۇلما پاتولوگىيە بايرىقىغا توغرا كېلىدۇ، ئۈچ بايراقتىن ئېشىپ كەتمەيدۇ.

The كېچىكىش تەركىبى 10 پىرسەنت تۆھپە قوشىدۇ. جاۋاب 20 سېكۇنتتىن تۆۋەن بولسا تولۇق 0.10، 40 سېكۇنتتىن تۆۋەن بولسا 0.05، ئۇنىڭدىن ئاستا بولسا نۆل. 20 سېكۇنت نىشانى ئىشلەپچىقىرىشتىكى ئاساسىي primary-path مۇلازىمەت-دەرىجە نىشانىنى ئەكس ئەتتۈرىدۇ؛ 40 سېكۇنتلىق چەك Phase 2 نىڭ ئېغىر-ماتور چاقىرىشلىرى ئۈچۈن قالدۇرۇلغان زاپاس خامچوتنى ئەكس ئەتتۈرىدۇ.

ئالدىن تىزىملىتىشنىڭ ئالدىنى ئالىدىغانلىرى

بىرىنچى تەرەپ سىناق-بەنجاملىرى كېيىنچە رۇبرىكنى تەڭشەش ئارقىلىق ئۆز سانلىرىنى كۆپەيتىۋېتىش بىلەن داڭلىق. بۇ ئەندىزە ئاساسەن ھەمىشە ئوخشاش: گۇرۇپپا ماتورنى ئىجرا قىلىدۇ، قەيەردە ئاستا قالغانلىقىنى كۆرىدۇ، ئاندىن جىمجىتلا رۇبرىنى تەڭشەپ، ئاستا قالغان رايونلارنىڭ نومۇرغا بولغان تەسىرىنى ئازايتىدۇ. رۇبرىنى تۇنجى ماتور چاقىرىشتىن بۇرۇن مەنبە كودقا باغلاپ، سىناق-ئۈسكۈنىسىنى MIT ئىجازەتنامىسى بىلەن ئېلان قىلىش ئارقىلىق، بۇ تەڭشەش نەشر-كونترولدا كۆرۈنۈپ قالىدۇ. ھەر كىم رېپوزىتورىيەنى كلون قىلىپ، رۇبرىك يازغان ۋاقتىنى تەكشۈرۈپ، ماتور نەتىجىلىرىنىڭ نومۇرنى شەكىللەندۈرۈشكە ئىشلىتىلمىگەنلىكىنى دەلىللەپ بېرەلەيدۇ.

ھەددىدىن زىيادە دىئاگنوز قويۇش (Hyperdiagnosis) تۇزاق ئەھۋاللىرى — نېمە ئۈچۈن «ئارتۇق چاقىرىش» ئەمەلىي مەغلۇبىيەت شەكلى

نورمال ئېكرانلاردا پاتولوگىيەنى ھەددىدىن زىيادە دەۋا قىلىش ئىستېمالچىلارغا قارىتىلغان داۋالاش ياردەمچىسىدە خاتىرىلەنگەن مەغلۇبىيەت شەكلى. ئۇنىڭ كېيىنكى خىراجەتلىرى زۆرۈر بولمىغان تەكشۈرۈش، بىمارنىڭ ئەندىشىسى ۋە ئىنسانغا زىيانلىق (iatrogenic) تەكشۈرۈش-تەييارلىقنى ئۆز ئىچىگە ئالىدۇ. بۇ سىناق-بەنجامدىكى ئىككى تۇزاق ئەھۋالى بۇ مەغلۇبىيەت شەكلىنى كۆرۈنەرلىك ۋە نومۇرلىغىلى بولىدىغان قىلىپ لايىھەلەنگەن.

🟡 تۇزاق 1 — BT-014-GILBERT

كۆرۈنۈش. ئومۇمىي بىليروبىن 2.4 mg/dL بولغان 24 ياشلىق ئەر. بىۋاسىتە بۆلەك نورمال. ترانسئامىناز ۋە ئىشقارلىق فوسفاتا زاھىرى ئۆز پايدىلىنىش دائىرىسى ئىچىدە تۇرىدۇ، رېتىكۇلوئسىتلار نورمالسىز ئەمەس، ھەمدە haptoglobin ۋە LDH ھەمولىزنى رەت قىلىدۇ.

توغرا تەبىر. گىلبېرت كېسىلى — پايدىسىز UGT1A1 پولىمورفىزم. تەبىر جىگەر ياللۇغى، سىروزلار، ھەمولىزلىق ئانېمىيە ياكى ئۆت يولى توسۇلۇشىنى چاقىرىپ چىقماسلىقى كېرەك.

V11 نەتىجىسى. بىرىكمە 1.000. ئالتە نازارەت قىلىنغان ھەددىدىن زىيادە دىئاگنوز بايرىقىنىڭ ھېچقايسىسى ئاكتىپ دىئاگنوز سۈپىتىدە كۆرۈنمىدى.

🟡 تۇزاق 2 — BT-015-HEALTHY

كۆرۈنۈش. 15 پارامېتىرلىق ئادەتتىكى تەكشۈرۈش تاختىسى بار 35 ياشلىق ئايال. ھەر بىر ئانالىت ئۆز پايدىلىنىش دائىرىسى ئىچىدە راھەت تۇرىدۇ.

توغرا تەبىر. خاتىرجەم قىلىش ۋە تۇرمۇش ئۇسۇلىنى ساقلاش. چۈشەندۈرۈش كىلىنىكىلىق جەھەتتىن پايدىلىق كۆرۈنۈش ئۈچۈن چېگرادىن ھالقىغان كېسەللىك ئالامەتلىرىنى «توقۇپ چىقارماسلىقى» كېرەك.

V11 نەتىجىسى. بىرىكمە 1.000. نازارەت قىلىنغان يەتتە قېتىملىق ھەددىدىن ئارتۇق دىئاگنوز قويۇش ئاگاھلاندۇرۇش بەلگىسى — دىئابېت، ئانېمىيە، قالقانسىمان بەز تۆۋەن ئىقتىدارى، دىسلېپيدېمىيە، جىگەر ياللۇغى، بۆرەك كېسەللىكى، يېتىشمەسلىك — ھېچقايسىسى ئاكتىپ دىئاگنوز سۈپىتىدە كۆرۈنمىدى.

ئىككى قاپقاقنىڭ ھەممىسىدە، ئون ئۈچ نازارەت قىلىنغان ھەددىدىن ئارتۇق دىئاگنوز قويۇش بەلگىسى تەكشۈرۈلدى. ھېچقايسىسى قوزغىتىلمىدى. بۇ — ھەر قانداق كىلىنىكىلىق خادىمنىڭ AI ماتورىنى تىترەش (triage) ياكى ئالدىن مەسلىھەت قورالى سۈپىتىدە ئىشلىتىشنى ئويلاۋاتقاندا ئەڭ مۇھىم بولغان نەتىجە: سىستېما كېسەللىك يوق جايدا كېسەللىك كەشىپ قىلمىدى.

Mentzer كۆرسەتكۈچى: تۆمۈر يېتىشمەسلىكىنى تالاسسېمىيە خاسلىقىدىن ئايرىش

ئىككىنچى قىممەتلىك بايقاش BT-001 (تۆمۈر يېتىشمەسلىك ئانېمىيەسى) نىڭ BT-007 (كىچىك تىپتىكى β-تالاسسېمىيە) بىلەن بىر جۈپ قىلىنىشىغا مۇناسىۋەتلىك. ھەر ئىككىسى مىكروسىتوز بىلەن كېلىدۇ ۋە نائىۋ (تەجرىبىسى ئاز) تۈرگە ئايرىغۇچلار ئۈچۈن كۆپ ئۇچرايدىغان توسالغۇ. Mentzer كۆرسەتكۈچى، MCV نى RBC سانىغا بۆلۈش ئارقىلىق ھېسابلىنىدۇ: تۆمۈر يېتىشمەسلىكتە 13 دىن يۇقىرى، تالاسسېمىيە خاسلىقىدا 13 دىن تۆۋەن بولىدۇ.

BT-001 دە، بىمار 34 ياشلىق ئايال بولۇپ، ھېموگلوبىن 10.4 g/dL، MCV 72.4 fL، RBC 4.1 × 10¹²/L، فېررىتىن 6 ng/mL، ۋە TIBC نىڭ يۇقىرى بولۇشى كۆرۈلگەن. تەخمىنەن 17.7 بولغان Mentzer كۆرسەتكۈچى مۇتلەق تۆمۈر يېتىشمەسلىكىنى قوللايدۇ. BT-007 دە، بىمار 28 ياشلىق ئەر بولۇپ، مىكروسىتوز (MCV 65.8 fL) بار، ئەمما RBC سانى 6.2 يۇقىرى، RDW نورمال، فېررىتىن نورمال، ۋە HbA2 5.6 پىرسەنت. تەخمىنەن 10.6 بولغان Mentzer كۆرسەتكۈچى تالاسسېمىيە خاسلىقىنى كۆرسىتىدۇ، ھەمدە يۇقىرى HbA2 كىچىك تىپتىكى β-تالاسسېمىيەنى دەلىللەيدۇ.

تۆمۈر يېتىشمەسلىك ئانېمىيەسى Mentzer > 13 فېررىتىن تۆۋەن، TSAT تۆۋەن، TIBC يۇقىرى، RDW يۇقىرى

تالاسسېمىيە خاسلىقى (Beta-thalassaemia trait) Mentzer < 13 فېررىتىن نورمال، RDW نورمال، HbA2 يۇقىرى (>3.5%)، RBC سانى يۇقىرى

ئىككى ئەھۋالنىڭ ھەر ئىككىسى 1.000 نومۇر ئالدى. ماتور ھەر ئىككى چۈشەندۈرۈشتە Mentzer كۆرسەتكۈچىنى ئوچۇق-ئاشكارا ئىشلىتىپ، ھەر قېتىمدا توغرا دىئاگنوزنى قايتۇردى. بۇ پۈتۈن benchmark ئىچىدىكى ئەڭ كىلىنىكىلىق جەھەتتىن خاتىرجەم قىلىدىغان يەككە نەتىجە, ، چۈنكى تالاسسېمىيە خاسلىقىنى تۆمۈر يېتىشمەسلىكى دەپ خاتا تۈرگە ئايرىش نامۇۋاپىق تۆمۈر تولۇقلاشنى كەلتۈرۈپ چىقىرىدۇ ۋە ئائىلە-تەكشۈرۈش پۇرسەتلىرىنى قولدىن بېرىدۇ؛ تۆمۈر يېتىشمەسلىكىنى تالاسسېمىيە دەپ خاتا تۈرگە ئايرىش بولسا ئاددىي ئالماشتۇرۇش داۋالاشنى كېچىكتۈرىدۇ. بىز فېررىتىن دائىرىسى يېتەكچىسى تېخىمۇ كەڭ دىففېرېنسىيال (پەرقلىق) كونتېكىستنى چۈشەندۈرىمىز.

V11 دەسلەپكى پايدىلىنىش يۈرۈشىدىن ھالەت بويىچە نەتىجىلەر (2026-يىل 23-ئاپرېل)

15-ھالەتلىك ئىسپات-ئۇقۇم كۇچىسىدىكى ئەسلى V11 پايدىلىنىش يۈرۈشى ئىككىنچى يېڭىلاشنىڭ ئۇسۇل-ئاساسى: تۆۋەندىكى ھەر بىر ھالەت تەپسىلاتى رۇبىرىكنىڭ ھەقىقىي ماتور جاۋابىنى قانداق بىر تەرەپ قىلىدىغانلىقىنى كۆرسىتىپ بېرىدۇ. ئون بەش ھالەتنىڭ ئون ئىككىسى ئاساسىي يولدا ئەڭ يۇقىرى بىرىكمە نومۇر 1.000 كە يەتتى؛ ئۈچ ھالەت 2-فازا «fallback» ئارقىلىق مۇلازىمەت قىلىنىپ، 0.05 كېچىكىش مۇكاپاتىنى يوقاتتى، ئەمما بارلىق كلىنىكىي ۋە قۇرۇلمىلىق مەزمۇنلارنى ساقلاپ قالدى. بىر ھالەتتە بىرلا مەجبۇرىي تارماق بۆلەك يوق ئىدى؛ يەنە بىرىدە ئېھتىماللىق تەقسىماتىنىڭ يىراقراق تۆۋەنلىگەن يىغىندىسى قايتۇرۇلدى. of the Second Update: every per-case detail below illustrates how the rubric handles a real engine response. Twelve of fifteen cases achieved the ceiling composite score of 1.000 on the primary path; three cases were served via the Phase 2 fallback, losing the 0.05 latency bonus while preserving all clinical and structural content. One case was missing a single mandatory subsection; one returned a marginally reduced probability distribution sum.

ئەھۋال كىملىكى (Case ID) كەسپ (Specialty) بىرىكمە كېچىكىش (Latency) يول (Path)

BT-001-IDAHematology1.00017.8 sئاساسىي (primary)

BT-006-B12Hematology1.00018.4 سېكۇنتئاساسىي (primary)

BT-007-THALHematology1.00017.0 سېكۇنتئاساسىي (primary)

BT-002-HASHئىچكى ئاجراتما0.95037.0 سېكۇنتزاپاس ھالەت

BT-008-PCOSئىچكى ئاجراتما0.98718.6 سېكۇنتئاساسىي (primary)

BT-003-T2DMMetabolic1.00019.1 سېكۇنتئاساسىي (primary)

BT-013-GOUTMetabolic1.00019.4 سېكۇنتئاساسىي (primary)

BT-004-NAFLDجىگەر كېسەللىكلىرى1.00019.6 سېكۇنتئاساسىي (primary)

BT-009-VIRHEPجىگەر كېسەللىكلىرى0.95023.4 سېكۇنتزاپاس ھالەت

BT-014-GILBERTتۇتقۇچ1.00018.9 سېكۇنتئاساسىي (primary)

BT-005-CKDنېفرولوگىيە1.00017.4 سېكۇنتئاساسىي (primary)

BT-010-ASCVDيۈرەك-قان تومۇر كېسەللىكلىرى1.00019.7 سېكۇنتئاساسىي (primary)

BT-011-SLEرېماتولوگىيە0.98118.2 sئاساسىي (primary)

BT-012-VITDئىچكى ئاجراتما1.00019.3 sئاساسىي (primary)

BT-015-HEALTHYتۇتقۇچ1.00018.7 sزاپاس ھالەت

PCOS دېلوسى (BT-008) جاۋاب قۇرۇلمىسىدىكى بىر مەجبۇرىي تارماق بۆلەكنى يوقىتىپ قويدى — 16 نىڭ ئىچىدىن 15ى، 16 نىڭ ئىچىدىن 16ى ئەمەس — بۇ قۇرۇلمىلىق نومۇرنى 1.000 دىن 0.963 كە چۈشۈردى. SLE دېلوسى (BT-011) سەل تۆۋەنلىگەن ئېھتىماللىق-تەقسىملەش يىغىندىسىنى قايتۇردى؛ بۇ نومۇرنى 0.965 كە چۈشۈردى، ئەمما ھەر بىر دىئاگنوز ئاچقۇچلۇق سۆز ۋە نومۇرلاش سىستېمىسىنى ساقلاپ قالدى. ھېچقانداق بىرىدىن-كەم دېلوسى توغرا دىئاگنوزنى قولدىن بەرمىدى.

V11 ئىككىنچى يېڭىلاش توپلىمى — 100,000 ھالەت

نوپۇس كۆلىمىدە، ئايرىم دېلو قۇرلىرى ئادەمگە ئوقۇغىلى بولمايدۇ، شۇڭا ئىككىنچى يېڭىلانما 100,000 قۇرلۇق جەدۋەلنىڭ ئورنىغا توپلانغان كۆرسەتكۈچلەرنى دوكلات قىلىدۇ. ئاساسىي توپلاما تۆۋەندە كۆرسىتىلگەن؛ كەسپ بويىچە ۋە دۆلەت-بەلگە بويىچە پارچىلاش تېخنىكىلىق دوكلاتتا ۋە Figshare يوللانمىسىدا ئېلان قىلىنغان. قەۋەتلىك تاسادىپىي ئەۋرىشكە ئېلىنغان بىر n = 201 خام ماتور جاۋابلىرى (deterministic seed 20260426) تەكشۈرۈش ئۈچۈن GitHub results/ مۇندەرىجىسىگە ئېلان قىلىنىدۇ.

بىرىكمە نومۇر V11 دەسلەپكى: 0.9912 (99.12%) → ئىككىنچى يېڭىلاش: 0.9980 (99.80%) Δ = +0.0068 100,000-ھالەت كۇچىسى بويىچە

قۇرۇلمىلىق نومۇر (ئوتتۇرىچە) V11 دەسلەپكى: 0.998 → ئىككىنچى يېڭىلاش: 1.000 نوپۇس كۆلىمىدە مۇكەممەل قۇرۇلمىلىق ماسلىشىش

كلىنىكىي نومۇر (ئوتتۇرىچە) V11 دەسلەپكى: 0.998 → ئىككىنچى يېڭىلاش: 0.996 −0.002؛ ھېچقانداق ھالەت دىئاگنوزنىڭ ئۆزىنى قولدىن بەرمىدى

كېچىكىش — ئوتتۇرىچە (ئارىلىق) V11 دەسلەپكى: 20.17 س (17.0–37.0 س) → ئىككىنچى يېڭىلاش: 13.26 س (9.0–16.94 س) يۈرۈش ئارىلىقىدىكى ئىشلەپچىقىرىش ماتورى ئەلالاشتۇرۇشلىرى

ماتور يولى = ئاساسىي V11 دەسلەپكى: 12 / 15 → ئىككىنچى يېڭىلاش: 100,000 / 100,000 يۈرۈش جەريانىدا ھېچقانداق ۋاقىتتا 2-باسقۇچقا قايتىپ كېلىش (fallback) لازىم بولمىدى

Trap-subset دەرىجىدىن تاشقىرى دىئاگنوز بايراقلىرى V11 دەسلەپكى: 0 / 13 → ئىككىنچى يېڭىلاش: 0 / 87,412 نوپۇس كۆلىمىدە نۆل خاتا-ئىجابىيلىق (8,723 trap ئەھۋالى نازارەت قىلىندى)

باش تېما نومۇرى بىزگە نېمىلەرنى ئېيتىپ بېرەلمەيدۇ

بۇ ئالدىن تىزىمغا ئېلىنغان رۇبىرىكە بويىچە 99.80 پىرسەنتلىك بىرىكمە نومۇر، 127 دۆلەت بەلگىسىنى ئۆز ئىچىگە ئالغان 100,000 دېلولىق بىرىكمە كوھورتتا، دېگۈدەك چوققا ئىقتىدارغا يېقىن — ئەمما ئۇنى ئەستايىدىل رامكىغا سېلىش كېرەك. نەتىجە V11 دا بىز مەنبە كودىغا ۋەدە قىلغان رۇبىرىكەگە قارىتا ماتورنىڭ ھەرىكىتىنى تەسۋىرلەيدۇ؛ ئۇ دۇنيادىكى ھەر بىر قان تەكشۈرۈش پەنلىدە ماتورنىڭ توغرىلىقى ھەققىدە ئومۇمىي، ئۇنىۋېرسال تەشەببۇس ئەمەس.

نومۇر ماتورنىڭ بۇ باھالاش ئۈچۈن تاللانغان دىئاگنوز ئەندىزىلىرىنى نوپۇس كۆلىمىدىكى توپلامدا توغرا بىر تەرەپ قىلغانلىقىنى دەيدۇ، نەتىجە ئېلان قىلىنغان ۋە قايتا ئىشلەپ چىقىرىشقا بولىدىغان ئۇسۇلنامە بويىچە. ئۇ ماتورنىڭ دۇنيادا بار بولغان ھەر بىر قان تەكشۈرۈش تاختىسىدا توغرا ئىكەنلىكىنى دېمەيدۇ. ئۇ ماتورنىڭ دوختۇرنىڭ قارارىنى ئالماشتۇرۇشى كېرەكلىكىنى دېمەيدۇ. شۇنداقلا ئۇ ماتورنىڭ باشقا AI سىستېمىلىرىدىن ئۈستۈن ئىكەنلىكىنى دېمەيدۇ — باشقا ماتورلار بىلەن سېلىشتۇرما تەھلىللەر بۇ دوكلاتنىڭ دائىرىسىگە قەستەن كىرگۈزۈلمىگەن.

نومۇرنىڭ ئىسپاتلايدىغىنى بولسا بىر ئاساسىي دەرىجە (baseline). ئۆلچەم ۋە سىناق رامكىسى (harness) ئاشكارىلانغاندىن كېيىن، ماتورنىڭ كەلگۈسى نۇسخىلىرىنى ئوخشاش ئۆلچەمگە قارىتىپ باھالاشقا بولىدۇ — V11 دەسلەپكى 15 ئەھۋالغا، ئىككىنچى يېڭىلاش 100,000 ئەھۋاللىق توپلامغا ياكى كېيىنكى كېڭەيتىشلەرگە قوللىنىپ — ئېلان قىلىنغان نومۇر بىلەن كېيىنكى ھەر قېتىملىق يۈرۈش ئارىسىدىكى پەرقنىڭ ئۆزىلا ئۆلچەشكە بولىدۇ. مانا بۇ ئالدىن تىزىمغا ئېلىشنىڭ قىممىتى: ئىقتىدار تەلىپىنى سىناپ بولىدىغان تەلىپلەرگە ئايلاندۇرىدۇ.

بۇ ئۆلچەمنى 10 مىنۇتتا قانداق قايتا ئىشلەپ چىقىش

قايتا ئىشلەش ئۈچۈن پەقەت Kantesti API ئىسپاتنامە جۈپى ۋە Python 3.10 ياكى ئۇنىڭدىن كېيىنكى مۇھىت لازىم، شۇنىڭ بىلەن requests ۋە reportlab كۇتۇپخانىلىرى ئورنىتىلغان بولۇشى كېرەك. تولۇق سىناق رامكىسى MIT ئىجازەتنامىسى ئاستىدا تارقىتىلغان بىرلا ئۆز ئىچىگە ئالغان Python مودۇلى.

💻 GitHub MIT ئىجازەتلىك سىناق رامكىسى · خام جاۋابلار · پايدىلىنىش قېتىملىق ئىجرا 🔗 Figshare DOI 10.6084/m9.figshare.32095435 · ئاساسىي ئىلمىي خاتىرە 🎓 تەتقىقات دەرۋازىسى Publication 404175463 · V11 ئىككىنچى يېڭىلاش · ئىلمىي بايقاش قەۋىتى 📄 Academia.edu Paper 165956808 · V11 ئىككىنچى يېڭىلاش · ئىلمىي بايقاش قەۋىتى

يېڭى قېتىملىق ئىجرا ئۈچۈن تۆت قەدەم

بىرىنچى. رېپوزىتورىيەنى كلون قىلىڭ: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. ئىككىنچى. تەلەپ قىلىنغان باغلىنىشلارنى تۆۋەندىكىدەك ئورنىتىڭ pip install -r requirements.txt (ئىككىنچى يېڭىلاش قوشىدۇ mysql-connector-python ≥ 8.0 SQL case loader ئۈچۈن). ئۈچ. تەڭشەڭ KANTESTI_USERNAME ۋە KANTESTI_PASSWORD ماتور API ئۈچۈن مۇھىت ئۆزگەرگۈچىسى (environment variables) سۈپىتىدە. ئىككىنچى يېڭىلاش SQL case loader ئۈچۈن يەنە تەڭشەڭ: KANTESTI_DB_HOST, KANTESTI_DB_PORT, KANTESTI_DB_NAME, KANTESTI_DB_USER, and KANTESTI_DB_PASSWORD — يۈكلىگۈچى پەقەت ئوقۇشقا بولىدىغان رول ئارقىلىق ئۇلىنىدۇ (bench_reader) بۇنىڭدا جەدۋەلنى پەرق ئېتىپ تونۇشتۇرۇش ھوقۇقى يوق. تۆت. ئىجرا قىلىڭ python benchmark_bloodtest.py --limit 100000 پۈتۈن Second-Update نى ئىجرا قىلىش ئۈچۈن، ياكى python benchmark_bloodtest.py --limit 1000 تېز تەكرارلاش ئۈچۈن. چىقىرىلغان نەتىجىلەر ./benchmark_results/: دۆلەت-بەلگە ۋە كەسپ بويىچە ئىستونلىرى بار CSV نومۇر كارتىسى، بىر JSON توپلاما، قەۋەتلىك-تاسادىپىي خام جاۋاب ئەۋرىشكىسى ۋە بىر Markdown دوكلاتى.

23-ئاپرېل 2026-يىل (V11 دەسلەپكى، 15 ئەھۋال) ۋە 26-ئاپرېل 2026-يىل (V11 Second Update، 100,000 ئەھۋال) دىن كەلگەن پايدىلىنىش قېتىملىرى رېپوزىتورىيەنىڭ results/ مۇندەرىجىسىدە ساقلانغان. يېڭى قېتىم ئىجرا قىلىش پايدىلىنىش قېتىملىرىنى ئۆزگەرتمەستىن، يېڭى ۋاقىت-تامغىسى بار نومۇر جەدۋىلى ھاسىل قىلىدۇ. ئەگەر ئىجرا قىلىشىڭىز مەنىلىك دەرىجىدە ئوخشىمايدىغان نەتىجە بەرسە، ئىجرا قىلىش ۋاقتى-تامغىسى ۋە جاۋاب مېتا-سانلىقلىرىدا قايتۇرۇلغان ماتور نەشرىنى ئىشلىتىپ GitHub issue ئېچىڭ.

چەكلىمىلەر ۋە كەلگۈسى خىزمەتلەر

127 دۆلەت بەلگىسى بويىچە 100,000 دېلو بولسىمۇ، تۆت چەكلىمەنى ئوچۇق ئېتىراپ قىلىش كېرەك: ئۇزۇن قۇيرۇق بەلگىلەرنىڭ يېتەرلىك ئەۋرىشكىسىزلىكى، بىر قېتىملىق باھالاش، بىرلا ماتور دائىرىسى، ۋە بىرلا مەنبە سانلىق مەلۇمات مەنبەسى. بۇلارنىڭ ھەممىسى داۋاملىق قوغلىشىش خىزمىتىدە ھەل قىلىنىۋاتىدۇ.

ئۇزۇن قۇيرۇق بەلگە قاپلاش. ئىككىنچى يېڭىلانما 127 دۆلەت بەلگىسىنى ئۆز ئىچىگە ئالىدۇ، ئەمما تەقسىمات تەڭپۇڭ ئەمەس — ئالدىنقى 10 بەلگە دېلولارنىڭ ≈66.4% نى ئىگىلەيدۇ، قالغان 97 قوشۇمچە بەلگى بىرلىكتە ≈7.3% (تەخمىنەن 7,300 دېلو بىرلەشتۈرۈلگەن، ھەر بەلگەگە ئوتتۇرا ھېسابتا ~75 دېلو) تۆھپە قوشىدۇ. شۇڭا بۇ ئۇزۇن قۇيرۇقتىكى بەلگە بويىچە بىرىكمىلەر ئاساسىي ماۋزۇدىكى سانلارغا قارىغاندا تېخىمۇ شاۋقۇنلۇق. كەلگۈسى قېتىملىق ئىجرا قىلىشلار بەلگە تەقسىملەشنى قايتا تەڭپۇڭلاشتۇرۇپ، بەلگە بويىچە مۆلچەرلەرنى مۇستەھكەملەيدۇ.

بىر قېتىملىق باھالاش. بۇ توپلامدىكى ھەر بىر ئەھۋال پەقەت بىر قېتىم باھالاندى. چوڭ تىل مودېللىرى تۆۋەن ئەۋرىشكە تېمپېراتۇرىسىدىمۇ كۆرۈنەرلىك چىقىرىش تەۋرىنىشىنى كۆرسىتىدۇ، شۇڭا ھەر بىر ئەھۋالغا بەش قېتىم باھالاش ۋە دوكلات قىلىنغان تەۋرىنىش بىلەن كۆپ قېتىملىق باھالاش كېلىشىمى تەبىئىي كېيىنكى قەدەم — بولۇپمۇ «trap-case» قىسمىدا، ئەۋرىشكە جىتلەششىدە ئىزچىللىق بىخەتەرلىك تەلىپىنىڭ بىر قىسمى بولغاچقا.

بىرلا ماتور دائىرىسى. بۇ دوكلات بىرلا ماتورنى خاراكتېرلەندۈرىدۇ. باشقا AI سىستېمىلىرى بىلەن سېلىشتۇرما تەھلىللەر بۇ يەردە دائىرىدىن سىرت؛ بىز ئۇلارنى ئوخشاش MIT ئىجازەتلىك harness نى ئىشلىتىپ، مۇۋاپىق ئۇسۇل بىلەن ئايرىم مۇستەقىل تەتقىقات سۈپىتىدە قوغلىشىشىمىز مۇمكىن.

بىرىكمە سانلىق مەلۇمات. 100,000 دېلو بىرىكمە ياسالغان بولۇپ، بىرىكمە دېلولار ئەمەس؛ نەتىجىلەر ھەقىقىي دۇنيا كلىنىكىلىق ئىقتىدارىغا يۆتكىلىپ كەلمەيدۇ. ھەقىقىي، ئىجازەت بېرىلگەن، تاشقى مەنبەدىن كەلگەن سانلىق مەلۇمات ئۈستىدە باھالاش ئۈچۈن مۇۋاپىق ئەخلاقىي نازارەت تەلەپ قىلىنىدۇ ۋە بۇ بىرىكمە بۇلۇت سىنىقىنىڭ دائىرىسىگە كىرمەيدۇ.

بۇ تۆت چەكلىمىدىن باشقا، پىلانلانغان ئەڭ تەسىرلىك كېڭەيتىش دۆلەت/قەيەر بويىچە كۆپ تىل تەڭباراۋەرلىكى. Kantesti AI Engine 75+ تىلدىكى ئىشلەتكۈچىلەرگە مۇلازىمەت قىلىدۇ، ھەمدە تىل-قەۋەتلەنگەن Second-Update كىچىك توپلىرىنى (تۈركچە، گېرمانچە، ئىسپانچە، فىرانسۇزچە، ئىتالىيەچە، پورتۇگالچە، ئەرەبچە، ماندرىنچە) ئىجرا قىلىش ئارقىلىق ماتورنىڭ قوللايدىغان تىللىرى بويىچە چىقىرىش سۈپىتىنى سانلىق جەھەتتىن ئۆلچەيدۇ. ھەر بىر تىل-قەۋەتلەنگەن تەھلىل ئۆزىنىڭ DOI ۋە harness شۆبىسى بىلەن ئېلان قىلىنىدۇ.

100,000 ئەھۋالدا 99.80% بىرىكمە نومۇرغا ئېرىشكەن ئوخشاش ماتورنى سىناپ بېقىڭ

ئۆزىڭىزنىڭ قان تەكشۈرۈش تاختىسىنى بۇ ئۆلچەم-بەنجەدە باھالانغان ئوخشاش ئىشلەپچىقىرىش نۇقتىسىغا يوللاڭ. دۇنيادىكى 2 مىليوندىن ئارتۇق ئىشلەتكۈچى Kantesti AI Engine نى ئىشلىتىپ 75+ تىلدا 15,000 دىن ئارتۇق بىئوماركىرنى چۈشەندۈرىدۇ.

🔬 ھەقسىز دېمونى سىناپ بېقىڭ

Chrome كېڭەيتمىسى ئەپ دۇكىنى Google Play

📚 بۇ ئۆلچەمنى قانداق نەقىل كەلتۈرۈش

BibTeX

@techreport{klein2026kantesti_v11_second_update,
  author      = {Klein, Thomas and Bulut, Julian Emirhan},
  title       = {A Pre-Registered, Rubric-Based Automated Technical
                 Benchmark of the Kantesti Blood-Test Interpretation
                 Engine on 100,000 Synthetic Test Cases
                 --- V11 Second Update},
  institution = {Kantesti Ltd},
  address     = {London, United Kingdom},
  year        = {2026},
  month       = {April},
  type        = {Technical Report},
  number      = {V11 (Second Update)},
  doi         = {10.6084/m9.figshare.32095435},
  url         = {https://doi.org/10.6084/m9.figshare.32095435}
}

APA

Klein, T., & Bulut, J. E. (2026). Kantesti قان تەكشۈرۈش نەتىجىسىنى چۈشەندۈرۈش ماتورىنىڭ 100,000 دانە سۈنئىي سىناق ئەھۋالىدا Kantesti Blood-Test Interpretation Engine نى Kantesti قىلىپ، رۇبرىك ئاساسىدا ئالدىن تىزىمغا ئېلىنغان، ئاپتوماتىك تېخنىكىلىق بېنچمارك — V11 ئىككىنچى يېڭىلاش (Technical Report V11 Second Update). Kantesti Ltd. https://doi.org/10.6084/m9.figshare.32095435

📖 تاشقى ئۇسۇل-پايدىلىنىش پايدىلىنىش مەنبەلىرى

Mentzer, W. C. (1973). تۆمۈر يېتىشمەسلىكىنى تالاسسېمىيە خاسلىقىدىن پەرقلەندۈرۈش. The Lancet, 301(7808), 882.

🏥 PubMed

Aringer, M., Costenbader, K., Daikh, D., et al. (2019). 2019-يىللىق روماتىزمغا قارشى ياۋروپا بىرلەشمىسى / ئامېرىكا روماتولوگىيە ئىنىستىتۇتى سىستېمىلىق لۇپۇس ئېرىتېماتوسۇسنى تۈرگە ئايرىش ئۆلچەملىرى. Arthritis & Rheumatology, 71(9), 1400–1412.

🔗 DOI 🏥 PubMed

Umapathi, L. K., Pal, A., & Sankarasubbu, M. (2023). Med-HALT: چوڭ تىل مودېللىرى ئۈچۈن داۋالاش ساھەسىدىكى خىيال-ئالدامچىلىقنى سىناش. Proceedings of CoNLL 2023.

🔗 ACL Anthology

99.80%بىرىكمە نومۇر

100,000نومۇر بېرىلگەن ئەھۋاللار

127قاپلانغان دۆلەت بەلگىلىرى

0 / 87,412تۇزاقتىكى خاتا-مۇسبەتلەر

دائىم سورايدىغان سوئاللار

Kantesti سۈنئىي سىناق ئەھۋاللىرىدا AI ماتورى قانچىلىك توغرا؟

ئالدىن تىزىمغا ئېلىنغان رۇبرىك بويىچە، سەككىز مەزمۇن ساھەسى ۋە 127 دۆلەت بەلگىسىنى ئۆز ئىچىگە ئالغان 100,000 دانە سۈنئىي ياسالغان سىناق ئەھۋالىدا ئىجرا قىلىنغان (V11 ئىككىنچى يېڭىلاش)، ماتور 99.80 پىرسەنتلىك بىرىكمە نومۇرغا يەتتى؛ 87,412 دانە نازارەت قىلىنغان «trap-case» پۇرسىتىدە نۆل قېتىم «hyperdiagnosis» بايرىقى چىقمىدى، ھەمدە ئوتتۇرىچە جاۋاب كېچىكىشى 13.26 سېكۇنت بولدى. بۇ بىرىكمە سۈنئىي كىرگۈزۈشلەردىكى چىقىرىش ماسلىشىشچانلىقىنى ئۆلچەيدۇ، دىئاگنوز توغرىلىقىنى ئەمەس. ئەسلى V11 تارقىتىلىشى ئوخشاش رۇبرىكنى 15 دانە قولدا ياسالغان ئەھۋالدا سىناق قىلغان (بىرىكمە 99.12%)؛ ئىككىنچى يېڭىلاش رۇبرىنى byte-identical ساقلاپ، ئۇنى تېخىمۇ چوڭ سۈنئىي توپقا كېڭەيتتى. تولۇق نومۇر جەدۋىلى Figshare دا DOI 10.6084/m9.figshare.32095435 ئاستىدا ۋە GitHub دا MIT licence بىلەن ئېلان قىلىنغان.

Kantesti سۈنئىي ئەقىل ماتورى بالىياتقا (كلىنىكىلىق) تەستىقلاندىمۇ؟

ياق. ماتور ئاپتوماتىك تېخنىكىلىق بېنچمارك بىلەن (كلىنىكىلىق دەلىللەش ئەمەس) باھالانغان؛ رۇبرىك V11 دەسلەپكى قېتىملىق ئىجرا قىلىنىشتىن بۇرۇن مەنبە كودىدا توڭلىتىلغان بولۇپ، V11 ئىككىنچى يېڭىلانمىدا بىت-بىت ئوخشاش ھالەتتە ساقلانغان؛ 100,000 دانە سۈنئىي قان تەكشۈرۈش دېلوسى ئۈستىدە، قان كېسەللىكلىرى (hematology)، ئىچكى ئاجراتما كېسەللىكلىرى (endocrinology)، مېتابولىزم داۋالاش (metabolic medicine)، جىگەر كېسەللىكلىرى (hepatology)، بۆرەك كېسەللىكلىرى (nephrology)، يۈرەك كېسەللىكلىرى (cardiology)، رېماتىزم كېسەللىكلىرى (rheumatology) ۋە ئىچكى كېسەللىكلەر (internal medicine) بويىچە، 127 دۆلەت بەلگىسىدىن ئېلىنغان. كلىنىكىلىق نازارەتنى Dr. Thomas Klein, MD (ORCID 0009-0009-1490-1321) — Kantesti AI دىكى مۇدىرىيەت تەرىپىدىن گۇۋاھنامە ئالغان كلىنىكىلىق قان كېسەللىكلىرى دوختۇرى ۋە باش داۋالاش ئەمەلدارى (Chief Medical Officer) تەمىنلىگەن.

Hyperdiagnosis trap دېگەن نېمە؟

«Hyperdiagnosis trap» دېگەن بىر كلىنىكىلىق ئەھۋال بولۇپ، ئالاھىدە ھالدا AI ماتورلىرىدىكى ھەددىدىن زىيادە دىئاگنوز قويۇش (over-diagnosis) ھەرىكىتىنى بايقاش ئۈچۈن لايىھەلەنگەن. V11 دەسلەپكى ئۆلچەم (benchmark) بۇنىڭدىن ئىككىسىنى ئۇسۇل-ئىسپات (methodological proof-of-concept) سۈپىتىدە ئىشلەتكەن: گىلبېرت كېسەللىكىگە ماس كېلىدىغان يالغۇز «bilrubinaemia» نىڭ (hepatitis ياكى haemolysis ئەمەس، بەلكى UGT1A1 پولىمورفىزمىنىڭ زىيانسىز ئىپادىسى) ۋە پۈتۈنلەي نورمال قۇرامىغا يەتكەنلەرنى تەكشۈرۈش تاختىسى (يەنى توغرا چىقىرىش «خاتىرجەم قىلىش» بولۇپ، ياسالغان چېگرادىن سەل يۇقىرى/چېگرادىن سەل تۆۋەن كېسەللىك ئالامىتى ئەمەس). V11 ئىككىنچى يېڭىلانمىدا بۇ «trap-case» ئۇسۇلى 8,723 دانەدىن تەركىب تاپقان مەخسۇس بىر قىسمغا كېڭەيتىلىپ، 87,412 دانە نازارەت قىلىنغان hyperdiagnosis ئاگاھلاندۇرۇش پۇرسىتى ھاسىل قىلىنغان — ۋە ماتورنىڭ يالغان-مۇسبەت (false-positive) نىسبىتى نۆل (zero) بولۇپ قالغان.

Kantesti AI ماتورىنىڭ باھالاش نەتىجىسى قايتا-قايتا تەكرارلىنىپ چىقامدۇ؟

تولۇق باھالاش (evaluation) قورالى MIT ئىجازەتنامىسى ئاستىدا بىرلا دانە، ئۆز ئىچىگە ئالغان (self-contained) Python مودۇل سۈپىتىدە ئېلان قىلىنغان. V11 دەسلەپكى قېتىملىق ئىجرا قىلىنىش پەقەت Kantesti API ئىسپاتنامە جۈپى ۋە Python 3.10 ياكى ئۇنىڭدىن كېيىنكى نەشرىنى تەلەپ قىلىدۇ. V11 ئىككىنچى يېڭىلانمىدا Kantesti كلىنىكىلىق-ساقلىغۇچ (clinical-repository) ئىسپاتنامىسى تەلەپ قىلىدىغان پارامېتىرلىق، پەقەت ئوقۇشقا بولىدىغان SQL ئەھۋال يۈكلىگۈچ قوشۇلغان (a bench_reader جەدۋەللەرنى پەرق ئېتىپ تونۇشقا ھېچقانداق ھوقۇقى يوق رول). كود، ئەھۋال يۈكلىگۈچنىڭ SQLى، ئۆلچەم (rubric) (نەشرلەر ئارىسىدا بىت-بىت بىلەن ئوخشاش)، شۇنداقلا V11 دەسلەپكى ۋە ئىككىنچى يېڭىلانما پايدىلىنىش (reference) ئىجرا قىلىنىشلىرىدىن ئېلىنغان قاتلاملىق (stratified) تاسادىپىي ئەۋرىشكە قىلىنغان خام ماتور جاۋابلىرى github.com/emirhanai/kantesti-blood-test-benchmark دا بار، ھەمدە Figshare، ResearchGate ۋە Academia.edu دا كۆپەيتىلگەن (mirrored).

Kantesti AI ماتورى تۆمۈر يېتىشمەسلىكىنى beta-تالاسсемىيە خاسلىقىدىن قانداق پەرقلەندۈرىدۇ؟

ماتور Mentzer كۆرسەتكۈچىنى قوللىنىدۇ؛ ئۇ قورۇما ھۈجەيرە ھەجىمى (mean corpuscular volume) نى قىزىل قان ھۈجەيرىسى سانىغا (red blood cell count) بۆلۈش ئارقىلىق ھېسابلىنىدۇ. Mentzer كۆرسەتكۈچى 13 دىن يۇقىرى بولسا تۆمۈر يېتىشمەسلىكتىن كېلىپ چىققان قان ئازلىقنى (iron deficiency anaemia) قوللايدۇ، 13 دىن تۆۋەن بولسا beta-thalassaemia خاسلىقىنى قوللايدۇ. V11 دەسلەپكى ئۆلچەمدە بۇ ئىككى خىل ئەھۋال Mentzer كۆرسەتكۈچىنى ئېنىق ھېسابلاش ئارقىلىق توغرا تۈرگە ئايرىلغان؛ بۇنىڭغا ferritin، RDW ۋە HbA2 نىڭ ئارقا كۆرۈنۈشى (context) قوللاش بولغان. V11 ئىككىنچى يېڭىلانمىدىكى 100,000 دانە ئەۋرىشكە توپىدا، ئوخشاش پەرقلىق ھەرىكەت نوپۇس كۆلىمىدە ساقلانغان.

خام ماتېرىيال ئۆلچەم سانلىق مەلۇماتلىرى ۋە مەنبە كودىنى قەيەردىن تاپالايمەن؟

تېخنىكىلىق دوكلات Figshare غا DOI 10.6084/m9.figshare.32095435 (V11 دەسلەپكى ئېلان ۋە V11 ئىككىنچى يېڭىلانمىنى ھەر ئىككىسىنى ئۆز ئىچىگە ئالىدۇ) قىلىپ قويۇلغان؛ ResearchGate نىڭ 404175463-نومۇرلۇق ئېلانى ۋە Academia.edu نىڭ 165956808-نومۇرلۇق ماقالىسىدا كۆپەيتىلگەن — ھەر ئىككىسى V11 ئىككىنچى يېڭىلانما ماۋزۇسى ۋە 100,000 دانە ئەۋرىشكە نەتىجىلىرى بىلەن يېڭىلانغان — ھەمدە MIT ئىجازەتنامىلىق Python قورالى (harness) ۋە بارلىق پايدىلىنىش ئىجرا نەتىجىلىرى github.com/emirhanai/kantesti-blood-test-benchmark دا. تۆت سۇپىلىق كۆپەيتىلگەن تور (mirror network) ئۇزۇن مۇددەتلىك ئىشلىتىشچانلىق ۋە نەقىل كەلتۈرۈش (citation) جانلىقلىقىنى كاپالەتلەيدۇ.

نېمە ئۈچۈن AI داۋالاش ئۆلچىمى (medical benchmarks) ئۈچۈن ئالدىن تىزىملىتىش (pre-registration) مۇھىم؟

ئالدىن تىزىملىتىش (pre-registration) كېيىنكى باسقۇچتا ئۆلچەم (rubric) نى «تۇزىتىپ-چوڭايتىش» (post-hoc rubric tuning) نىڭ ئالدىنى ئالىدۇ؛ بۇ شىركەت باشقۇرىدىغان ئۆلچەملەرنىڭ ئۆز سانىنى ئۆزىگە پايدىلىق قىلىپ كۆپەيتىدىغان ئەڭ كۆپ ئۇچرايدىغان ئۇسۇلى. ئۆلچەمنى ماتور چاقىرىشتىن ئىلگىرى مەنبە كودىغا باغلاپ، قورالنى (harness) ئاممىغا ئېلان قىلىش ئارقىلىق، ئۆلچەم يازغۇچىنىڭ ۋاقتىنى نەشر كونترولدا تەكشۈرگىلى بولىدۇ، ماتور نەتىجىلىرى ئۆلچەش ئۆلچىمىنى شەكىللەندۈرەلمەيدۇ.

بۇ ئۆلچەم باشقا AI ماتورلىرى بىلەن سېلىشتۇرۇشنى ئۆز ئىچىگە ئالامدۇ؟

ياق. V11 دوكلاتى — دەسلەپكى ئېلان ۋە ئىككىنچى يېڭىلانما — قەستەن ھالدا بىرلا ماتورنى مۇقىم ئۆلچەم (fixed rubric) بىلەن سېلىشتۇرۇپ خاراكتېرلەيدۇ، ئۇنى باشقا سودا سىستېمىلىرىغا قارشى قويمايدۇ. قورال MIT ئىجازەتنامىسى ئاستىدا ئوچۇق كود (open source) (ھازىر SQL ئەھۋال يۈكلىگۈچنىمۇ ئۆز ئىچىگە ئالىدۇ)، شۇڭا مۇستەقىل تەتقىقاتچىلار ئۆزلىرى تاللىغان ھەر قانداق ماتورنى ئوخشاش ئۆلچەم ۋە ئوخشاش ئەھۋال يۈكلىگۈچ بىلەن باھالاپ، نەتىجىلىرىنى ئېلان قىلالايدۇ.

بىمار ئەھۋاللىرى ھەقىقىيمۇ ياكى سۈنئىي (synthetic)مۇ؟

بارلىق ئەھۋاللار سۈنئىي ياسالغان — V11 دەسلەپكى تارقىتىلىشتا 15 دانە قولدا ياسالغان ئەھۋال ۋە ئىككىنچى يېڭىلاشتا 100,000 دانە. بۇلار سۈنئىي ئەھۋاللار ئەمەس: سۈنئىي سانلىق مەلۇمات، ئىجازەت جەريانى ۋە de-identification قاتارلىقلار ئىشلىتىلمەيدۇ، چۈنكى بۇ توپتا شەخسىي سانلىق مەلۇمات مەۋجۇت ئەمەس. ئېلان قىلىنغان harness، تېخنىكىلىق دوكلات ياكى تارقىتىلغان سانلىق مەلۇمات توپلىرىدا شەخسىي سانلىق مەلۇمات كۆرۈنمەيدۇ.

⚕️ داۋالاشنى رەت قىلىش باياناتى (Medical Disclaimer) ۋە مەنپەئەت توقۇنۇشى

بۇ بنچمارك دوكلاتى تەتقىقات ۋە ئۇسۇل-ئېنىقلىق (methodological transparency) مەقسىتى ئۈچۈن. ئۇ داۋالاش مەسلىھەتى ھېسابلانمايدۇ، دىئاگنوز ئەمەس، شۇنداقلا كەسپىي داۋالاش پەرۋىشىنىڭ ئورنىنى باسمايدۇ؛ بۇ يەردىكى ھەر قانداق نەتىجە دوختۇرغا كۆرۈنۈشنى كېچىكتۈرۈش ياكى ئۇنىڭدىن ئۆزىنى قاچۇرۇش ئۈچۈن ئىشلىتىلمەسلىكى كېرەك. دىئاگنوز ۋە داۋالاش قارارلىرى ئۈچۈن ھەمىشە لاياقەتلىك ساغلاملىق مۇلازىمىتى تەمىنلىگۈچى بىلەن مەسلىھەتلىشىڭ. بۇ شىركەتنىڭ ئۆزىنىڭ ماتورىغا قارىتىلغان ئۆزى تەرىپىدىن ئىجرا قىلىنغان ئىچكى بنچمارك بولۇپ، مۇستەقىل دەلىللەنمىگەن ياكى تورداش-تەكشۈرۈلمىگەن. بىرىكمە نومۇر مۇقىم ئۆلچەمگە ماس كېلىشنى ئۆلچەيدۇ (دوكلات قۇرۇلمىسى، ئاچقۇچلۇق سۆز ۋە نومۇرلاش-سىستېمىسىنى ئەسلىگە كەلتۈرۈش، شۇنداقلا كېچىكىش)؛ ئۇ ھەقىقىي دۇنيا دىئاگنوز توغرىلىقى ياكى كلىنىكىلىق بىخەتەرلىكنى ئۆلچەش ئەمەس. ئىككى ئاپتورنىڭ ھەممىسى Kantesti Ltd دا خىزمەت قىلىدۇ ۋە ئۇنىڭدا ئۈلۈش (equity) ئىگىسى؛ باھالانغان ماتور بولسا ئوخشاش تەشكىلاتنىڭ سودا مەھسۇلى. بۇ مەنپەئەت توقۇنۇشى كود ئىچىدە ئۆلچەمنى ئالدىن تىزىملاش (pre-register) قىلىش، MIT ئىجازەتنامىسى بىلەن harness نى ئېلان قىلىش، ھەمدە خام ماتور جاۋابلىرىدىن قەۋەتلىك تاسادىپىي ئەۋرىشكە ئېلان قىلىش ئارقىلىق ئازايتىلغان.

E-E-A-T ئىشەنچ سىگناللىرى

⭐

تەجرىبە

ئەھۋال تاختىسىنى تاللاشنى نازارەت قىلىش ئۈچۈن 15+ يىللىق كلىنىكىلىق گېماتولوگىيە ۋە تەجرىبىخانا داۋالاش تەجرىبىسى.

📋

مۇتەخەسسىسلىك

ئالدىن تىزىملىتىلگەن ئۆلچەم (rubric) لايىھىسى: ئېنىق hyperdiagnosis جازاسى ۋە ئېتىراپ قىلىنغان كلىنىكىلىق نومۇرلاش سىستېمىلىرى (Mentzer, FIB-4, EULAR/ACR, KDIGO).

👤

ھوقۇقدارلىق

باش ئاپتور دوكتور توماس كلېين، MD (ORCID 0009-0009-1490-1321). يولغا قويۇش (Implementation) جۇلىيان ئەمىرخان بۇلۇت (Julian Emirhan Bulut)، Kantesti Ltd نىڭ باش ئىجرائىيە ئەمەلدارى (CEO).

🛡️

ئىشەنچلىكلىك

MIT ئىجازەتنامىلىق قايتا ئىشلەتكىلى بولىدىغان (reproducible) قورال، خام ماتور جاۋابلىرى ئېلان قىلىنغان، ئوچۇق مەنپەئەت توقۇنۇشىنى بايان قىلىش، تۆت سۇپىلىق تەتقىقات كۆپەيتىلگەن (mirror) تور.

🏢 كانتېستى چەكلىك شىركىتى ئەنگلاند ۋە ۋېلىستە تىزىمغا ئالدۇرۇلغان · شىركەت نومۇرى. 17090423 لوندون، ئەنگىلىيە · kantesti.net