نېمىشقا بۇ ئۆلچەملىك سىناق مەۋجۇت ۋە ئۇ نېمىنى سىنايدۇ

AI ياردەملىك قان تەكشۈرۈش نەتىجىسىنى قانداق ئوقۇش ئىستېمالچىلار ۋە بالىيات/كلىنىكىلىق خىزمەت ئېقىمىدا بارغانسېرى كۆپ ئىشلىتىلىۋاتىدۇ، ئەمما تەجرىبىخانا داۋالاشقا ماسلاشتۇرۇلغان، قايتا ئىشلەپ باھالاشقا بولىدىغان باھالاش رامكىلىرى يەنىلا ئاز ئۇچرايدۇ. بۇ ئەھۋالدا ئەڭ مۇھىم بولغان سوئاللار ئادەتتىكى داۋالاش سوئال-جاۋاب ئۆلچەملىرىدە يېپىلمايدىغان سوئاللار: ئوتتۇرىچە ئېرىتروسىت ھەجىمى (MCV) ئوخشاش بولغاندا، ماتور تۆمۈر يېتىشمەسلىكىنى تالاسسېمىيە خاسلىقىدىن ئايرىيالامدۇ؟ ئۇ گىلبېرت كېسەللىكىنى جىگەر ياللۇغىغا ئوخشاتىپ خاتا دىئاگنوز قويامدۇ؟ ھەمدە پۈتۈنلەي نورمال تەكشۈرۈش پىروگراممىسىدا كېسەللىك پەيدا قىلىپ قويامدۇ؟

ئالدىن تىزىمغا ئېلىنغان ئۆلچەم ئېقىم دىئاگراممىسى — Kantesti AI ماتورى (V11 ئىككىنچى يېڭىلانما، 100,000 ئەھۋالدا 99.80% بىرىكمە نومۇرى) قانداق قىلىپ مۇزلىتىپ قويۇلغان نومۇرلاش ئۆلچىمىگە قارشى باھالانغانلىقىنى كۆرسىتىدۇ
1-رەسىم: V11 ئىككىنچى يېڭىلاش 100,000-دېلو توپىنىڭ ئارقىسىدىكى ئۆلچەملىك قۇرۇلما — ھەر بىر دېلو، ھەر بىر ئاچقۇچلۇق سۆز، ھەر بىر نومۇرلاش سىستېمىسى ماتور PDF نى كۆرۈشتىن بۇرۇنلا مەنبە كودىغا مۇقىملاشتۇرۇلغان، ھەمدە باھالاش رۇبىرىكىسى V11 دەسلەپكى تارقىتىلىشى بىلەن بىردەك (بايت-بىردەك). لايىھە بويىچە كېيىنكى رۇبىرىكا تەڭشەش مۇمكىن ئەمەس. 99.80% بىرىكمە نومۇر hub تېخىمۇ كەڭ رامكىنى چۈشەندۈرىدۇ؛ بۇ بەت V11 دەسلەپكى ئىسپات-ئۇقۇشنى ۋە V11 ئىككىنچى يېڭىلاشنى چۈشەندۈرىدۇ — ئۇنى 127 دۆلەتنى ئۆز ئىچىگە ئالغان SQL ئارقىلىق قوللىنىدىغان كلىنىكىلىق ساقلىغۇچتىن ئېلىنغان 100,000 دانە نامسىزلاشتۇرۇلغان دېلاغا كېڭەيتتى؛ ئوخشاش نومۇرلاش رۇبىرىكىسى ئىشلىتىلگەن، بايت-بىردەك، كېيىنكى تەڭشەشكە يول قويۇلمىغان.

بىرلا قان تەكشۈرۈش تاختىسى ئادەتتە بىر نەچچە رىقابەتچى چۈشەندۈرۈشنى قوللايدىغان يېتەرلىك سىگنالنى ئۆز ئىچىگە ئالىدۇ، چۈشەندۈرىدىغان دوختۇرنىڭ ۋەزىپىسى بولسا ئۇ چۈشەندۈرۈشلەرنى بىر-بىرىگە سېلىشتۇرۇپ تارازىلاش، دەرسلىكتىكى جاۋابنى قايتۇرۇپ بېرىش ئەمەس. دەرسلىكتىكى ئەھۋاللاردا ياخشى نەتىجە كۆرسەتكەن ماتور ئەڭ مۇھىم بولغان ئەھۋاللاردا يەنىلا مەغلۇپ بولۇشى مۇمكىن: دىففېرېنسىيال دىئاگنوز (پەرقلەندۈرۈش دىئاگنوزى)دىكى تۇزاقلار، يالغۇز كۆرۈنگەندە ئالارمادەك كۆرۈنىدىغان زىيانسىز ۋارىيانتلار، ۋە تولۇق نورمال تاختىلار بولۇپ، ئىشەنچلىك ياردەمچى پروگراممىلارنى كېسەللىك پاتولوگىيەسىنى «ياساپ چىقىرىش»قا قىزىقتۇرىدۇ.

بۇ ئۆلچەملىك سىناق دەل شۇ مەغلۇپ بولۇش شەكىللىرىنى ئاساس قىلغان. 15 ئەھۋالنىڭ ھەر بىرى مەلۇم بىر دىئاگنوز خۇسۇسىيىتى ئۈچۈن تاللانغان: تۆمۈر يېتىشمەسلىكىدىن بولغان مىكروسىتوز بولۇپ، ئوخشاش mean corpuscular volume (ئوتتۇرىچە ئېرىتروسىت ھەجىمى) بار beta-thalassaemia خاسلىقىدىن ئايرىم ساقلىنىشى كېرەك؛ پەقەت يالغۇز ئىزولياتسىيە قىلىنغان ۋاسىتىلىك يۇقىرى قان بىليروبىنى (indirect hyperbilirubinaemia)لا نورمالسىز بولغان Gilbert's syndrome كۆرۈنۈشى؛ ۋە 15 پارامېتىرلىق تەكشۈرۈش تاختىسىدا ھەر بىر ئانالىت ئۆزىنىڭ پايدىلىنىش دائىرىسى (reference range) ئىچىدە تۇرىدىغان ئەھۋال. ئۆلچەم (rubric) ھەر بىر ئەھۋالنى ئۆزىنىڭ شەرتى بويىچە ئوقۇغان ماتورلارنى مۇكاپاتلايدۇ، ھەمدە مۇشۇنداق دىئاگنوزنىڭ ھاجىتى يوق ۋاقىتتا ئىشەنچلىك دىئاگنوزغا يېتىپ بارغان ماتورلارنى جازالايدۇ.

دوكتور توماس كلېين (MD) بولۇش سۈپىتىم بىلەن، مەن بۇ ئەھۋال تاختىسىنى تاللىدىم، چۈنكى مەن تەجرىبىخانا-مېدىتسىنا ياردەمچى پروگراممىلىرىنىڭ ئەڭ كۆپ خاتا قىلىدىغان ئەندىزىلىرى مۇشۇلار دەپ قارايمەن. ئەڭ قىممەت مەغلۇپ بولۇش شەكلى "كەم ئۇچرايدىغان كېسەللىكنى قولدىن بېرىپ قويۇش" ئەمەس — بەلكى ئۇنى يوق بىمارلاردا ئادەتتىكى پاتولوگىيەنى توقۇپ چىقىرىش. بىزنىڭ Medical Validation hub تېخىمۇ كەڭ رامكىنى چۈشەندۈرىدۇ؛ بۇ بەت V11 دەسلەپكى ئىسپات-ئۇقۇمى ۋە V11 ئىككىنچى يېڭىلاشنى چۈشەندۈرىدۇ — ئۇنى 127 دۆلەت بەلگىسىنى ئۆز ئىچىگە ئالغان بىرىكمە دېلو توپلىمىدىن تاللانغان 100,000 بىرىكمە دېلوغا كېڭەيتتى — ئوخشاش نومۇرلاش رۇبىرىكىنى ئىشلىتىپ، byte-تەڭ، post-hoc تەڭشەش رۇخسەت قىلىنمايدۇ.

2026-يىلى 26-ئاپرېلدىكى V11 ئىككىنچى يېڭىلاش پايدىلىنىش قېتىم ئىجراسى بىرىكمە نومۇرنى ھاسىل قىلدى

V11 دەسلەپكى تارقىتىلىشىدا ئىشلىتىلگەن ئوخشاش ئالدىن تىزىملىتىلگەن رۇبىرىكىغا ئاساسەن، باھالاندى 99.80% 100,000 دانە نامسىزلاشتۇرۇلغان دېلو 100,000 بىرىكمە دېلو Kantesti بىرىكمە دېلو توپلىمىدىن تاللانغان ۋە 127 دۆلەت بەلگىسى . دەسلەپكى V11 قېتىمى 2026-يىلى 23-ئاپرېلدا 15 دانە قولدا تاللانغان دېلونى (بىرىكمە 99.12%) ئۆز ئىچىگە ئالغان ۋە رۇبىرىكىنى دەلىللەگەن؛ ئىككىنچى يېڭىلاش شۇ رۇبىرىكىنى بايت-بىردەك ساقلاپ، باھالاشنى نوپۇس كۆلىمىدىكى توپقا كېڭەيتتى. 0 / 87,412. 100,000 دېلونىڭ 100,000 ى نومۇر ئالدى.

بىرىكمە 99.80% 13.26 s
1.000 قۇرۇلما نومۇرى
0.996 كلىنىكىلىق نومۇر
ئاساسىي يولدىكى مۇلازىمەت-دەرىجە نىشانىغا قارىتا. ئېنىق پارچىلىنىش تۆۋەندىكى رۇبىرىكا فورمۇلاسىدا كۆرسىتىلگەن — بۇ ئىككىنچى يېڭىلاش ئۈچۈن بۇ ئېغىرلىقلار ياكى كىچىك رۇبىرىكىلارنىڭ ھېچقايسىسى ئۆزگەرتىلمىدى. ئوتتۇرىچە كېچىكىش ۋاقتى
0 / 87,412 تۇزاقتىكى يالغان مۇسبەتلەر

بىرىكمە فورمۇلا ئۈچ تەركىبنى بىرلەشتۈرىدۇ: قۇرۇلما ماسلىشىش يەتتە مەجبۇرىي دوكلات بۆلىكى ۋە 16 مەجبۇرىي تارماق بۆلەكنىڭ بىلەن،, مەزمۇننىڭ توغرىلىقى ئاچقۇچلۇق سۆزنى ئەسلەش (keyword recall) + نومۇرلاش سىستېمىسىنى ئەسلەش (scoring-system recall) + ئېھتىماللىق-تەقسىملەشنىڭ توغرىلىق تەكشۈرۈشى (probability-distribution validity check) ئارقىلىق ئۆلچەنىدۇ، ۋە جاۋاب كېچىكىشى قالغان 0.20 پىرسەنت نۇقتىلىق «headroom» دېگۈدەك پۈتۈنلەي كلىنىكىلىق كىچىك نومۇرغا پارچىلىنىدۇ — ئاز بىر قىسىم دېلولار (ئاساسلىقى گېپاتولوگىيە ۋە رېماتولوگىيەدە) ماتورنىڭ «interpretation» ىدە بىر مۆلچەرلەنگەن نومۇرلاش-سىستېما ئاچقۇچلۇق سۆزى يوق بولغان، گەرچە دىئاگنوز مەزمۇنى توغرا بولسىمۇ.

بىرىكمە = 0.35 × قۇرۇلما + 0.55 × كلىنىكىلىق + 0.10 × كېچىكىش

100,000 دېلو ئىچىدىكى ئىككىنچى يېڭىلاش توپىدا ھېچقانداق دېلو ئۆزىنىڭ دىئاگنوزىنى ئۆتكۈزۈپ قويمىدى. كېچىكىش V11 دەسلەپكى تارقىتىلىشىدىكى ئوتتۇرىچە 20.17 s دىن ئىككىنچى يېڭىلاشتىكى 13.26 s گە ياخشىلاندى — ئىككى قېتىم ئىجرا ئارىسىدىكى ئىشلەپچىقىرىش ماتورىنى ئەلالاشتۇرۇشنى ئەكس ئەتتۈرىدۇ؛ رۇبىرىكا، نومۇرلاش كودى ۋە API نۇقتىسى ئۆزگەرمىدى. دۆلەت بويىچە بىرىكمە نومۇرلار ئەڭ تۆۋەن 0.9971 (ھىندىستان) دىن ئەڭ يۇقىرى 0.9985 (شىۋېيتسارىيە) گىچە بولدى — ئەڭ كۆپ ۋەكىللىك قىلغان 30 دۆلەت ئىچىدە. قالغان 97 دۆلەتنىڭ ئۇزۇن قۇيرۇقى (≈7,300 دېلو بىرلىكتە) ھېچقانداق سىستېمىلىق تۆۋەنلەشنى كۆرسەتمىدى. دېلو سانى بويىچە ئەڭ چوڭ تۆھپىكارلار: ئامېرىكا (10,500)، بىرازىلىيە (9,500)، ئىسپانىيە (9,000)، ئىتالىيە (8,000)، گېرمانىيە (7,800)، فرانسىيە (7,400)، پورتۇگالىيە (5,800)، تۈركىيە (3,400)، ئەنگىلىيە (2,900) ۋە مېكسىكا (2,500).

بەلگە بويىچە بىرىكمە نومۇرلار ئەڭ كۆپ ئۇچرايدىغان 30 دۆلەت بەلگىسىدە 0.9971 دىن 0.9985 گىچە بولدى. قالغان 97 قوشۇمچە بەلگىدىن تەركىب تاپقان ئۇزۇن قۇيرۇق (تەخمىنەن 7,300 دېلو بىرلەشتۈرۈلگەن) ھېچقانداق سىستېمىلىق تۆۋەنلەشنى كۆرسەتمىدى. دېلو سانى بويىچە ئەڭ كۆپ ئۇچرايدىغان بەلگىلەر: ئامېرىكا (10,500)، بىرازىلىيە (9,500)، ئىسپانىيە (9,000)، ئىتالىيە (8,000)، گېرمانىيە (7,800)، فرانسىيە (7,400)، پورتۇگالىيە (5,800)، Türkiye (3,400)، ئەنگلىيە (2,900) ۋە مېكسىكا (2,500). بەلگە بويىچە بىرىكمە نومۇرلار 0.9971 دىن 0.9985 گىچە بولدى.

15 دېلودىن 100,000 گىچە: 127 دۆلەت بەلگىسى ئارىسىدا كوھورتنىڭ تەرەققىي قىلىشى

ئەسلى V11 دېلو پەنلى يەتتە كەسپنى — گېماتولوگىيە، ئېندروكرىنولوگىيە، مېتابولىزم تېبابىتى، گېپاتولوگىيە، نېفرولوگىيە، كاردىئولوگىيە، روماتولوگىيە — شۇنداقلا ئىككى دانە مەخسۇس hyperdiagnosis تۇزاق دېلوسىنى ئۆز ئىچىگە ئالغان؛ ھەر بىر دېلو بىرىكمە ياسالغان قان تەكشۈرۈش پەنلى ئىدى. V11 ئىككىنچى يېڭىلاش باھالاشنى 127 دۆلەت بەلگىسى ئارىسىدا 100,000 بىرىكمە دېلوغا كېڭەيتىدۇ, V11 دەسلەپكى دېلو تاختىسى: گېماتولوگىيە، ئېندوكرىنولوگىيە، مېتابولىك داۋالاش، گېپاتولوگىيە، نېفرولوگىيە، كاردىئولوگىيە، رېماتولوگىيە — شۇنداقلا ئىككى دانە «trap» دېلو: گىلبېرت كېسەللىكى (Gilbert's syndrome) ۋە پۈتۈنلەي نورمال تەكشۈرۈش تاختىسى. ئىككىنچى يېڭىلاش بۇ رۇبىرىكىنى بايت-بىردەك ساقلاپ، توپنى Kantesti SQL ساقلىغۇچتىن ئېلىنغان 100,000 دېلوغا كېڭەيتتى.

V11 دەسلەپكى case-panel لايىھەسى — يەتتە داۋالاش كەسپىدىكى ئون بەش دانە سۈنئىي قان تەكشۈرۈش ئەھۋالى، شۇنداقلا ئىككى دانە hyperdiagnosis trap ئەھۋالى؛ ئوخشاش رۇبرىك V11 ئىككىنچى يېڭىلاشتا 100,000 دانە ئەھۋالدا 99.80% بىرىكمە نومۇرغا يەتتى
2-رەسىم: نامسىزلاشتۇرۇش «Safe Harbor» ئۇسۇلى بويىچە قىلىندى: بارلىق بىۋاسىتە پەرقلىگۈچلەر چىقىرىۋېتىلدى ياكى ئالماشتۇرۇلدى، ھەمدە ھەر بىر خاتىرىگە BT-NNN-LABEL شەكلىدە ئۆلچەم-ئىچكى دېلو كودى بېرىلدى (V11 دەسلەپكى) ياكى ئىككىنچى يېڭىلاش ئۈچۈن مۇقىم نامسىز.

بارلىق دېلولار بىرىكمە ياسالغان بولغاچقا، چىقىرىپ تاشلايدىغان ھەقىقىي پەرقلىگۈچ يوق ۋە شەخسىي سانلىق مەلۇماتمۇ يوق. ھەر بىر بىرىكمە دېلوغا سىناق ئىچىدىكى دېلو كودى (V11 دەسلەپكى توپلامدا BT-NNN-LABEL، ئىككىنچى يېڭىلاشتىا مۇقىم . بىر تەرەپ قىلىش V11 دەسلەپكى تارقىتىلىشىغا ماس ھالدا ئېلىپ بېرىلدى — 15 دانە قولدا تاللانغان دېلو ). ئېلان قىلىنغان باھالاش قورالىدا، تېخنىكىلىق دوكلاتتا ياكى ئېلان قىلىنغان سانلىق مەلۇمات توپلاملىرىدا ھېچقانداق شەخسىي سانلىق مەلۇمات كۆرۈنمەيدۇ.

V11 initial release — 15 hand-curated cases

ئەسلىدىكى V11 دېلو تاختىسىنى دوكتور توماس كلېين قولدا تاللاپ تەييارلىغان بولۇپ، ئۇ تەجرىبىخانا-مېدىتسىنا ياردەمچىلىرى ئەڭ كۆپ خاتا قىلىدىغان دىئاگنوز پەترەنلىرىنى چېنىقتۇرۇش ئۈچۈن ئىشلىتىلگەن. ئون بەش دېلونىڭ ھەر بىرى تۆۋەندە كۆرسىتىلگەن مەلۇم بىر دىئاگنوز خۇسۇسىيىتى ئۈچۈن تاللانغان.

قان كېسەللىكلىرى (3) BT-001, BT-006, BT-007 تۆمۈر يېتىشمەسلىك ئانېمىيەسى · B12 يېتىشمەسلىكى · كىچىك β-تالاسسېمىيە
ئىچكى ئاجراتما كېسەللىكلىرى (3) BT-002, BT-008, BT-012 خاشىموتو قالقانسىمان بەز ياللۇغى · ئىنسۇلىنغا قارشى تۇرۇش بىلەن PCOS · ئېغىر D ۋىتامىن يېتىشمەسلىكى
مېتابولىك (2) BT-003, BT-013 مېتابولىك بىمارلىق بىلەن T2DM · بوغۇم ياللۇغى (گوت) خەۋىپى بىلەن يۇقىرى سۈيدۈك كىسلاتاسى
بېغىر كېسەللىكلىرى (2) BT-004, BT-009 NAFLD / NASH · ئۆتكۈر ۋىرۇسلۇق جىگەر ياللۇغى
بۆرەك كېسەللىكلىرى · يۈرەك كېسەللىكلىرى · رېماتىزم كېسەللىكلىرى (3) BT-005, BT-010, BT-011 CKD 3-باسقۇچ · ئاتېرروگېنلىق دىسلىپېدىيە · سىستېمىلىق قىزىل يۈرەك كېسىلى (SLE)
تۇزاق ئەھۋاللىرى (2) BT-014, BT-015 گىلبېرت كېسەللىكى (يالغۇز ئىندىرېكتلىق يۇقىرى بىليروبىن) · پۈتۈنلەي نورمال قۇرامىغا يەتكەنلەر تەكشۈرۈشى

نېمىشقا بۇ ئالاھىدە تەقسىمات

گېماتولوگىيە ئۈچ خىل ئەھۋالغا ئېرىشىدۇ، چۈنكى مىكروسىتىك پەرقلەندۈرۈش ۋە ماكرۆسىتىك پەرقلەندۈرۈش ھەقىقىي دۇنيا تەجرىبىخانىلىق ئەمەلىيەتتە ئەڭ كۆپ ئۇچرايدىغان «قىستۇرما تۇزاق» لار. ئېندوكروinولوگىيە ئۈچ خىل ئەھۋالغا ئېرىشىدۇ، چۈنكى Hashimoto كېسىلى، PCOS ۋە D ۋىتامىن يېتىشمەسلىكى كۆرۈنۈشلىرى ئوخشىمىغان دىئاگنوز شەكىللىرىنى چېنىقتۇرىدۇ (ئاپتومۇخادىرە-ئاساسلىق، ھورمون نىسبىتى-ئاساسلىق، يەككە بەلگە-ئاساسلىق). يەككە ئەھۋاللىق كەسىپلەر يەنىلا ئەھمىيەتلىك، چۈنكى ھەر بىرى CKD، ASCVD خەۋىپى ۋە SLE نىڭ ئۆزىگە خاس نومۇرلاش سىستېمىسى بار بولۇپ، ماتور چوقۇم شۇنى چاقىرىشى كېرەك (KDIGO باسقۇچلىشى، ASCVD 10 يىللىق خەۋىپ، ۋە 2019 EULAR/ACR SLE ئۆلچىمى).

V11 ئىككىنچى يېڭىلاش — 127 دۆلەت بەلگىسى ئارىسىدا 100,000 بىرىكمە دېلو

ئىككىنچى يېڭىلاش ئەسلى V11 نىڭ قاتتىق كودلانغان 15 دېلو Python لىتىرالنى تېخىمۇ چوڭراق، پروگرامما ئارقىلىق ياسالغان بىرىكمە دېلو توپلىمى بىلەن ئالماشتۇرىدۇ. دېلو توپلىمى ھەر قېتىملىق ئىجرا باشلىنىشىدا يۈكلىنىدۇ ۋە سەپلىمە سۈزۈكلۈك ئۈچۈن خاتىرىلىنىدۇ. كوھورتنىڭ مەزمۇن رايونى بويىچە تەقسىماتى تۆۋەندە كۆرسىتىلگەن.

ئىچكى ئاجراتما 23,900 دېلو (23.9%) قالقانسىمان بەز، PCOS، D ۋىتامىن يېتىشمەسلىكى، جىنسىي ئەزا ئوقى، قان تومۇر ئۈستى بەز (pituitary)
مېتابولىزم مېدىتسىنا 21,900 دېلو (21.9%) T2DM، مېتابولىك بىمەنىلىك، لىپېد تاختىسى، يۇقىرى سۈيدۈك كىسلاتاسى (hyperuricaemia)
Hematology 15,400 دېلو (15.4%) مىكروسىتلىق ۋە ماكروسىتلىق پەرقلىگۈچلەر، B12/فولات، تۆمۈر تەتقىقاتى
جىگەر كېسەللىكلىرى 12,400 دېلو (12.4%) NAFLD/NASH، ۋىرۇسلۇق جىگەر ياللۇغى، FIB-4، ئۆت-ئېقىش توسۇلۇش (cholestasis)
ئىچكى كېسەللىكلەر (ئۆز ئىچىگە ئالغان trap كىچىك گۇرۇپپىسى) 9,000 دېلو (9.0%) ئارىلاشما كۆرۈنۈشلەر ۋە 8,723 دانە مەخسۇس «hyperdiagnosis trap» دېلوسى
يۈرەك-قان تومۇر كېسەللىكلىرى 7,500 دېلو (7.5%) ASCVD خەۋىپى، ئاتېرروگېنلىق دىسلىپېدەميا، hs-CRP
رېماتولوگىيە 6,000 دېلو (6.0%) SLE، RA، ۋاسكۇلىت، ئاپتومۇئانتىتېلا تاختىسى (EULAR/ACR ئۆلچەملىرى)
نېفرولوگىيە 4,000 دېلو (4.0%) CKD باسقۇچلاش (KDIGO)، eGFR يۈزلىنىشى، ئېلېكترولىت قالايمىقانچىلىقى

سۈنئىي دۆلەت-بەلگە تەقسىماتى — ئالدىنقى 10 بەلگە

100,000 سۈنئىي دېلو 127 دۆلەت بەلگىسىنى (ISO 3166-1 alpha-2) ئېلىپ، يەرلىك (locale) بىر تەرەپ قىلىشنى سىنايدۇ. بەلگە تەقسىملەش: ياۋروپا 57.7%، ئامېرىكىلار 25.4%، ئاسىيا-تىنچ ئوكيان 6.2%، ئاتالغان ئوتتۇرا شەرق/ئافرىقا بەلگىلىرى 3.4%، ۋە قالغان 97 قوشۇمچە بەلگىدىن تەركىب تاپقان ئۇزۇن قۇيرۇق تەخمىنەن 7.3% بىرلەشتۈرۈلگەن. دېلو سانى بويىچە ئەڭ كۆپ ئۇچرايدىغان ئون بەلگە: ئامېرىكا (10,500)، بىرازىلىيە (9,500)، ئىسپانىيە (9,000)، ئىتالىيە (8,000)، گېرمانىيە (7,800)، فرانسىيە (7,400)، پورتۇگالىيە (5,800)، Türkiye (3,400)، ئەنگلىيە (2,900) ۋە مېكسىكا (2,500). بەلگە بويىچە بىرىكمە نومۇرلار 0.9971 دىن 0.9985 گىچە. بۇ بەلگە سانلىرى يەرلىك بىر تەرەپ قىلىشنى سىناش ئۈچۈن ئىشلىتىلگەن ياسالغان دېلولارنىڭ خاسلىقى — ئۇلار ھەقىقىي ئىشلەتكۈچىلەر ئەمەس، ھەمدە ھەقىقىي دۇنيا جۇغراپىيىلىك قاپلاشنى ئەكس ئەتتۈرمەيدۇ.

ئالدىن تىزىمغا ئېلىنغان rubric نى چۈشەندۈرۈش

ئالدىن تىزىملىتىش بۇ سىناق-بەنجامدا ئەڭ مۇھىم مېتودولوگىيەلىك تاللاش. ھەر بىر مۆلچەر دىئاگنوز، ھەر بىر كلىنىكىلىق نومۇرلاش سىستېمىسى، ۋە ھەر بىر دوكلات بۆلىكى مەنبە كودقا باغلانغان ماتور چاقىرىلغانغا قەدەر. شۇڭا رۇبرىكنى ماتورنى «ياقتۇرۇپ» كېيىنچە تەڭشەش مۇمكىن ئەمەس.

بىرىكمە نومۇرنى ئۈچ تەركىب تەشكىل قىلىدۇ. قۇرۇلمىلىق تەركىب 35 پىرسەنت تۆھپە قوشىدۇ ۋە ماتورنىڭ يەتتە مەجبۇرىي دوكلات بۆلىكىنى (ماۋزۇ/بېشى، قىسقىچە خۇلاسە، مۇھىم بايقاشلار، پەرقلەندۈرۈش، نومۇرلاش سىستېمىلىرى، تەۋسىيەلەر، كېيىنكى قەدەملەر) ۋە ئۇلار ئىچىدىكى 16 مەجبۇرىي تارماق بۆلەكنى قايتۇرغان-قايتۇرمىغانلىقىنى ئۆلچەيدۇ. بۆلەك بار-يوقلۇقى قۇرۇلمىلىق ھېسابتا 40 پىرسەنت، تارماق بۆلەك بار-يوقلۇقى 60 پىرسەنت ئېغىرلىققا ئىگە.

The كلىنىكىلىق تەركىب 55 پىرسەنت تۆھپە قوشىدۇ ۋە ئۈچ نەرسىنى بىرلەشتۈرىدۇ: دىئاگنوز-ئاچقۇچلۇق سۆزنى ئەسلىگە كەلتۈرۈش (كلىنىكىلىق تارماق نومۇرنىڭ 70 پىرسەنتى)، نومۇرلاش سىستېمىسىنى ئەسلىگە كەلتۈرۈش (20 پىرسەنت — ماتور مۇناسىپ بولغاندا Mentzer، FIB-4، HOMA-IR، ASCVD خەۋىپى، KDIGO باسقۇچلىشى، EULAR/ACR ئۆلچىملىرىنى ھېسابلاپ چىقامدۇ)، ۋە ئېھتىماللىق-يىغىندىسىنىڭ توغرىلىق تەكشۈرۈشى (10 پىرسەنت — پەرقلەندۈرۈش ئېھتىماللىقلىرى [90, 110] ئارىلىقى ئىچىدە يىغىلىشى كېرەك). تۇزاق ئەھۋاللىرى ئۈچۈن، ئەنىق بولمىغان «ھەددىدىن زىيادە دىئاگنوز» جازاسى ئەڭ كۆپ 0.30 بولۇپ چېكىنىدۇ؛ ئۇ 0.10 ھەر بىر توقۇلما پاتولوگىيە بايرىقىغا توغرا كېلىدۇ، ئۈچ بايراقتىن ئېشىپ كەتمەيدۇ.

The كېچىكىش تەركىبى 10 پىرسەنت تۆھپە قوشىدۇ. جاۋاب 20 سېكۇنتتىن تۆۋەن بولسا تولۇق 0.10، 40 سېكۇنتتىن تۆۋەن بولسا 0.05، ئۇنىڭدىن ئاستا بولسا نۆل. 20 سېكۇنت نىشانى ئىشلەپچىقىرىشتىكى ئاساسىي primary-path مۇلازىمەت-دەرىجە نىشانىنى ئەكس ئەتتۈرىدۇ؛ 40 سېكۇنتلىق چەك Phase 2 نىڭ ئېغىر-ماتور چاقىرىشلىرى ئۈچۈن قالدۇرۇلغان زاپاس خامچوتنى ئەكس ئەتتۈرىدۇ.

MIT ئىجازەتنامىلىق Kantesti ئۆلچەم قورالىنىڭ ئىجرا قىلىنىپ ھەر ئەھۋالغا ئايرىم نومۇر چىقىرىۋاتقانلىقىنىڭ ئاخىرقى ئېكران كۆرۈنۈشى — ئوخشاش قورال، ھازىر SQL ئارقىلىق ھەيدەلگەن، V11 ئىككىنچى يېڭىلانمىدىكى 100,000 ئەھۋاللىق ئىجرا قىلىشتا 99.80% بىرىكمە نومۇرنى چىقارغان
3-رەسىم: ئىجرا قىلىنىۋاتقان سىناق رامكىسى — 99.80% بىرىكمە V11 ئىككىنچى يېڭىلاش 100,000-ھالەت كۇچا. ھەر بىر ھالەت A4 PDF شەكلىدە كۆرسىتىلىپ، ئىشلەپچىقىرىش v11 نۇقتىسىغا يوللىنىدۇ ۋە توڭلىتىلغان رۇبىرىك بويىچە نومۇرلىنىدۇ. ئىككىنچى يېڭىلاش پارامېتىرلىق SQL ھالەت يۈكلىگۈچ قوشتى؛ خام ماتور جاۋابلىرىدىن قەۋەتلەنگەن تاسادىپىي ئەۋرىشكە (n = 201) توپلانغان نومۇر تاختىسى بىلەن بىللە ساقلىنىدۇ.

ئالدىن تىزىملىتىشنىڭ ئالدىنى ئالىدىغانلىرى

بىرىنچى تەرەپ سىناق-بەنجاملىرى كېيىنچە رۇبرىكنى تەڭشەش ئارقىلىق ئۆز سانلىرىنى كۆپەيتىۋېتىش بىلەن داڭلىق. بۇ ئەندىزە ئاساسەن ھەمىشە ئوخشاش: گۇرۇپپا ماتورنى ئىجرا قىلىدۇ، قەيەردە ئاستا قالغانلىقىنى كۆرىدۇ، ئاندىن جىمجىتلا رۇبرىنى تەڭشەپ، ئاستا قالغان رايونلارنىڭ نومۇرغا بولغان تەسىرىنى ئازايتىدۇ. رۇبرىنى تۇنجى ماتور چاقىرىشتىن بۇرۇن مەنبە كودقا باغلاپ، سىناق-ئۈسكۈنىسىنى MIT ئىجازەتنامىسى بىلەن ئېلان قىلىش ئارقىلىق، بۇ تەڭشەش نەشر-كونترولدا كۆرۈنۈپ قالىدۇ. ھەر كىم رېپوزىتورىيەنى كلون قىلىپ، رۇبرىك يازغان ۋاقتىنى تەكشۈرۈپ، ماتور نەتىجىلىرىنىڭ نومۇرنى شەكىللەندۈرۈشكە ئىشلىتىلمىگەنلىكىنى دەلىللەپ بېرەلەيدۇ.

ھەددىدىن زىيادە دىئاگنوز قويۇش (Hyperdiagnosis) تۇزاق ئەھۋاللىرى — نېمە ئۈچۈن «ئارتۇق چاقىرىش» ئەمەلىي مەغلۇبىيەت شەكلى

نورمال ئېكرانلاردا پاتولوگىيەنى ھەددىدىن زىيادە دەۋا قىلىش ئىستېمالچىلارغا قارىتىلغان داۋالاش ياردەمچىسىدە خاتىرىلەنگەن مەغلۇبىيەت شەكلى. ئۇنىڭ كېيىنكى خىراجەتلىرى زۆرۈر بولمىغان تەكشۈرۈش، بىمارنىڭ ئەندىشىسى ۋە ئىنسانغا زىيانلىق (iatrogenic) تەكشۈرۈش-تەييارلىقنى ئۆز ئىچىگە ئالىدۇ. بۇ سىناق-بەنجامدىكى ئىككى تۇزاق ئەھۋالى بۇ مەغلۇبىيەت شەكلىنى كۆرۈنەرلىك ۋە نومۇرلىغىلى بولىدىغان قىلىپ لايىھەلەنگەن.

بىر-بىرلەپ سېلىشتۇرۇش: گىلبېرت كېسەللىكى تاختىسىدا بىپەرۋا AI نىڭ جىگەر ياللۇغى (hepatitis) ياساپ چىقىرىشىغا قارشى، Kantesti ماتورىنىڭ زىيانسىز UGT1A1 پولىمورفىزمىنى توغرا تونۇشى — بۇ ئۇسۇل V11 ئىككىنچى يېڭىلانما 99.80% ئۆلچىمىدىكى 87,412 دانە trap-flag پۇرسىتىدە نۆل يالغان-مۇسبەت بىلەن كېڭەيتىلگەن
4-رەسىم: V11 دەسلەپكى تارقىتىلىشىدىكى «trap-case» لايىھەسى — گىلبېرت كېسەللىكىنى ئىشەنچ بىلەن جىگەر ياللۇغى دەپ بەلگىلەيدىغان ياكى پۈتۈنلەي نورمال ئېكراندا چېگرادىن ئازراق پاتولوگىيە ياساپ بېرىدىغان ماتور، «كلىنىكىي ئاڭلىتىش» ئۈچۈن مۇكاپاتلىنىشنىڭ ئورنىغا جازالىنىدۇ. بۇ ئۇسۇل 99.80% بىرىكمە نومۇرنى ھاسىل قىلغان V11 ئىككىنچى يېڭىلاش 100,000-ھالەت يۈرۈشىدە 0 / 87,412 يالغان-مۇسبەتلەرگە كېڭەيتىلدى.

🟡 تۇزاق 1 — BT-014-GILBERT

كۆرۈنۈش. ئومۇمىي بىليروبىن 2.4 mg/dL بولغان 24 ياشلىق ئەر. بىۋاسىتە بۆلەك نورمال. ترانسئامىناز ۋە ئىشقارلىق فوسفاتا زاھىرى ئۆز پايدىلىنىش دائىرىسى ئىچىدە تۇرىدۇ، رېتىكۇلوئسىتلار نورمالسىز ئەمەس، ھەمدە haptoglobin ۋە LDH ھەمولىزنى رەت قىلىدۇ.

توغرا تەبىر. گىلبېرت كېسىلى — پايدىسىز UGT1A1 پولىمورفىزم. تەبىر جىگەر ياللۇغى، سىروزلار، ھەمولىزلىق ئانېمىيە ياكى ئۆت يولى توسۇلۇشىنى چاقىرىپ چىقماسلىقى كېرەك.

V11 نەتىجىسى. بىرىكمە 1.000. ئالتە نازارەت قىلىنغان ھەددىدىن زىيادە دىئاگنوز بايرىقىنىڭ ھېچقايسىسى ئاكتىپ دىئاگنوز سۈپىتىدە كۆرۈنمىدى.

🟡 تۇزاق 2 — BT-015-HEALTHY

كۆرۈنۈش. 15 پارامېتىرلىق ئادەتتىكى تەكشۈرۈش تاختىسى بار 35 ياشلىق ئايال. ھەر بىر ئانالىت ئۆز پايدىلىنىش دائىرىسى ئىچىدە راھەت تۇرىدۇ.

توغرا تەبىر. خاتىرجەم قىلىش ۋە تۇرمۇش ئۇسۇلىنى ساقلاش. چۈشەندۈرۈش كىلىنىكىلىق جەھەتتىن پايدىلىق كۆرۈنۈش ئۈچۈن چېگرادىن ھالقىغان كېسەللىك ئالامەتلىرىنى «توقۇپ چىقارماسلىقى» كېرەك.

V11 نەتىجىسى. بىرىكمە 1.000. نازارەت قىلىنغان يەتتە قېتىملىق ھەددىدىن ئارتۇق دىئاگنوز قويۇش ئاگاھلاندۇرۇش بەلگىسى — دىئابېت، ئانېمىيە، قالقانسىمان بەز تۆۋەن ئىقتىدارى، دىسلېپيدېمىيە، جىگەر ياللۇغى، بۆرەك كېسەللىكى، يېتىشمەسلىك — ھېچقايسىسى ئاكتىپ دىئاگنوز سۈپىتىدە كۆرۈنمىدى.

ئىككى قاپقاقنىڭ ھەممىسىدە، ئون ئۈچ نازارەت قىلىنغان ھەددىدىن ئارتۇق دىئاگنوز قويۇش بەلگىسى تەكشۈرۈلدى. ھېچقايسىسى قوزغىتىلمىدى. بۇ — ھەر قانداق كىلىنىكىلىق خادىمنىڭ AI ماتورىنى تىترەش (triage) ياكى ئالدىن مەسلىھەت قورالى سۈپىتىدە ئىشلىتىشنى ئويلاۋاتقاندا ئەڭ مۇھىم بولغان نەتىجە: سىستېما كېسەللىك يوق جايدا كېسەللىك كەشىپ قىلمىدى.

Mentzer كۆرسەتكۈچى: تۆمۈر يېتىشمەسلىكىنى تالاسسېمىيە خاسلىقىدىن ئايرىش

ئىككىنچى قىممەتلىك بايقاش BT-001 (تۆمۈر يېتىشمەسلىك ئانېمىيەسى) نىڭ BT-007 (كىچىك تىپتىكى β-تالاسسېمىيە) بىلەن بىر جۈپ قىلىنىشىغا مۇناسىۋەتلىك. ھەر ئىككىسى مىكروسىتوز بىلەن كېلىدۇ ۋە نائىۋ (تەجرىبىسى ئاز) تۈرگە ئايرىغۇچلار ئۈچۈن كۆپ ئۇچرايدىغان توسالغۇ. Mentzer كۆرسەتكۈچى، MCV نى RBC سانىغا بۆلۈش ئارقىلىق ھېسابلىنىدۇ: تۆمۈر يېتىشمەسلىكتە 13 دىن يۇقىرى، تالاسسېمىيە خاسلىقىدا 13 دىن تۆۋەن بولىدۇ.

BT-001 دە، بىمار 34 ياشلىق ئايال بولۇپ، ھېموگلوبىن 10.4 g/dL، MCV 72.4 fL، RBC 4.1 × 10¹²/L، فېررىتىن 6 ng/mL، ۋە TIBC نىڭ يۇقىرى بولۇشى كۆرۈلگەن. تەخمىنەن 17.7 بولغان Mentzer كۆرسەتكۈچى مۇتلەق تۆمۈر يېتىشمەسلىكىنى قوللايدۇ. BT-007 دە، بىمار 28 ياشلىق ئەر بولۇپ، مىكروسىتوز (MCV 65.8 fL) بار، ئەمما RBC سانى 6.2 يۇقىرى، RDW نورمال، فېررىتىن نورمال، ۋە HbA2 5.6 پىرسەنت. تەخمىنەن 10.6 بولغان Mentzer كۆرسەتكۈچى تالاسسېمىيە خاسلىقىنى كۆرسىتىدۇ، ھەمدە يۇقىرى HbA2 كىچىك تىپتىكى β-تالاسسېمىيەنى دەلىللەيدۇ.

تۆمۈر يېتىشمەسلىك ئانېمىيەسى Mentzer > 13 فېررىتىن تۆۋەن، TSAT تۆۋەن، TIBC يۇقىرى، RDW يۇقىرى
تالاسسېمىيە خاسلىقى (Beta-thalassaemia trait) Mentzer < 13 فېررىتىن نورمال، RDW نورمال، HbA2 يۇقىرى (>3.5%)، RBC سانى يۇقىرى

ئىككى ئەھۋالنىڭ ھەر ئىككىسى 1.000 نومۇر ئالدى. ماتور ھەر ئىككى چۈشەندۈرۈشتە Mentzer كۆرسەتكۈچىنى ئوچۇق-ئاشكارا ئىشلىتىپ، ھەر قېتىمدا توغرا دىئاگنوزنى قايتۇردى. بۇ پۈتۈن benchmark ئىچىدىكى ئەڭ كىلىنىكىلىق جەھەتتىن خاتىرجەم قىلىدىغان يەككە نەتىجە, ، چۈنكى تالاسسېمىيە خاسلىقىنى تۆمۈر يېتىشمەسلىكى دەپ خاتا تۈرگە ئايرىش نامۇۋاپىق تۆمۈر تولۇقلاشنى كەلتۈرۈپ چىقىرىدۇ ۋە ئائىلە-تەكشۈرۈش پۇرسەتلىرىنى قولدىن بېرىدۇ؛ تۆمۈر يېتىشمەسلىكىنى تالاسسېمىيە دەپ خاتا تۈرگە ئايرىش بولسا ئاددىي ئالماشتۇرۇش داۋالاشنى كېچىكتۈرىدۇ. بىز فېررىتىن دائىرىسى يېتەكچىسى تېخىمۇ كەڭ دىففېرېنسىيال (پەرقلىق) كونتېكىستنى چۈشەندۈرىمىز.

V11 دەسلەپكى پايدىلىنىش يۈرۈشىدىن ھالەت بويىچە نەتىجىلەر (2026-يىل 23-ئاپرېل)

15-ھالەتلىك ئىسپات-ئۇقۇم كۇچىسىدىكى ئەسلى V11 پايدىلىنىش يۈرۈشى ئىككىنچى يېڭىلاشنىڭ ئۇسۇل-ئاساسى: تۆۋەندىكى ھەر بىر ھالەت تەپسىلاتى رۇبىرىكنىڭ ھەقىقىي ماتور جاۋابىنى قانداق بىر تەرەپ قىلىدىغانلىقىنى كۆرسىتىپ بېرىدۇ. ئون بەش ھالەتنىڭ ئون ئىككىسى ئاساسىي يولدا ئەڭ يۇقىرى بىرىكمە نومۇر 1.000 كە يەتتى؛ ئۈچ ھالەت 2-فازا «fallback» ئارقىلىق مۇلازىمەت قىلىنىپ، 0.05 كېچىكىش مۇكاپاتىنى يوقاتتى، ئەمما بارلىق كلىنىكىي ۋە قۇرۇلمىلىق مەزمۇنلارنى ساقلاپ قالدى. بىر ھالەتتە بىرلا مەجبۇرىي تارماق بۆلەك يوق ئىدى؛ يەنە بىرىدە ئېھتىماللىق تەقسىماتىنىڭ يىراقراق تۆۋەنلىگەن يىغىندىسى قايتۇرۇلدى. of the Second Update: every per-case detail below illustrates how the rubric handles a real engine response. Twelve of fifteen cases achieved the ceiling composite score of 1.000 on the primary path; three cases were served via the Phase 2 fallback, losing the 0.05 latency bonus while preserving all clinical and structural content. One case was missing a single mandatory subsection; one returned a marginally reduced probability distribution sum.

ئەھۋال كىملىكى (Case ID) كەسپ (Specialty) بىرىكمە كېچىكىش (Latency) يول (Path)
BT-001-IDAHematology1.00017.8 sئاساسىي (primary)
BT-006-B12Hematology1.00018.4 سېكۇنتئاساسىي (primary)
BT-007-THALHematology1.00017.0 سېكۇنتئاساسىي (primary)
BT-002-HASHئىچكى ئاجراتما0.95037.0 سېكۇنتزاپاس ھالەت
BT-008-PCOSئىچكى ئاجراتما0.98718.6 سېكۇنتئاساسىي (primary)
BT-003-T2DMMetabolic1.00019.1 سېكۇنتئاساسىي (primary)
BT-013-GOUTMetabolic1.00019.4 سېكۇنتئاساسىي (primary)
BT-004-NAFLDجىگەر كېسەللىكلىرى1.00019.6 سېكۇنتئاساسىي (primary)
BT-009-VIRHEPجىگەر كېسەللىكلىرى0.95023.4 سېكۇنتزاپاس ھالەت
BT-014-GILBERTتۇتقۇچ1.00018.9 سېكۇنتئاساسىي (primary)
BT-005-CKDنېفرولوگىيە1.00017.4 سېكۇنتئاساسىي (primary)
BT-010-ASCVDيۈرەك-قان تومۇر كېسەللىكلىرى1.00019.7 سېكۇنتئاساسىي (primary)
BT-011-SLEرېماتولوگىيە0.98118.2 sئاساسىي (primary)
BT-012-VITDئىچكى ئاجراتما1.00019.3 sئاساسىي (primary)
BT-015-HEALTHYتۇتقۇچ1.00018.7 sزاپاس ھالەت

PCOS دېلوسى (BT-008) جاۋاب قۇرۇلمىسىدىكى بىر مەجبۇرىي تارماق بۆلەكنى يوقىتىپ قويدى — 16 نىڭ ئىچىدىن 15ى، 16 نىڭ ئىچىدىن 16ى ئەمەس — بۇ قۇرۇلمىلىق نومۇرنى 1.000 دىن 0.963 كە چۈشۈردى. SLE دېلوسى (BT-011) سەل تۆۋەنلىگەن ئېھتىماللىق-تەقسىملەش يىغىندىسىنى قايتۇردى؛ بۇ نومۇرنى 0.965 كە چۈشۈردى، ئەمما ھەر بىر دىئاگنوز ئاچقۇچلۇق سۆز ۋە نومۇرلاش سىستېمىسىنى ساقلاپ قالدى. ھېچقانداق بىرىدىن-كەم دېلوسى توغرا دىئاگنوزنى قولدىن بەرمىدى.

V11 ئىككىنچى يېڭىلاش توپلىمى — 100,000 ھالەت

نوپۇس كۆلىمىدە، ئايرىم دېلو قۇرلىرى ئادەمگە ئوقۇغىلى بولمايدۇ، شۇڭا ئىككىنچى يېڭىلانما 100,000 قۇرلۇق جەدۋەلنىڭ ئورنىغا توپلانغان كۆرسەتكۈچلەرنى دوكلات قىلىدۇ. ئاساسىي توپلاما تۆۋەندە كۆرسىتىلگەن؛ كەسپ بويىچە ۋە دۆلەت-بەلگە بويىچە پارچىلاش تېخنىكىلىق دوكلاتتا ۋە Figshare يوللانمىسىدا ئېلان قىلىنغان. قەۋەتلىك تاسادىپىي ئەۋرىشكە ئېلىنغان بىر n = 201 خام ماتور جاۋابلىرى (deterministic seed 20260426) تەكشۈرۈش ئۈچۈن GitHub results/ مۇندەرىجىسىگە ئېلان قىلىنىدۇ.

بىرىكمە نومۇر V11 دەسلەپكى: 0.9912 (99.12%) → ئىككىنچى يېڭىلاش: 0.9980 (99.80%) Δ = +0.0068 100,000-ھالەت كۇچىسى بويىچە
قۇرۇلمىلىق نومۇر (ئوتتۇرىچە) V11 دەسلەپكى: 0.998 → ئىككىنچى يېڭىلاش: 1.000 نوپۇس كۆلىمىدە مۇكەممەل قۇرۇلمىلىق ماسلىشىش
كلىنىكىي نومۇر (ئوتتۇرىچە) V11 دەسلەپكى: 0.998 → ئىككىنچى يېڭىلاش: 0.996 −0.002؛ ھېچقانداق ھالەت دىئاگنوزنىڭ ئۆزىنى قولدىن بەرمىدى
كېچىكىش — ئوتتۇرىچە (ئارىلىق) V11 دەسلەپكى: 20.17 س (17.0–37.0 س) → ئىككىنچى يېڭىلاش: 13.26 س (9.0–16.94 س) يۈرۈش ئارىلىقىدىكى ئىشلەپچىقىرىش ماتورى ئەلالاشتۇرۇشلىرى
ماتور يولى = ئاساسىي V11 دەسلەپكى: 12 / 15 → ئىككىنچى يېڭىلاش: 100,000 / 100,000 يۈرۈش جەريانىدا ھېچقانداق ۋاقىتتا 2-باسقۇچقا قايتىپ كېلىش (fallback) لازىم بولمىدى
Trap-subset دەرىجىدىن تاشقىرى دىئاگنوز بايراقلىرى V11 دەسلەپكى: 0 / 13 → ئىككىنچى يېڭىلاش: 0 / 87,412 نوپۇس كۆلىمىدە نۆل خاتا-ئىجابىيلىق (8,723 trap ئەھۋالى نازارەت قىلىندى)

باش تېما نومۇرى بىزگە نېمىلەرنى ئېيتىپ بېرەلمەيدۇ

بۇ ئالدىن تىزىمغا ئېلىنغان رۇبىرىكە بويىچە 99.80 پىرسەنتلىك بىرىكمە نومۇر، 127 دۆلەت بەلگىسىنى ئۆز ئىچىگە ئالغان 100,000 دېلولىق بىرىكمە كوھورتتا، دېگۈدەك چوققا ئىقتىدارغا يېقىن — ئەمما ئۇنى ئەستايىدىل رامكىغا سېلىش كېرەك. نەتىجە V11 دا بىز مەنبە كودىغا ۋەدە قىلغان رۇبىرىكەگە قارىتا ماتورنىڭ ھەرىكىتىنى تەسۋىرلەيدۇ؛ ئۇ دۇنيادىكى ھەر بىر قان تەكشۈرۈش پەنلىدە ماتورنىڭ توغرىلىقى ھەققىدە ئومۇمىي، ئۇنىۋېرسال تەشەببۇس ئەمەس.

نومۇر ماتورنىڭ بۇ باھالاش ئۈچۈن تاللانغان دىئاگنوز ئەندىزىلىرىنى نوپۇس كۆلىمىدىكى توپلامدا توغرا بىر تەرەپ قىلغانلىقىنى دەيدۇ، نەتىجە ئېلان قىلىنغان ۋە قايتا ئىشلەپ چىقىرىشقا بولىدىغان ئۇسۇلنامە بويىچە. ئۇ ماتورنىڭ دۇنيادا بار بولغان ھەر بىر قان تەكشۈرۈش تاختىسىدا توغرا ئىكەنلىكىنى دېمەيدۇ. ئۇ ماتورنىڭ دوختۇرنىڭ قارارىنى ئالماشتۇرۇشى كېرەكلىكىنى دېمەيدۇ. شۇنداقلا ئۇ ماتورنىڭ باشقا AI سىستېمىلىرىدىن ئۈستۈن ئىكەنلىكىنى دېمەيدۇ — باشقا ماتورلار بىلەن سېلىشتۇرما تەھلىللەر بۇ دوكلاتنىڭ دائىرىسىگە قەستەن كىرگۈزۈلمىگەن.

نومۇرنىڭ ئىسپاتلايدىغىنى بولسا بىر ئاساسىي دەرىجە (baseline). ئۆلچەم ۋە سىناق رامكىسى (harness) ئاشكارىلانغاندىن كېيىن، ماتورنىڭ كەلگۈسى نۇسخىلىرىنى ئوخشاش ئۆلچەمگە قارىتىپ باھالاشقا بولىدۇ — V11 دەسلەپكى 15 ئەھۋالغا، ئىككىنچى يېڭىلاش 100,000 ئەھۋاللىق توپلامغا ياكى كېيىنكى كېڭەيتىشلەرگە قوللىنىپ — ئېلان قىلىنغان نومۇر بىلەن كېيىنكى ھەر قېتىملىق يۈرۈش ئارىسىدىكى پەرقنىڭ ئۆزىلا ئۆلچەشكە بولىدۇ. مانا بۇ ئالدىن تىزىمغا ئېلىشنىڭ قىممىتى: ئىقتىدار تەلىپىنى سىناپ بولىدىغان تەلىپلەرگە ئايلاندۇرىدۇ.

بۇ ئۆلچەمنى 10 مىنۇتتا قانداق قايتا ئىشلەپ چىقىش

قايتا ئىشلەش ئۈچۈن پەقەت Kantesti API ئىسپاتنامە جۈپى ۋە Python 3.10 ياكى ئۇنىڭدىن كېيىنكى مۇھىت لازىم، شۇنىڭ بىلەن requests ۋە reportlab كۇتۇپخانىلىرى ئورنىتىلغان بولۇشى كېرەك. تولۇق سىناق رامكىسى MIT ئىجازەتنامىسى ئاستىدا تارقىتىلغان بىرلا ئۆز ئىچىگە ئالغان Python مودۇلى.

V11 ئىككىنچى يېڭىلانما بېنچماركىنى كۆرسىتىدىغان تەكرارلىنىش تورى دىئاگراممىسى (99.80% بىرىكمە، 100,000 دېلو، 127 دۆلەت بەلگىسى) Figshare، ResearchGate، Academia.edu ۋە GitHub ئارىسىدا ئەينەك قىلىنغان؛ Figshare DOI بولسا ئاساسىي (canonical) لەڭگەر سۈپىتىدە ئىشلىتىلگەن
5-رەسىم: V11 ئىككىنچى يېڭىلاش ئۆلچەملىك سىناق (benchmark) — 127 دۆلەت بەلگىسى ئارىسىدا 100,000 دېلودا 99.80% بىرىكمە نومۇر — تۆت تەتقىقات سۇپىسىدا ئەينەك قىلىنغان. Figshare DOI بولسا ئاساسىي (canonical) ئىلمىي پەخىرلىگۈچى بەلگىلىگۈچى؛ ResearchGate (publication 404175463)، Academia.edu (paper 165956808) ۋە GitHub بېنچمارك سۇپىسى، قەۋەتلىك تاسادىپىي ئەۋرىشكە قىلىنغان خام جاۋابلار، شۇنداقلا دۆلەت-بەلگە/كەسپ بويىچە نومۇر كارتىلىرى بىلەن بىللە پاراللېل نۇسخىلارنى ساقلايدۇ.

يېڭى قېتىملىق ئىجرا ئۈچۈن تۆت قەدەم

بىرىنچى. رېپوزىتورىيەنى كلون قىلىڭ: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. ئىككىنچى. تەلەپ قىلىنغان باغلىنىشلارنى تۆۋەندىكىدەك ئورنىتىڭ pip install -r requirements.txt (ئىككىنچى يېڭىلاش قوشىدۇ mysql-connector-python ≥ 8.0 SQL case loader ئۈچۈن). ئۈچ. تەڭشەڭ KANTESTI_USERNAME ۋە KANTESTI_PASSWORD ماتور API ئۈچۈن مۇھىت ئۆزگەرگۈچىسى (environment variables) سۈپىتىدە. ئىككىنچى يېڭىلاش SQL case loader ئۈچۈن يەنە تەڭشەڭ: KANTESTI_DB_HOST, KANTESTI_DB_PORT, KANTESTI_DB_NAME, KANTESTI_DB_USER, and KANTESTI_DB_PASSWORD — يۈكلىگۈچى پەقەت ئوقۇشقا بولىدىغان رول ئارقىلىق ئۇلىنىدۇ (bench_reader) بۇنىڭدا جەدۋەلنى پەرق ئېتىپ تونۇشتۇرۇش ھوقۇقى يوق. تۆت. ئىجرا قىلىڭ python benchmark_bloodtest.py --limit 100000 پۈتۈن Second-Update نى ئىجرا قىلىش ئۈچۈن، ياكى python benchmark_bloodtest.py --limit 1000 تېز تەكرارلاش ئۈچۈن. چىقىرىلغان نەتىجىلەر ./benchmark_results/: دۆلەت-بەلگە ۋە كەسپ بويىچە ئىستونلىرى بار CSV نومۇر كارتىسى، بىر JSON توپلاما، قەۋەتلىك-تاسادىپىي خام جاۋاب ئەۋرىشكىسى ۋە بىر Markdown دوكلاتى.

23-ئاپرېل 2026-يىل (V11 دەسلەپكى، 15 ئەھۋال) ۋە 26-ئاپرېل 2026-يىل (V11 Second Update، 100,000 ئەھۋال) دىن كەلگەن پايدىلىنىش قېتىملىرى رېپوزىتورىيەنىڭ results/ مۇندەرىجىسىدە ساقلانغان. يېڭى قېتىم ئىجرا قىلىش پايدىلىنىش قېتىملىرىنى ئۆزگەرتمەستىن، يېڭى ۋاقىت-تامغىسى بار نومۇر جەدۋىلى ھاسىل قىلىدۇ. ئەگەر ئىجرا قىلىشىڭىز مەنىلىك دەرىجىدە ئوخشىمايدىغان نەتىجە بەرسە، ئىجرا قىلىش ۋاقتى-تامغىسى ۋە جاۋاب مېتا-سانلىقلىرىدا قايتۇرۇلغان ماتور نەشرىنى ئىشلىتىپ GitHub issue ئېچىڭ.

چەكلىمىلەر ۋە كەلگۈسى خىزمەتلەر

127 دۆلەت بەلگىسى بويىچە 100,000 دېلو بولسىمۇ، تۆت چەكلىمەنى ئوچۇق ئېتىراپ قىلىش كېرەك: ئۇزۇن قۇيرۇق بەلگىلەرنىڭ يېتەرلىك ئەۋرىشكىسىزلىكى، بىر قېتىملىق باھالاش، بىرلا ماتور دائىرىسى، ۋە بىرلا مەنبە سانلىق مەلۇمات مەنبەسى. بۇلارنىڭ ھەممىسى داۋاملىق قوغلىشىش خىزمىتىدە ھەل قىلىنىۋاتىدۇ.

ئۇزۇن قۇيرۇق بەلگە قاپلاش. ئىككىنچى يېڭىلانما 127 دۆلەت بەلگىسىنى ئۆز ئىچىگە ئالىدۇ، ئەمما تەقسىمات تەڭپۇڭ ئەمەس — ئالدىنقى 10 بەلگە دېلولارنىڭ ≈66.4% نى ئىگىلەيدۇ، قالغان 97 قوشۇمچە بەلگى بىرلىكتە ≈7.3% (تەخمىنەن 7,300 دېلو بىرلەشتۈرۈلگەن، ھەر بەلگەگە ئوتتۇرا ھېسابتا ~75 دېلو) تۆھپە قوشىدۇ. شۇڭا بۇ ئۇزۇن قۇيرۇقتىكى بەلگە بويىچە بىرىكمىلەر ئاساسىي ماۋزۇدىكى سانلارغا قارىغاندا تېخىمۇ شاۋقۇنلۇق. كەلگۈسى قېتىملىق ئىجرا قىلىشلار بەلگە تەقسىملەشنى قايتا تەڭپۇڭلاشتۇرۇپ، بەلگە بويىچە مۆلچەرلەرنى مۇستەھكەملەيدۇ.

بىر قېتىملىق باھالاش. بۇ توپلامدىكى ھەر بىر ئەھۋال پەقەت بىر قېتىم باھالاندى. چوڭ تىل مودېللىرى تۆۋەن ئەۋرىشكە تېمپېراتۇرىسىدىمۇ كۆرۈنەرلىك چىقىرىش تەۋرىنىشىنى كۆرسىتىدۇ، شۇڭا ھەر بىر ئەھۋالغا بەش قېتىم باھالاش ۋە دوكلات قىلىنغان تەۋرىنىش بىلەن كۆپ قېتىملىق باھالاش كېلىشىمى تەبىئىي كېيىنكى قەدەم — بولۇپمۇ «trap-case» قىسمىدا، ئەۋرىشكە جىتلەششىدە ئىزچىللىق بىخەتەرلىك تەلىپىنىڭ بىر قىسمى بولغاچقا.

بىرلا ماتور دائىرىسى. بۇ دوكلات بىرلا ماتورنى خاراكتېرلەندۈرىدۇ. باشقا AI سىستېمىلىرى بىلەن سېلىشتۇرما تەھلىللەر بۇ يەردە دائىرىدىن سىرت؛ بىز ئۇلارنى ئوخشاش MIT ئىجازەتلىك harness نى ئىشلىتىپ، مۇۋاپىق ئۇسۇل بىلەن ئايرىم مۇستەقىل تەتقىقات سۈپىتىدە قوغلىشىشىمىز مۇمكىن.

بىرىكمە سانلىق مەلۇمات. 100,000 دېلو بىرىكمە ياسالغان بولۇپ، بىرىكمە دېلولار ئەمەس؛ نەتىجىلەر ھەقىقىي دۇنيا كلىنىكىلىق ئىقتىدارىغا يۆتكىلىپ كەلمەيدۇ. ھەقىقىي، ئىجازەت بېرىلگەن، تاشقى مەنبەدىن كەلگەن سانلىق مەلۇمات ئۈستىدە باھالاش ئۈچۈن مۇۋاپىق ئەخلاقىي نازارەت تەلەپ قىلىنىدۇ ۋە بۇ بىرىكمە بۇلۇت سىنىقىنىڭ دائىرىسىگە كىرمەيدۇ.

بۇ تۆت چەكلىمىدىن باشقا، پىلانلانغان ئەڭ تەسىرلىك كېڭەيتىش دۆلەت/قەيەر بويىچە كۆپ تىل تەڭباراۋەرلىكى. Kantesti AI Engine 75+ تىلدىكى ئىشلەتكۈچىلەرگە مۇلازىمەت قىلىدۇ، ھەمدە تىل-قەۋەتلەنگەن Second-Update كىچىك توپلىرىنى (تۈركچە، گېرمانچە، ئىسپانچە، فىرانسۇزچە، ئىتالىيەچە، پورتۇگالچە، ئەرەبچە، ماندرىنچە) ئىجرا قىلىش ئارقىلىق ماتورنىڭ قوللايدىغان تىللىرى بويىچە چىقىرىش سۈپىتىنى سانلىق جەھەتتىن ئۆلچەيدۇ. ھەر بىر تىل-قەۋەتلەنگەن تەھلىل ئۆزىنىڭ DOI ۋە harness شۆبىسى بىلەن ئېلان قىلىنىدۇ.