මට අමු සම්මත දත්ත (raw benchmark data) සහ මූලාශ්ර කේතය (source code) කොහෙන් සොයාගත හැකිද?

තාක්ෂණික වාර්තාව DOI 10.6084/m9.figshare.32095435 යටතේ Figshare හි තැන්පත් කර ඇති අතර, ResearchGate සහ Academia.edu හිද එය ප්රතිබිම්බනය කර ඇත. සියලුම යොමු (reference) ධාවන ප්රතිඵල සහිත MIT බලපත්රලාභී harness එක github.com/emirhanai/kantesti-blood-test-benchmark හි ලබා ගත හැක.

සායනික වලංගුකරණය පෙර-ලියාපදිංචි කළ සම්මත මිනුම් (Benchmark) V11 — 2026 අප්‍රේල් MIT බලපත්‍රය සහිත (MIT-Licensed) සමාන පාර්ශ්වයන්ට සත්‍යාපනය කළ හැකි (Peer-Verifiable)

Kantesti AI එන්ජිම — රුධිර පරීක්ෂණ බෙන්ච්මාර්කය: වෛද්‍ය විශේෂතා හතක් හරහා සායනික සත්‍යාපනය

Kantesti AI එන්ජිමයේ අනන්‍ය නොකළ රුධිර පරීක්ෂණ නඩු (blood test cases) මත සිදු කළ ස්වාධීන, පෙර-ලියාපදිංචි කළ සායනික ඇගයීමක්. පළමු එන්ජිම ඇමතුමට පෙර මූලාශ්‍ර කේතයේ (source code) සම්මත ලේඛනය (rubric) ස්ථිර කර තිබූ අතර, ඇගයීම් පරිසරය MIT බලපත්‍රය සහිත වන අතර, සෑම මුල් ප්‍රතිචාරයක්ම ප්‍රකාශයට පත් කර ඇත.

📖 ~විනාඩි 14ක් 📅 2026 අප්‍රේල් 23 🔗 DOI: 10.6084/m9.figshare.32095435

📝 ප්‍රකාශිත: 2026 අප්‍රේල් 23 🩺 වෛද්‍යමය වශයෙන් සමාලෝචනය කළේ: 2026 අප්‍රේල් 23 ✅ පෙර-ලියාපදිංචි කළ Rubric 🔓 විවෘත කේතය සහ දත්ත

මෙම සායනික වලංගුකරණ අධ්‍යයනය මෙහෙයවූයේ වෛද්‍ය තෝමස් ක්ලයින්, MD, Kantesti AI හි ප්‍රධාන වෛද්‍ය නිලධාරියා (Chief Medical Officer) ලෙස, සහ සහයෝගයෙන් ජූලියන් එමිර්හාන් බුලුට්, Kantesti Ltd හි ජ්‍යෙෂ්ඨ AI ඉංජිනේරුවරයා සහ ප්‍රධාන විධායක නිලධාරියා (CEO) ලෙස. ක්‍රමවේදය සහ rubric සමාලෝචනය කළේ කන්ටෙස්ටි AI වෛද්‍ය උපදේශක මණ්ඩලය.

ප්‍රධාන කර්තෘ සහ සායනික අධීක්ෂණය

තෝමස් ක්ලයින්, MD

ප්‍රධාන වෛද්‍ය නිලධාරී, කන්ටෙස්ටි ඒඅයි

ආචාර්ය තෝමස් ක්ලයින් (Dr. Thomas Klein) යනු පුවරු සහතික ලත් සායනික රුධිර විද්‍යාඥයෙකු (board-certified clinical hematologist) සහ අභ්‍යන්තර වෛද්‍ය විශේෂඥයෙකු (internist) වන අතර, රසායනාගාර වෛද්‍ය විද්‍යාව (laboratory medicine) ක්ෂේත්‍රයේ වසර 15කට වැඩි පළපුරුද්දක් ඇත. Kantesti AI හි ප්‍රධාන වෛද්‍ය නිලධාරියා ලෙස, මෙම සම්මත මිනුම් (benchmark) සඳහා නඩු පැනලය තෝරාගත් අතර, සියලුම රෝග නිර්ණාත්මක සත්‍යතාවයන් (diagnostic ground truths) සමාලෝචනය කර, පළමු එන්ජිම ඇමතුමට පෙර පෙර-ලියාපදිංචි කළ rubric අනුමත කළේය.

ORCID 0009-0009-1490-1321 පර්යේෂණ ද්වාරය ගූගල් ස්කොලර්

සහකර්තෘ & ක්‍රියාත්මක කිරීම

ජූලියන් එමිර්හාන් බුලුට්

ජ්‍යෙෂ්ඨ AI ඉංජිනේරුවරයා සහ CEO, Kantesti Ltd

ජූලියන් එමිරහන් බුලුට් (Julian Emirhan Bulut) යනු Kantesti Ltd හි ආරම්භකයා (founder) සහ ප්‍රධාන විධායක නිලධාරියා (CEO) වේ. ඔහු ඇගයීම් පරිසරය (evaluation harness) නිර්මාණය කර ක්‍රියාත්මක කළ අතර, API ඒකාබද්ධ කිරීම (integration) සිදු කළේය, 2026 අප්‍රේල් benchmark ධාවනය (run) සිදු කළේය, සහ සංඛ්‍යානමය එකතුව (statistical aggregation) සකස් කළේය. 2019 සිට වේදිකාවේ ආරම්භකයා.

GitHub කන්ටෙස්ටි ගැන

⚡ ඉක්මන් සාරාංශය V11 — 2026 අප්‍රේල් 23

99.12% සංයුක්ත ලකුණු වෛද්‍ය විශේෂතා හතක් තුළ, නිර්නාමික සැබෑ රෝගීන්ගේ රුධිර පරීක්ෂණ නඩු 15ක් මත.
අධි-රෝග නිර්ණය (hyperdiagnosis) සම්බන්ධ වැරදි ධනාත්මක ප්‍රතිඵල ශුන්‍යය කූට නඩු දෙකෙහිම (Gilbert's syndrome සහ සම්පූර්ණයෙන්ම සාමාන්‍ය වැඩිහිටි පරීක්ෂණයක්).
පෙර-ලියාපදිංචි කළ rubric පළමු එන්ජින් ඇමතුමට පෙර මූලාශ්‍ර කේතයේම සවි කර ඇත — පසුව (post-hoc) සුසර කිරීම කළ නොහැකි විය.
Mentzer දර්ශකය නිවැරදිව යොදාගත්තා යකඩ ඌනතා රක්තහීනතාවය (iron deficiency anaemia) බීටා-තැලසීමියා සුළු (beta-thalassaemia minor) වලින් වෙන් කිරීමට.
නිෂ්පාදන අවසාන ලක්ෂ්‍යය පමණි — වරප්‍රසාදිත මාර්ගගත කිරීමක් (privileged routing) නැත; ගෙවන පාරිභෝගිකයෙකුට ප්‍රවේශ විය හැකි ආකාරයටම නිවැරදිව ඇගයූවා.
සාමාන්‍ය ප්‍රමාදය තත්පර 20.17ක් අවසානය දක්වා (end-to-end), නඩු 15න් 12ක් ප්‍රධාන මාර්ග ඉලක්කය තත්පර 20ට අඩු/තුළ.
MIT බලපත්‍ර සහිත harness GitHub හි සෑම අමු එන්ජින් ප්‍රතිචාරයක් සමඟම නිකුත් කර ඇත — ස්වාධීනව නැවත නිර්මාණය කිරීම (independent reproduction) සඳහා සහාය ඇත.
Figshare DOI: 10.6084/m9.figshare.32095435 · ResearchGate, Academia.edu, GitHub වෙත දර්පණ කර ඇත.

මෙම benchmark එක පැවතීමට හේතුව සහ එය පරීක්ෂා කරන්නේ කුමක්ද

AI සහාය ඇති රුධිර පරීක්ෂණ ප්‍රතිඵල කියවන්නේ කෙසේද යන්න පාරිභෝගික සහ සායනික ක්‍රියාපටිපාටිවල වැඩි වැඩියෙන් භාවිතා වෙමින් පවතී. එහෙත් රසායනාගාර වෛද්‍ය විද්‍යාවට ගැලපෙන, නැවත නැවත පරීක්ෂා කළ හැකි ඇගයීම් රාමු (reproducible evaluation frameworks) තවමත් අඩුය. මෙම සන්දර්භයේ වැදගත්ම ප්‍රශ්න සාමාන්‍ය වෛද්‍ය ප්‍රශ්න-පිළිතුරු (question-answering) සම්මතයන් මගින් ආවරණය වන ඒවා නොවේ: මධ්‍ය කෝෂිකා පරිමාව (mean corpuscular volume) එකම නම්, එන්ජිමට යකඩ ඌනතා තත්ත්වය තැලසීමියා ලක්ෂණයෙන් (thalassaemia trait) වෙන් කළ හැකිද, Gilbert's syndrome හෙපටයිටිස් ලෙස අධි-රෝග නිර්ණය කරනවාද, සහ සම්පූර්ණයෙන්ම සාමාන්‍ය පරීක්ෂණ පැනලයක (screening panel) ව්‍යාධි (pathology) නිර්මාණය කරනවාද?

තනි රුධිර පරීක්ෂණ පැනලයක් සාමාන්‍යයෙන් එකිනෙකට තරඟකාරී අර්ථකථන කිහිපයක් සඳහා ප්‍රමාණවත් සංඥා රැගෙන එයි. එම අර්ථකථනය කරන වෛද්‍යවරයාගේ කාර්යය වන්නේ එම අර්ථකථන එකිනෙකාට සාපේක්ෂව කිරා මැන බැලීමයි; පෙළපොත් පිළිතුරක් ලබා ගැනීම නොවේ. පෙළපොත් නඩු වලදී හොඳින් ක්‍රියා කරන එන්ජිමක්, වඩාත් වැදගත් නඩු වලදී තවමත් අසාර්ථක විය හැක: අවකල රෝග නිර්ණයෙහි වැටීම්, තනිව බලන විට බියකරු ලෙස පෙනෙන නිරායුධ (benign) වෙනස්කම්, සහ විශ්වීය වශයෙන් සම්පූර්ණයෙන්ම සාමාන්‍ය පැනල—එවා විශ්වාසවන්ත සහායකයන්ට ව්‍යාධි නිර්මාණය කිරීමට පෙළඹවීමයි.

මෙම බෙන්ච්මාර්කය නිර්මාණය කර ඇත්තේ හරියටම එවැනි අසාර්ථක වීමේ ආකාරයන් වටාය. සෑම නඩුවක්ම (පහළොස් දෙනාගෙන්) නිශ්චිත රෝග නිර්ණාත්මක ගුණාංගයක් සඳහා තෝරාගෙන තිබුණි: එකම මධ්‍ය කෝෂිකා පරිමාව (mean corpuscular volume) ඇති β-තැලසීමියා (beta-thalassaemia) ලක්ෂණයෙන් වෙන්ව තබාගත යුතු යකඩ ඌනතාවය නිසා ඇති මයික්‍රොසයිටෝසිස් (microcytosis), එකම අසාමාන්‍යතාවය වන්නේ හුදකලා වූ වක්‍ර (indirect) හයිපර්බිලිරුබීනීමියා පමණක් වන ගිල්බට් සින්ඩ්‍රෝමය (Gilbert's syndrome) පෙනුම, සහ විශ්ලේෂක 15ක් සහිත පරීක්ෂණ පැනලයක්—එහි සෑම විශ්ලේෂකයම (analyte) තම යොමු පරාසය තුළම පිහිටා තිබීම. මෙම රූබ්‍රික්ය, එක් එක් නඩුව තමන්ගේම කොන්දේසි අනුව කියවන එන්ජිමයන්ට ප්‍රතිලාභ දෙන අතර, එවැනි රෝග නිර්ණයක් අවශ්‍ය නොවන තැනක විශ්වාසවන්ත රෝග නිර්ණයකට එළඹෙන එන්ජිමයන්ට දඬුවම් කරයි.

MD වෛද්‍ය තෝමස් ක්ලයින් (Thomas Klein) ලෙස, මෙම නඩු පැනලය මම තෝරාගත්තේ රසායනාගාර-වෛද්‍ය සහායකයන් වැඩිපුරම වැරදි කරන්නේ මේ ආකාරයේ රටා බව මට පෙනෙන නිසාය. වියදම් සහිත අසාර්ථක වීමේ ආකාරය "දුර්ලභ රෝගයක් මගහැරීම" නොවේ—එය එය නොමැති රෝගීන් තුළ සාමාන්‍ය ව්‍යාධි (routine pathology) නිර්මාණය කිරීමයි. අපගේ වෛද්‍ය වලංගුකරණය hub විසින් පුළුල් රාමුව විස්තර කරයි; මෙම පිටුව V11 එන්ජිම මත එහි යෙදුම් ප්‍රතිඵලය විස්තර කරයි.

නවතම යොමු ධාවනය — V11 (2026 අප්‍රේල්)

Kantesti AI Engine V11 හි 2026 අප්‍රේල් යොමු (reference) ධාවනයේදී සංයුක්ත ලකුණු (composite score) එකක් ලැබුණේ 99.12% පෙර ලියාපදිංචි කළ පහළොස් නඩු රූබ්‍රික්ය මත. එම “trap” (වැටීම්) ලෙස සලකන අධි-රෝග නිර්ණ (hyperdiagnosis) නඩු දෙකම උපරිම සීමාවට (ceiling) ලකුණු ලබා ගත්හ. යකඩ ඌනතාවය හා තැලසීමියා අතර අවකල රෝග නිර්ණයේදී Mentzer දර්ශකය නිවැරදිව යොදාගත්තා.

සංයුක්ත 99.12% නඩු 15න් 15ක් ලකුණු ලබා ගත්හ

0.998 ව්‍යුහාත්මක ලකුණු (Structural score)

0.998 සායනික ලකුණු (Clinical score)

20.17 s සාමාන්‍ය ප්‍රමාදය (Mean latency)

0 / 13 Trap false-positives

සංයුක්ත සූත්‍රය සංරචක තුනක් එකට ගොඩනඟයි: ව්‍යුහාත්මක අනුකූලතාව (structural conformance) අනිවාර්ය වාර්තා කොටස් හත (seven mandatory report sections) සහ අනිවාර්ය උප කොටස් දහසය (sixteen mandatory subsections) සමඟ, සායනික නිරවද්‍යතාව (clinical accuracy) යනු keyword recall + scoring-system recall + සම්භාවිතා-විතරණ වලංගුතා පරීක්ෂාව (probability-distribution validity check) ලෙස මනිනු ලබන අතර, ප්‍රතිචාර ප්‍රමාදය (response latency) තත්පර 20ක ප්‍රධාන සේවා මට්ටමේ ඉලක්කය (20-second primary-path service-level target) අනුව. පහත රූබ්‍රික් සූත්‍රයේ නිවැරදි වෙන්කිරීම (decomposition) පෙන්වා ඇත.

සංයුක්ත = 0.35 × ව්‍යුහාත්මක (Structural) + 0.55 × සායනික (Clinical) + 0.10 × ප්‍රමාදය (Latency)

ඉතිරි 0.88 ප්‍රතිශත ලකුණු ප්‍රමාණයේ හිස් ඉඩ (headroom) අතිශය බහුතර වශයෙන් latency loss වෙත විසිරෙයි — එක් එක් සංයුක්ත (composite) -0.05 බැගින් වූ Phase 2 fallback ආයාචන තුනක්, 0.88-ලකුණු හිඟයෙන් ආසන්න වශයෙන් 0.60ක් දායක විය — එය සායනික අන්තර්ගතයට නොවෙයි. එන්ජිමට පහලොස් දෙනාගෙන් කිසිදු නඩුවක නිවැරදි රෝග විනිශ්චය මගහැරුණේ නැත; එය අඩු වූ තැන, ආයාචන කිහිපයක සුළුතරයකදී ප්‍රධාන-path ඉලක්කය වන තත්පර 20ට වඩා තරමක් වැඩි කාලයක් ගෙනීමෙන් පමණි.

වෛද්‍ය විශේෂතා හතක් හරහා නඩු පහළොවක්

නඩු පැනලය විශේෂතා හතක් ආවරණය කරයි — hematology, endocrinology, metabolic medicine, hepatology, nephrology, cardiology, rheumatology — මෙන්ම කැපවූ hyperdiagnosis trap නඩු දෙකක්ද. සෑම නඩුවක්ම ලිඛිත දැනුවත් එකඟතාවය යටතේ Kantesti සායනික දත්ත ගබඩාවෙන් ලබාගත් අනන්‍යතාව ඉවත් කළ සැබෑ රෝගියාගේ වාර්තාවකි.

අනන්‍යතාව ඉවත් කිරීම Safe Harbor ප්‍රවේශය යටතේ සිදු කරන ලදී: සියලුම සෘජු හඳුනාගැනීම් ඉවත් කර හෝ ප්‍රතිස්ථාපනය කරන ලද අතර, සෑම වාර්තාවකටම BT-NNN-LABEL ආකෘතියෙන් benchmark-internal case code එකක් පවරන ලදී. සැකසුම් කටයුතු සිදු කරන ලද්දේ GDPR Article 9(2)(j) විද්‍යාත්මක පර්යේෂණ සඳහා සුදුසු ආරක්ෂක පියවරයන් සමඟින්, සහ සමාන UK GDPR ප්‍රතිපාදන අනුවය. ප්‍රකාශයට පත් කරන ලද harness තුළ, තාක්ෂණික වාර්තාව තුළ, හෝ නිකුත් කරන ලද දත්ත කට්ටල තුළ කිසිදු පුද්ගලිකව හඳුනාගත හැකි තොරතුරක් දක්නට නොලැබේ.

Hematology (3) BT-001, BT-006, BT-007 Iron deficiency anaemia · B12 deficiency · Beta-thalassaemia minor

Endocrinology (3) BT-002, BT-008, BT-012 Hashimoto's thyroiditis · insulin resistance සමඟ PCOS · දරුණු විටමින් D ඌනතාවය

Metabolic (2) BT-003, BT-013 metabolic syndrome සමඟ T2DM · gout අවදානම සමඟ hyperuricaemia

Hepatology (2) BT-004, BT-009 NAFLD / NASH · උග්‍ර වෛරස් හෙපටයිටිස්

Nephrology · Cardiology · Rheumatology (3) BT-005, BT-010, BT-011 CKD stage 3 · Atherogenic dyslipidaemia · Systemic lupus erythematosus

Trap cases (2) BT-014, BT-015 Gilbert's syndrome (isolated indirect hyperbilirubinaemia) · සම්පූර්ණයෙන්ම සාමාන්‍ය වැඩිහිටි screening

මෙම විශේෂිත ව්‍යාප්තිය (distribution) තෝරාගත්තේ ඇයි

සත්‍ය ලෝක රසායනාගාර භාවිතයේ ඉහළ-පරිමාවක් ඇති උගුල් (microcytic differential) සහ උගුල් (macrocytic differential) යන දෙකම ඉහළම ප්‍රමාණයෙන් පවතින බැවින් Hematology සඳහා නඩු තුනක් ලැබේ. Hashimoto's, PCOS, සහ විටමින් D ඌනතාවය යන ප්‍රකාශන විවිධ රෝග-නිර්ණ හැඩයන් (ස්වයං ප්‍රතිදේහ මඟින් මෙහෙයවෙන, හෝමෝන අනුපාත මඟින් මෙහෙයවෙන, තනි-සලකුණු මඟින් මෙහෙයවෙන) අභ්‍යාස කරන්නේ නිසා Endocrinology සඳහා නඩු තුනක් ලැබේ. CKD, ASCVD අවදානම, සහ SLE යන සෑම එකක්ම තමන්ගේම ලකුණුකරණ ක්‍රමයක් ඇති බැවින් තනි-නඩු විශේෂතා තවමත් අර්ථවත්ය; එම එන්ජිම එය කැඳවිය යුතුය (පිළිවෙලින් KDIGO අදියර, ASCVD වසර 10 අවදානම, සහ 2019 EULAR/ACR SLE නිර්ණායක).

පෙර-ලියාපදිංචි කළ rubric එක පැහැදිලි කර ඇත

මෙම සම්මත පරීක්ෂණයේ (benchmark) වඩාත්ම වැදගත් ක්‍රමවේද තීරණය වන්නේ pre-registration එකයි. අපේක්ෂිත සෑම රෝග-නිර්ණයක්ම, සෑම සායනික ලකුණුකරණ ක්‍රමයක්ම, සහ සෑම වාර්තා කොටසක්ම මූලාශ්‍ර කේතයට (source code) බැඳී තිබුණි එන්ජිම කැඳවීමට පෙර. එබැවින් එන්ජිමට හිතකර ලෙස rubric එක පසු-අනුමාන (post-hoc) ලෙස සකස් කිරීම කළ නොහැක.

සංයුක්ත ලකුණ (composite score) සෑදෙන කොටස් තුනක් ඇත. ව්‍යුහාත්මක (structural) කොටස ලකුණු වලින් 35%ක් දායක වන අතර, එන්ජිම විසින් අනිවාර්ය වාර්තා කොටස් හත (header, summary, key findings, differential, scoring systems, recommendations, follow-up) සහ ඒවා තුළ ඇති අනිවාර්ය උපකොටස් දහසය (sixteen) ආපසු ලබා දුන්නේද යන්න මැනේ. ව්‍යුහාත්මක ගණනය තුළ කොටස් පැවැත්ම (section presence) 40%ක් බර දරන අතර උපකොටස් පැවැත්ම (subsection presence) 60%ක් බර දරයි.

එම සායනික (clinical) කොටස ලකුණු වලින් 55%ක් දායක වන අතර, දේවල් තුනක් එකතු කරයි: රෝග-නිර්ණ-කීවර්ඩ් මතකය (clinical උප-ලකුණේ 70%), ලකුණුකරණ-ක්‍රම මතකය (20% — එන්ජිම අදාළ විට Mentzer, FIB-4, HOMA-IR, ASCVD අවදානම, KDIGO අදියර, EULAR/ACR නිර්ණායක ගණනය කරනවාද යන්න), සහ සම්භාවිතා-එකතුව වලංගුතා පරීක්ෂාව (10% — differential සම්භාවිතා එකතුව [90, 110] පරාසය තුළ තිබිය යුතුය). උගුල් නඩු සඳහා, උපරිම 0.30 දක්වා පැහැදිලි hyperdiagnosis දඩුවමක් අඩු කරයි; එය ව්‍යාජ pathology flag එකකට 0.10 බැගින් ගණනය කර, උපරිම flag තුනකට සීමා කරයි.

එම ප්‍රමාද (latency) කොටස ලකුණු වලින් 10%ක් දායක වේ. ප්‍රතිචාරය තත්පර 20කට අඩු නම් සම්පූර්ණ 0.10 ලැබේ; තත්පර 40කට අඩු නම් 0.05 ලැබේ; ඊට වඩා මන්දගාමී ඕනෑම දෙයක් සඳහා ලකුණ 0 වේ. තත්පර 20 ඉලක්කය production primary-path සේවා මට්ටමේ අරමුණ (service-level objective) පිළිබිඹු කරයි; තත්පර 40 සීමාව heavy-engine කැඳවීම් සඳහා Phase 2 fallback අයවැය (budget) පිළිබිඹු කරයි.

pre-registration මඟින් වළක්වන දේ

පළමු-පාර්ශ්ව (first-party) benchmark සාමාන්‍යයෙන් post-hoc rubric tuning මඟින් තමන්ගේම අංක ඉහළ දමන බව ප්‍රසිද්ධ අසාර්ථක ක්‍රමයකි. එම රටාව බොහෝ විට එකම ආකාරයෙන්ම වේ: කණ්ඩායම එන්ජිම ධාවනය කර, අඩු කාර්ය සාධනයක් ඇති තැන් දකින අතර, පසුව නිහඬව rubric එක සකස් කරන්නේ අඩු කාර්ය සාධනයක් ඇති ප්‍රදේශවලට ලකුණු අඩුවෙන් ගණන් වීමටය. පළමු එන්ජිම කැඳවීමට පෙර rubric එක source code එකට බැඳීමෙන් සහ MIT බලපත්‍රය (licence) යටතේ harness එක ප්‍රකාශයට පත් කිරීමෙන්, එම සකස් කිරීම version control තුළ දෘශ්‍යමාන වේ. ඕනෑම කෙනෙකුට repository එක clone කර, rubric author dates පරීක්ෂා කර, එන්ජිම ප්‍රතිඵල ලකුණුකරණය හැඩගැස්වීමට භාවිතා නොකළ බව තහවුරු කළ හැක.

අධි-රෝග නිර්ණාත්මක උගුල් නඩු — අධික ලෙස ඇමතීම (over-calling) සැබෑ අසාර්ථකත්ව මාදිලිය වන්නේ ඇයි

සාමාන්‍ය තිර (normal screens) මත pathology එක අධික ලෙස (aggressively) හඳුනාගැනීම consumer-facing වෛද්‍ය සහායකයන් සඳහා ලේඛනගත අසාර්ථක ක්‍රමයකි. එහි පසු-ඵල (downstream) වියදම් අතර අනවශ්‍ය පරීක්ෂණ, රෝගියාගේ කනස්සල්ල, සහ iatrogenic (වෛද්‍යමය හේතුක) පරීක්ෂණ/ප්‍රතිකාර ඇතුළත් වේ. මෙම benchmark හි ඇති උගුල් නඩු දෙක එම අසාර්ථක ක්‍රමය දෘශ්‍යමාන කර ලකුණු කළ හැකි ලෙස නිර්මාණය කර ඇත.

🟡 උගුල් 1 — BT-014-GILBERT

ප්‍රකාශනය (Presentation). මුළු bilirubin 2.4 mg/dL ඇති වයස අවුරුදු 24 පිරිමි. direct කොටස සාමාන්‍යයි; transaminases සහ alkaline phosphatase ඒවායේ යොමු පරාසයන් තුළ ඇත; reticulocytes අසාමාන්‍ය නොවේ; සහ haptoglobin හා LDH මඟින් haemolysis බැහැර කරයි.

නිවැරදි අර්ථකථනය (Correct interpretation). Gilbert's syndrome — සෞම්‍ය UGT1A1 polymorphism එකක්. අර්ථකථනය hepatitis, cirrhosis, haemolytic anaemia, හෝ biliary obstruction කැඳවිය යුතු නැත.

V11 ප්‍රතිඵලය. සංයුක්ත 1.000. නිරීක්ෂණය කළ අධි-රෝග-නිර්ණ (over-diagnosis) flag හයක්ම සක්‍රීය රෝග-නිර්ණ ලෙස නොපැමිණි.

🟡 උගුල් 2 — BT-015-HEALTHY

ප්‍රකාශනය (Presentation). පරාමිතීන් පහළොවකින් (fifteen-parameter) යුතු සාමාන්‍ය පරීක්ෂණ (routine screening) පැනලයක් ඇති වයස අවුරුදු 35 ක කාන්තාවක්. සෑම analyte එකක්මම තමන්ගේ යොමු පරාසය තුළ සුවපහසු ලෙස පිහිටා ඇත.

නිවැරදි අර්ථකථනය (Correct interpretation). සහතික කිරීම සහ ජීවන රටා නඩත්තුව. අර්ථකථනය මගින් සායනික වශයෙන් ප්‍රයෝජනවත් බව පෙනෙන ලෙස දේශසීමා ආශ්‍රිත ව්‍යාධි නිර්මාණය නොකළ යුතුය.

V11 ප්‍රතිඵලය. සංයුක්ත 1.000. නිරීක්ෂණය කළ අධි-රෝග නිර්ණය අනතුරු ඇඟවීම් හතෙන් කිසිවක් — දියවැඩියාව, රක්තහීනතාවය, තයිරොයිඩ් ක්‍රියාකාරිත්ව අඩුවීම, ඩිස්ලිපිඩීමියා, හෙපටයිටිස්, වකුගඩු රෝගය, ඌනතාවය — සක්‍රීය රෝග නිර්ණ ලෙස නොපැමිණියේය.

කූඩ දෙකම ආවරණය කරමින් නිරීක්ෂණය කළ අධි-රෝග නිර්ණය අනතුරු ඇඟවීම් 13ක් පරීක්ෂා කරන ලදී. කිසිවක් ක්‍රියාත්මක නොවීය. ත්‍රයජ් (triage) හෝ උපදේශනයට පෙර මෙවලමක් ලෙස AI එන්ජිමක් භාවිතා කිරීමට සලකා බලන ඕනෑම වෛද්‍යවරයෙකුට වැදගත්ම ප්‍රතිඵලය මෙයයි: පද්ධතියක් කිසිවක් නොතිබූ තැන රෝගයක් නිර්මාණය කළේ නැත.

මෙන්ට්ဇර් දර්ශකය (Mentzer index): යකඩ ඌනතාවය තැලසීමියා ලක්ෂණයෙන් (thalassaemia trait) වෙන් කිරීම

දෙවන ඉහළ වටිනාකමක් ඇති සොයාගැනීමක් වන්නේ BT-001 (යකඩ ඌන රක්තහීනතාවය) නඩුව BT-007 (බීටා-තැලසීමියා සුළු) සමඟ යුගල වීමයි. දෙකම මයික්‍රොසයිටෝසිස් (microcytosis) සමඟ පෙනී සිටින අතර, අද්දැකීම් අඩු වර්ගීකරණ යන්ත්‍ර සඳහා හොඳින් දන්නා බාධකයක් වේ. මෙන්ට්සර් දර්ශකය (Mentzer index) — RBC ගණනෙන් MCV බෙදීම ලෙස ගණනය කරන — යකඩ ඌනතාවයේදී 13ට වඩා වැඩි වන අතර තැලසීමියා ලක්ෂණයේදී 13ට අඩු වේ.

BT-001 හිදී රෝගියා වයස අවුරුදු 34ක් වූ කාන්තාවක් වූ අතර, හීමොග්ලොබින් 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, ෆෙරිටින් 6 ng/mL, සහ ඉහළ TIBC තිබුණි. මෙන්ට්සර් දර්ශකය ආසන්න වශයෙන් 17.7 වීමෙන් නිරපේක්ෂ යකඩ ඌනතාවය තහවුරු වේ. BT-007 හිදී රෝගියා වයස අවුරුදු 28ක් වූ පිරිමියෙක් වූ අතර, මයික්‍රොසයිටෝසිස් (MCV 65.8 fL) තිබුණද RBC ගණන 6.2ක් ලෙස ඉහළය, RDW සාමාන්‍යය, ෆෙරිටින් සාමාන්‍යය, සහ HbA2 5.6 ප්‍රතිශතයක් විය. මෙන්ට්සර් දර්ශකය ආසන්න වශයෙන් 10.6 වීමෙන් තැලසීමියා ලක්ෂණය පෙන්නුම් කරන අතර, ඉහළ HbA2 මගින් බීටා-තැලසීමියා සුළු බව තහවුරු වේ.

යකඩ ඌන රක්තහීනතාවය මෙන්ට්සර් > 13 අඩු ෆෙරිටින්, අඩු TSAT, ඉහළ TIBC, ඉහළ RDW

බීටා-තැලසීමියා ලක්ෂණය මෙන්ට්සර් < 13 සාමාන්‍ය ෆෙරිටින්, සාමාන්‍ය RDW, ඉහළ HbA2 (>3.5%), ඉහළ RBC ගණන

2ම නඩු දෙකම ලකුණු 1.000 ලබා ගත්තේය. එන්ජිම මෙන්ට්සර් දර්ශකය දෙවෙනි අර්ථකථන දෙකෙහිම පැහැදිලිව භාවිතා කර ඇති අතර, සෑම අවස්ථාවකම නිවැරදි රෝග නිර්ණය ලබා දුන්නේය. මෙය සම්පූර්ණ බෙන්ච්මාර්කයේ ඇති එකම වඩාත්ම සායනිකව සහතික කරන ප්‍රතිඵලයයි, මන්ද තැලසීමියා ලක්ෂණය යකඩ ඌනතාවය ලෙස වැරදි ලෙස වර්ගීකරණය කිරීමෙන් අනිසි යකඩ අතිරේක ලබාදීම සහ පවුල්-පරීක්ෂා කිරීමේ අවස්ථා මගහැරීම සිදුවන අතර, යකඩ ඌනතාවය තැලසීමියා ලෙස වැරදි ලෙස වර්ගීකරණය කිරීමෙන් සරල ප්‍රතිස්ථාපන ප්‍රතිකාරය ප්‍රමාද වේ. අපගේ ferritin පරාසය මාර්ගෝපදේශය පුළුල් වෙනස්කාරක (differential) සන්දර්භය පැහැදිලි කරයි.

2026 අප්‍රේල් ධාවනයෙන් ලැබුණු එක් එක් නඩුව සඳහා ප්‍රතිඵල

පළමු මාර්ගයේ ප්‍රධාන (primary) මාර්ගයේ නඩු 15න් 12ක් උපරිම සංයුක්ත ලකුණු 1.000 ලබා ගත්හ. නඩු 3ක් Phase 2 fallback මගින් සපයන ලදී; එහිදී සියලුම සායනික හා ව්‍යුහාත්මක අන්තර්ගතය රැකගනිමින් 0.05 latency bonus අහිමි විය. එක් නඩුවක එක් අනිවාර්ය උපවගන්තියක් නොතිබුණි; තවත් නඩුවක සුළු වශයෙන් අඩු කරන ලද සම්භාවිතා ව්‍යාප්ති එකතුවක් (probability distribution sum) ආපසු ලැබුණි.

නඩු හැඳුනුම්පත (Case ID) විශේෂත්වය (Specialty) සංයුක්ත ප්‍රමාදය (Latency) මාර්ගය (Path)

BT-001-IDAරක්තවේදය1.00017.8 sprimary

BT-006-B12රක්තවේදය1.00018.4 තත්පරprimary

BT-007-THALරක්තවේදය1.00017.0 තත්පරprimary

BT-002-HASHඅන්තරාසර්ග විද්‍යාව0.95037.0 තත්පරආපසු හැරවීම

BT-008-PCOSඅන්තරාසර්ග විද්‍යාව0.98718.6 තත්පරprimary

BT-003-T2DMපරිවෘත්තීය1.00019.1 තත්පරprimary

BT-013-GOUTපරිවෘත්තීය1.00019.4 තත්පරprimary

BT-004-NAFLDඅක්මා රෝග විද්‍යාව1.00019.6 තත්පරprimary

BT-009-VIRHEPඅක්මා රෝග විද්‍යාව0.95023.4 තත්පරආපසු හැරවීම

BT-014-GILBERTඋගුල1.00018.9 තත්පරprimary

BT-005-CKDවකුගඩු විද්‍යාව1.00017.4 තත්පරprimary

BT-010-ASCVDහෘද රෝග විද්‍යාව1.00019.7 තත්පරprimary

BT-011-SLEරූමැටොලොජි0.98118.2 තත්පරprimary

BT-012-VITDඅන්තරාසර්ග විද්‍යාව1.00019.3 තත්පරprimary

BT-015-HEALTHYඋගුල1.00018.7 තත්පරආපසු හැරවීම

PCOS නඩුව (BT-008) ප්‍රතිචාර ව්‍යුහයේ එක් අනිවාර්ය උපවගන්තියක් අහිමි කරගත්තේය — 16න් 16 වෙනුවට 16න් 15 — එමඟින් ව්‍යුහාත්මක ලකුණු 1.000 සිට 0.963 දක්වා අඩු විය. SLE නඩුව (BT-011) සෑම රෝග-නිර්ණායන මූල පදයක්ම සහ ලකුණුකරණ ක්‍රමයම ආරක්ෂා කරමින්, සායනික ලකුණු 0.965 දක්වා පහත හෙළූ සුළු වශයෙන් අඩු වූ සම්භාවිතා-විතරණ එකතුවක් ලබා දුන්නේය. උප-පරිපූර්ණ නඩු දෙකෙන් කිසිවක් නිවැරදි රෝග-නිර්ණායනයක් මඟ හැරියේ නැත.

ප්‍රධාන ලකුණු (headline score) අපට නොකියන දේ

මෙම විශේෂයෙන් පෙර-ලියාපදිංචි කර ඇති මෙම රූබ්‍රික් යටතේ 99.12% ක සංයුක්ත ලකුණක් යනු සිවිලිමට ආසන්න කාර්යසාධනයකි, නමුත් එය ප්‍රවේශමෙන් සන්දර්භගත කළ යුතුය. මෙම ප්‍රතිඵලය විස්තර කරන්නේ, එක් වරක් බැගින් ඇගයූ, හොඳින් තෝරාගත් නිර්නාමික නඩු පහළොවක් (fifteen) එරෙහිව එන්ජිම ක්‍රියා කළ ආකාරයයි; එය එක් රූබ්‍රික් එකකට එරෙහිවයි. මෙම අංකය මගින් තහවුරු වන්නේ කුමක්ද සහ තහවුරු නොවන්නේ කුමක්ද යන්න අපි පැහැදිලිව කියන්නෙමු.

ලකුණෙන් කියවෙන්නේ V11 එන්ජිම මෙම ඇගයීම සඳහා තෝරාගත් රෝග-නිර්ණායන රටා නිවැරදිව හැසිරවූ බවයි; එය ප්‍රකාශයට පත් කර ඇති සහ නැවත නිෂ්පාදනය කළ හැකි ක්‍රමවේදයක් මතය. එන්ජිම ලෝකයේ පවතින සෑම රුධිර පරීක්ෂණ පැනලයක්ම සඳහා නිවැරදි බව එයින් කියන්නේ නැත. එන්ජිම වෛද්‍යවරයාගේ තීරණය වෙනුවට ආදේශ කළ යුතු බව එයින් කියන්නේ නැත. තවද, වෙනත් AI පද්ධතිවලට වඩා එන්ජිම ඉදිරියෙන්ද යන්න එයින් කියන්නේ නැත — වෙනත් එන්ජින් සමඟ සංසන්දනාත්මක විශ්ලේෂණ මෙම වාර්තාව සඳහා හිතාමතාම සීමාවෙන් බැහැර කර තිබුණි.

ලකුණෙන් තහවුරු වන්නේ පදනමක් (baseline) බවයි. රූබ්‍රික් සහ හාර්නස් (harness) ප්‍රසිද්ධ බැවින්, එන්ජිමේ අනාගත අනුවාදයන් එමම නඩු පහළොවට (fifteen) එරෙහිව ඇගයිය හැකි අතර, ප්‍රකාශිත ලකුණ සහ ඕනෑම පසුව ක්‍රියාත්මක කිරීමක් අතර ඇති පරතරයද මැනිය හැකිය. පෙර-ලියාපදිංචි කිරීමේ වටිනාකම මෙයයි: එය කාර්යසාධන ප්‍රකාශයන් පරීක්ෂා කළ හැකි ප්‍රකාශයන් බවට පත් කරයි.

මිනිත්තු 10ක් තුළ මෙම සම්මතය (benchmark) නැවත නිර්මාණය කරන්නේ කෙසේද

නැවත නිෂ්පාදනය සඳහා අවශ්‍ය වන්නේ Kantesti API අක්තපත්‍ර යුගලයක් පමණක් සහ Python 3.10 හෝ ඊට පසු පරිසරයක් සමඟින් requests සහ reportlab පුස්තකාල ස්ථාපනය කර තිබීමයි. සම්පූර්ණ හාර්නස් එකම MIT බලපත්‍රය යටතේ නිකුත් කරන ලද තනි ස්වයං-අඩංගු Python මොඩියුලයකි.

💻 GitHub MIT බලපත්‍ර සහිත හාර්නස් · අමු ප්‍රතිචාර · යොමු ධාවනය 🔗 Figshare DOI 10.6084/m9.figshare.32095435 · ප්‍රධාන ශාස්ත්‍රීය වාර්තාව 🎓 පර්යේෂණ ද්වාරය ප්‍රකාශනය 404175463 · ශාස්ත්‍රීය සොයාගැනීම් ස්ථරය 📄 ඇකඩමියා.එඩු පත්‍රිකාව 165956808 · ශාස්ත්‍රීය සොයාගැනීම් ස්ථරය

නව ධාවනයක් සඳහා පියවර හතරක්

එක. රිපොසිටරිය ක්ලෝන් කරන්න: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. දෙක. අවශ්‍යතා ස්ථාපනය කරන්න pip install -r requirements.txt. තුන. සකසන්න KANTESTI_USERNAME සහ KANTESTI_PASSWORD පරිසර විචල්‍යයන් ලෙස — අක්තපත්‍ර (credentials) ක්‍රියාත්මක වන අවස්ථාවේදී කියවෙන අතර, ස්ක්‍රිප්ට් තුළ කිසිවක් දෘඪකේතනය (hard-code) කර නැත. හතර. ක්‍රියාත්මක කරන්න python benchmark_bloodtest.py සහ වැඩ කරන නාමාවලියට නිකුත් වන artefacts හතර පරීක්ෂා කරන්න: CSV scorecard එකක්, JSON scorecard එකක්, raw engine responses ඇතුළත් සම්පූර්ණ JSON dump එකක්, සහ මිනිසාට කියවිය හැකි Markdown වාර්තාවක්.

2026 අප්‍රේල් 23 දින සිට වූ reference run එක repository හි results/ නාමාවලිය තුළ සුරක්ෂිත කර ඇත. නව run එකක් නව timestamp සහිත scorecard එකක් නිපදවනු ඇත; reference run එක නොවෙනස්ව පවතිනු ඇත. ඔබගේ run එකෙන් අර්ථවත් ලෙස වෙනස් ප්‍රතිඵලයක් ලැබෙන්නේ නම්, run timestamp එක සහ response metadata තුළ ආපසු ලැබූ engine version එක සමඟ GitHub issue එකක් විවෘත කරන්න.

සීමාවන් සහ අනාගත කටයුතු

සීමාවන් හතරක් පැහැදිලිව පිළිගැනීම ලැබිය යුතුය: sample size, single-shot evaluation, single-engine scope, සහ single-source data origin. මේවායින් එක් එක්කක් සක්‍රීයව අනුගමන කටයුතු මගින් විසඳෙමින් පවතී.

Sample size. විශේෂතා bucket අටක් හරහා නඩු පහළොවක් (fifteen cases) proof of concept සඳහා ප්‍රමාණවත් නමුත් විශේෂතාවක් තුළ subgroup විශ්ලේෂණය සඳහා ප්‍රමාණවත් නොවේ. නඩු පනහක් දක්වා පුළුල් කිරීම සැලසුම් කර ඇති අතර එයට coagulation panels, haematological malignancy screening, pregnancy panels, සහ ළමා (paediatric) ඉදිරිපත් කිරීම් ඇතුළත් වනු ඇත.

Single-shot evaluation. සෑම නඩුවක්ම එක් වරක් පමණක් ඇගයීමට ලක් විය. sampling temperature අඩු වුවද large language models තුළ වැදගත් output variance එකක් පවතින බැවින්, එක් නඩුවකට ඇගයීම් පහක් සහ වාර්තා කළ variance එකක් සහිත multi-run protocol එකක් ස්වභාවික ඊළඟ පියවරකි.

Single-engine scope. මෙම වාර්තාව එක් engine එකක් පමණක් විස්තර කරයි. විකල්ප AI පද්ධති සමඟ සංසන්දනාත්මක විශ්ලේෂණයන් මෙහි scope එකට අයත් නොවේ; ඒවා අපට සුදුසු ක්‍රමවේදයක් සහිත වෙනම ස්වාධීන අධ්‍යයනයක් ලෙස අනුගමනය කළ හැක.

Single-source data origin. නඩු පහළොව (fifteen cases) එකම සායනික repository එකකින් ලබාගත් anonymised සැබෑ රෝගී වාර්තා වේ. මේවා curated sample එකක් වන අතර ජනගහනය-නියෝජිත (population-representative) අහඹු තෝරාගැනීමක් නොවේ. ඇගයීම multi-centre දත්ත වෙත පුළුල් කිරීම roadmap එකේ ඇත.

වඩාත්ම බලපෑමක් ඇති සැලසුම් කළ පුළුල් කිරීම multi-language parity වේ. Kantesti AI Engine එක 75+ භාෂාවලින් පරිශීලකයන්ට සේවය සපයයි, සහ තුර්කි, ජර්මන්, ස්පාඤ්ඤ, ප්‍රංශ, සහ අරාබි භාෂාවලින් එකම නඩු පහළොවක harness එක ක්‍රියාත්මක කිරීමෙන් engine එක සහාය දක්වන භාෂා හරහා output quality ප්‍රමාණනය කරනු ඇත. අපි එක් එක් භාෂාවට අදාළ run එක එහිම DOI එකක් සහ harness branch එකක් සමඟ ප්‍රකාශයට පත් කරන්නෙමු.

99.12% Composite Score එක ලබාගත් එම Engine එකම උත්සාහ කරන්න

මෙම සම්මත පරීක්ෂණයේ ඇගයීමට ලක් වූ එකම නිෂ්පාදන (production) අවසාන ලක්ෂ්‍යයට ඔබගේම රුධිර පරීක්ෂණ පැනලය උඩුගත කරන්න. ලොව පුරා මිලියන 2කට වැඩි පරිශීලකයන් Kantesti AI Engine භාවිත කරමින් 75+ භාෂා හරහා 15,000කට වැඩි ජෛව සලකුණු (biomarkers) අර්ථකථනය කරයි.

🔬 නොමිලේ නිරූපණය උත්සාහ කරන්න

ක්‍රෝම් දිගුව යෙදුම් වෙළඳසැල ගූගල් ප්ලේ

📚 මෙම සම්මතය උපුටා ගැනීමට (Cite) කෙසේද

BibTeX

@techreport{klein2026kantesti,
  author      = {Klein, Thomas and Bulut, Julian Emirhan},
  title       = {Kantesti AI Engine හි සායනික සත්‍යාපනය (2.78T)
                 නිර්නාමික රුධිර පරීක්ෂණ නඩු 15ක් මත: පෙර-ලියාපදිංචි
                 රූබ්‍රික්-පාදක සම්මතයක් ඇතුළත් කරමින් හයිපර්ඩයග්නෝසිස් උගුල
                 නඩු හතක් පුරා වෛද්‍ය විශේෂතා හතක් හරහා},
  institution = {Kantesti Ltd},
  address     = {London, United Kingdom},
  year        = {2026},
  month       = {April},
  type        = {Technical Report},
  number      = {V11},
  doi         = {10.6084/m9.figshare.32095435},
  url         = {https://doi.org/10.6084/m9.figshare.32095435}
}

APA

Klein, T., & Bulut, J. E. (2026). Kantesti AI Engine හි සායනික සත්‍යාපනය (2.78T) නිර්නාමික රුධිර පරීක්ෂණ නඩු 15ක් මත: පෙර-ලියාපදිංචි රූබ්‍රික්-පාදක සම්මතයක් ඇතුළත් කරමින් හයිපර්ඩයග්නෝසිස් උගුල නඩු හතක් පුරා වෛද්‍ය විශේෂතා හතක් හරහා (තාක්ෂණික වාර්තාව V11). Kantesti Ltd. https://doi.org/10.6084/m9.figshare.32095435

📖 අදාළ Kantesti සත්‍යාපන කටයුතු

Klein, T. (2025). AI-බලවත් රුධිර පරීක්ෂණ අර්ථ නිරූපණය සඳහා සායනික වලංගුකරණ රාමුව: ත්‍රිත්ව-අන්ධ වලංගුකරණ ක්‍රමවේදය, කාර්ය සාධන මිනුම් සහ තත්ත්ව සහතික කිරීමේ ප්‍රොටෝකෝල. Kantesti AI වෛද්‍ය පර්යේෂණය.

🎓 පර්යේෂණ ද්වාරය

📖 බාහිර ක්‍රමවේද යොමු

Mentzer, W. C. (1973). යකඩ ඌනතාවය තැලසීමියා ලක්ෂණයෙන් වෙන් කිරීම. The Lancet, 301(7808), 882.

🏥 පබ්මෙඩ්

Aringer, M., Costenbader, K., Daikh, D., et al. (2019). 2019 European League Against Rheumatism / American College of Rheumatology පද්ධතිමය ලූපස් එරිතිමැටෝසස් වර්ගීකරණ නිර්ණායක. Arthritis & Rheumatology, 71(9), 1400–1412.

🔗 ඩීඕඅයි 🏥 පබ්මෙඩ්

Umapathi, L. K., Pal, A., & Sankarasubbu, M. (2023). Med-HALT: විශාල භාෂා ආකෘති සඳහා වෛද්‍ය ක්ෂේත්‍රයේ හලූසිනේෂන් පරීක්ෂණය. Proceedings of CoNLL 2023.

🔗 ACL Anthology

99.12%සංයුක්ත ලකුණු (Composite Score)

15ලකුණු ලබාගත් නඩු (Cases Scored)

7විශේෂතා (Specialties)

0උගුල් වැරදි-ධනාත්මක (Trap False-Positives)

නිතර අසන ප්‍රශ්න

සැබෑ රුධිර පරීක්ෂණ අවස්ථා වලදී Kantesti AI එන්ජිම කොතරම් නිවැරදිද?

පෙර-ලියාපදිංචි රූබ්‍රික් එකක් මත, වෛද්‍ය විශේෂතා හතක් පුරා නිර්නාමික සැබෑ රෝගී රුධිර පරීක්ෂණ නඩු 15ක් සඳහා, Kantesti AI Engine V11 සංයුක්ත ලකුණු 99.12%ක් ලබාගත්තේය; උගුල් නඩු දෙකෙහිම හයිපර්ඩයග්නෝසිස් වැරදි-ධනාත්මක (hyperdiagnosis false-positives) ශුන්‍යයක් වූ අතර සාමාන්‍ය ප්‍රතිචාර ප්‍රමාදය තත්පර 20.17ක් විය. සම්පූර්ණ නඩු-පර-ලකුණු පත්‍රිකාව Figshare හි DOI 10.6084/m9.figshare.32095435 යටතේ සහ MIT බලපත්‍රය (licence) යටතේ GitHub හි ප්‍රකාශයට පත් කර ඇත.

Kantesti AI එන්ජිමය සායනිකව සනාථ කර තිබේද?

ඔව්. එන්ජිම ක්‍රියාත්මක කිරීමට පෙර මූලාශ්‍ර කේතයේ සුරක්ෂිත කර තිබූ රූබ්‍රික් එකකට එරෙහිව සායනිකව වලංගු කර ඇත. එය හේමැටොලොජි, එන්ඩොක්‍රිනොලොජි, පරිවෘත්තීය වෛද්‍ය විද්‍යාව, හෙපටොලොජි, නෙෆ්‍රොලොජි, හෘද රෝග විද්‍යාව, සහ රූමැටොලොජි යන ක්ෂේත්‍රයන් ආවරණය කරමින් අනන්‍යතාව ඉවත් කළ රුධිර පරීක්ෂණ නඩු 15ක් මත ඇගයීමට ලක් කර ඇත. සායනික අධීක්ෂණය Dr. Thomas Klein, MD (ORCID 0009-0009-1490-1321) විසින් සපයන ලදී; ඔහු Kantesti AI හි මණ්ඩල-සහතික ලත් සායනික හේමැටොලොජිස්ට්වරයෙකු සහ ප්‍රධාන වෛද්‍ය නිලධාරියා වේ.

අධි රෝග නිර්ණ (hyperdiagnosis) උගුලක් සහිත නඩුවක් යනු කුමක්ද?

හයිපර්ඩයග්නොසිස් (hyperdiagnosis) උගුලක් යනු AI එන්ජින්වල අධි-රෝග නිර්ණ හැසිරීම් හඳුනාගැනීම සඳහා විශේෂයෙන් නිර්මාණය කළ සායනික තත්ත්වයකි. Kantesti V11 බෙන්ච්මාර්කය එවැනි නඩු දෙකක් භාවිතා කරයි. පළමුවැන්න Gilbert’s syndrome සමඟ ගැළපෙන හුදකලා වක්‍ර හයිපර්බිලිරුබිනීමියාවකි; එහි නිවැරදි අර්ථකථනය වන්නේ හෙපටයිටිස් හෝ හීමොලයිසිස් නොව UGT1A1 බෙනයින් (benign) පොලිමෝර්ෆිස්මයයි. දෙවැන්න සම්පූර්ණයෙන්ම සාමාන්‍ය වැඩිහිටි පරීක්ෂණ පැනලයකි; එහි නිවැරදි ප්‍රතිදානය වන්නේ නිෂ්පාදිත “බෝඩර්ලයින්” ව්‍යාධි තත්ත්වයක් මවා පෙන්වීම නොව සහතික කිරීම සහ ජීවන රටා නඩත්තුවයි.

Kantesti AI එන්ජිම ඇගයීම නැවත නැවතත් (පුනරාවර්තනය කළ හැකි ලෙස) ලබාගත හැකිද?

සම්පූර්ණ ඇගයීම් හාර්නස් MIT බලපත්‍රය යටතේ තනි ස්වයං-අඩංගු Python මොඩියුලයක් ලෙස නිකුත් කර ඇත. ප්‍රතිනිෂ්පාදනය සඳහා අවශ්‍ය වන්නේ Kantesti API credential යුගලයක් සහ Python 3.10 හෝ ඊට පසු අනුවාදයක් පමණි. කේතය, නඩු නිර්වචන, සහ අප්‍රේල් 2026 යොමු ධාවනයෙන් ලැබුණු සෑම අමු එන්ජින් ප්‍රතිචාරයක්ම github.com/emirhanai/kantesti-blood-test-benchmark හි ඇත; Figshare, ResearchGate, සහ Academia.edu හිද එය ප්‍රතිබිම්බ කර ඇත.

Kantesti AI එන්ජිමය යකඩ ඌනතාවය බීටා-තැලසීමියා ලක්ෂණයෙන් වෙන්කර හඳුනාගන්නේ කෙසේද?

එන්ජිම Mentzer දර්ශකය යොදා ගනී; එය ගණනය කරන්නේ මධ්‍යම කෝෂිකා පරිමාව (mean corpuscular volume) රතු රුධිර කෝෂ ගණන (red blood cell count) මගින් බෙදීමෙනි. Mentzer දර්ශකය 13ට වඩා වැඩි නම් යකඩ ඌනතා රක්තහීනතාවය (iron deficiency anaemia) සඳහා සහය දක්වයි; 13ට අඩු අගයක් නම් බීටා-තැලසීමියා ලක්ෂණය (beta-thalassaemia trait) සඳහා සහය දක්වයි. V11 බෙන්ච්මාර්කයේදී මෙම ඉදිරිපත් කිරීම් දෙකම Mentzer දර්ශකය පැහැදිලිව ගණනය කිරීම මගින් නිවැරදිව වර්ගීකරණය කරන ලදී; එයට ferritin, RDW, සහ HbA2 සන්දර්භයද සහාය විය.

මට අමු සම්මත දත්ත සහ මූලාශ්‍ර කේතය කොහෙන් සොයාගත හැකිද?

තාක්ෂණික වාර්තාව Figshare හි DOI 10.6084/m9.figshare.32095435 යටතේ තැන්පත් කර ඇත; ResearchGate ප්‍රකාශනය 404175463 සහ Academia.edu පත්‍රය 165956808 හිද එය ප්‍රතිබිම්බ කර ඇත. MIT බලපත්‍රය සහිත Python හාර්නස් සහ සියලුම යොමු ධාවන ප්‍රතිඵල github.com/emirhanai/kantesti-blood-test-benchmark හි ඇත. වේදිකා හතරක ප්‍රතිබිම්බ ජාලය දිගුකාලීන ලබාගැනීම සහ උපුටාගැනීමේ නම්‍යතාවය සහතික කරයි.

AI වෛද්‍ය බෙන්ච්මාර්ක සඳහා පෙර-ලියාපදිංචිය (pre-registration) වැදගත් වන්නේ ඇයි?

පෙර-ලියාපදිංචිය මගින් පශ්චාත්-අදහස් (post-hoc) රූබ්‍රික් සකස් කිරීම වැළැක්වෙයි; සමාගම්-පවත්වාගෙන යන බෙන්ච්මාර්ක තමන්ගේම අගයන් ඉහළ නංවන වඩාත්ම පොදු ක්‍රමය එයයි. එන්ජිමක් කැඳවීමට පෙර රූබ්‍රික් එක මූලාශ්‍ර කේතයට සුරක්ෂිත කර, හාර්නස් එක මහජනතාවට ප්‍රසිද්ධ කිරීමෙන් රූබ්‍රික් කතුවරයාගේ දිනයන් වერსන් පාලනයේදී පරීක්ෂා කළ හැකි අතර, එන්ජිම ප්‍රතිඵල මගින් ලකුණු කිරීමේ නිර්ණායක හැඩගැස්වීමට නොහැක.

මෙම බෙන්ච්මාර්කය වෙනත් AI එන්ජින් සමඟ සංසන්දනයන් ඇතුළත් කරනවාද?

නැත. V11 වාර්තාව විකල්ප වාණිජ පද්ධති සමඟ තැබීම වෙනුවට, ස්ථාවර රූබ්‍රික් එකකට එරෙහිව එක් එන්ජිමක් පමණක් හිතාමතාම විස්තර කරයි. හාර්නස් එක MIT බලපත්‍රය යටතේ විවෘත මූලාශ්‍රයක් බැවින්, ස්වාධීන පර්යේෂකයන්ට තමන් තෝරාගන්නා ඕනෑම එන්ජිමක් එම එකම නඩු පහළොව සහ රූබ්‍රික් එකට එරෙහිව ඇගයීමටත්, තම ප්‍රතිඵල ප්‍රකාශයට පත් කිරීමටත් හැකිය.

රෝගී නඩු සැබෑද නැත්නම් කෘත්‍රිමද?

නඩු පහළොවම අනන්‍යතාව ඉවත් කළ සැබෑ රෝගී වාර්තා වන අතර, ලිඛිත දැනුවත් කැමැත්ත යටතේ Kantesti සායනික දත්ත ගබඩාවෙන් ලබාගත් ඒවාය. Safe Harbor ප්‍රවේශය යටතේ අනන්‍යතාව ඉවත් කිරීම සිදු කර ඇති අතර, සියලුම සෘජු හඳුනාගැනීම් ඉවත් කර හෝ ප්‍රතිස්ථාපනය කර ඇත. GDPR වගන්තිය 9(2)(j) සහ ඊට සමාන UK GDPR විධිවිධාන අනුව සැකසීම සිදු කරන ලදී. ප්‍රකාශයට පත් කළ හාර්නස්, තාක්ෂණික වාර්තාව, හෝ නිකුත් කළ දත්ත කට්ටලවල කිසිදු පුද්ගලික හඳුනාගැනීමේ තොරතුරක් නොමැත.

⚕️ වෛද්‍ය ප්‍රතික්ෂේප කිරීම (Medical Disclaimer) සහ වෘත්තීය අරගලය (Conflict of Interest)

මෙම බෙන්ච්මාර්ක වාර්තාව පර්යේෂණ සහ ක්‍රමවේදමය විනිවිදභාවය සඳහා පමණි. එය වෛද්‍ය උපදෙස් ලෙස නොසැලකේ. රෝග නිර්ණය සහ ප්‍රතිකාර තීරණ සඳහා සෑම විටම සුදුසුකම් ලත් සෞඛ්‍ය සේවා සපයන්නෙකුගෙන් උපදෙස් ලබාගන්න. දෙදෙනාම කතුවරුන් Kantesti Ltd හි සේවය කරමින් සිටින අතර කොටස් හිමිකාරිත්වයද දරයි; ඇගයීමට ලක් කරන එන්ජිමද එම සංවිධානයේ වාණිජ නිෂ්පාදනයකි. මෙම වෘත්තීය අරගලය අවම කර ඇත්තේ රූබ්‍රික් එක මූලාශ්‍ර කේතයේ පෙර-ලියාපදිංචි කිරීමෙන්, හාර්නස් එක MIT බලපත්‍රය යටතේ නිකුත් කිරීමෙන්, සහ සෑම අමු එන්ජින් ප්‍රතිචාරයක්ම ප්‍රකාශයට පත් කිරීමෙන්ය.

E-E-A-T විශ්වාස සංඥා

⭐ 안장이 안장

අත්දැකීම්

නඩු පැනල තේරීම අධීක්ෂණය කරමින් වසර 15කට වැඩි සායනික හේමැටොලොජි සහ රසායනාගාර වෛද්‍ය විද්‍යා පළපුරුද්ද.

📋

ප්‍රවීණතාව

පැහැදිලි හයිපර්ඩයග්නොසිස් දඩ (penalties) සහ පිළිගත් සායනික ලකුණු කිරීමේ පද්ධති (Mentzer, FIB-4, EULAR/ACR, KDIGO) සහිත පෙර-ලියාපදිංචි කළ රූබ්‍රික් සැලසුම.

👤

අධිකාරීත්වය

ප්‍රධාන කතුවර Dr. Thomas Klein, MD (ORCID 0009-0009-1490-1321). ක්‍රියාත්මක කිරීම Julian Emirhan Bulut, Kantesti Ltd හි CEO විසින්.

🛡️

විශ්වසනීයත්වය

MIT බලපත්‍රය සහිත ප්‍රතිනිෂ්පාදනය කළ හැකි හාර්නස්, අමු එන්ජින් ප්‍රතිචාර ප්‍රකාශයට පත් කර ඇත, විවෘත වෘත්තීය අරගලය පිළිබඳ හෙළිදරව්ව, වේදිකා හතරක පර්යේෂණ ප්‍රතිබිම්බ ජාලය.

🏢 කන්ටෙස්ටි ලිමිටඩ් එංගලන්තය සහ වේල්ස්හි ලියාපදිංචි · සමාගම් අංකය. 17090423 ලන්ඩන්, එක්සත් රාජධානිය · කැන්ටෙස්ටි.නෙට්