Kantesti AI రక్త పరీక్ష బెంచ్‌మార్క్

క్లినికల్ ధ్రువీకరణ ముందస్తుగా నమోదు చేసిన బెంచ్‌మార్క్ V11 — ఏప్రిల్ 2026 MIT లైసెన్స్‌తో సహచరులు ధృవీకరించగలిగే విధంగా

0] 99.12% ప్రీ-రిజిస్టర్ చేసిన రుబ్రిక్‌పై జీరో హైపర్‌డయాగ్నోసిస్ ఫాల్స్-పాజిటివ్‌లతో కూడిన కాంపోజిట్ స్కోర్

అనామక రక్త పరీక్ష కేసులపై Kantesti AI ఇంజిన్‌ను స్వతంత్రంగా, ముందస్తుగా నమోదు చేసిన క్లినికల్ మూల్యాంకనం. మొదటి ఇంజిన్ కాల్‌కు ముందు సోర్స్ కోడ్‌లోనే రూబ్రిక్‌ను స్థిరపరిచారు; మూల్యాంకన హార్నెస్ MIT లైసెన్స్‌తో ఉంది, మరియు ప్రతి ముడి ప్రతిస్పందన ప్రచురించబడుతుంది.

📖 ~14 నిమిషాలు 📅 ఏప్రిల్ 23, 2026 🔗 DOI: 10.6084/m9.figshare.32095435

📝 ప్రచురించబడింది: ఏప్రిల్ 23, 2026 🩺 వైద్యపరంగా సమీక్షించబడింది: ఏప్రిల్ 23, 2026 ✅ ముందస్తుగా నమోదు చేసిన రూబ్రిక్ 🔓 ఓపెన్ కోడ్ & డేటా

ఈ క్లినికల్ ధృవీకరణ అధ్యయనానికి నాయకత్వం వహించినవారు డాక్టర్ థామస్ క్లెయిన్, MD, Kantesti AI వద్ద చీఫ్ మెడికల్ ఆఫీసర్, సహకారంతో జూలియన్ ఎమిర్హాన్ బులుట్, Kantesti Ltd వద్ద సీనియర్ AI ఇంజనీర్ మరియు CEO. విధానశాస్త్రం మరియు రూబ్రిక్‌ను సమీక్షించినవారు కాంటెస్టి AI మెడికల్ అడ్వైజరీ బోర్డు.

ప్రధాన రచయిత & క్లినికల్ పర్యవేక్షణ

థామస్ క్లీన్, MD

చీఫ్ మెడికల్ ఆఫీసర్, కాంటెస్టి AI

డాక్టర్ థామస్ క్లైన్ బోర్డు-సర్టిఫైడ్ క్లినికల్ హీమటాలజిస్ట్ మరియు ఇంటర్నిస్ట్; ప్రయోగశాల వైద్యంలో 15 సంవత్సరాలకు పైగా అనుభవం ఉంది. Kantesti AI వద్ద చీఫ్ మెడికల్ ఆఫీసర్‌గా, ఈ బెంచ్‌మార్క్ కోసం కేస్ ప్యానెల్‌ను ఎంపిక చేశారు, అన్ని డయాగ్నస్టిక్ గ్రౌండ్ ట్రూత్‌లను సమీక్షించారు, మరియు మొదటి ఇంజిన్ ఆహ్వానం‌కు ముందు ముందస్తుగా నమోదు చేసిన రూబ్రిక్‌ను ఆమోదించారు.

ORCID 0009-0009-1490-1321 రీసెర్చ్ గేట్ గూగుల్ స్కాలర్

సహ-రచయిత & అమలు

జూలియన్ ఎమిర్హాన్ బులుట్

సీనియర్ AI ఇంజనీర్ & CEO, Kantesti Ltd

జూలియన్ ఎమిర్హాన్ బులుట్ Kantesti Ltd యొక్క వ్యవస్థాపకుడు మరియు CEO. ఆయన మూల్యాంకన హార్నెస్‌ను రూపొందించి అమలు చేశారు, API ఇంటిగ్రేషన్‌ను నిర్వహించారు, ఏప్రిల్ 2026 బెంచ్‌మార్క్ రన్‌ను నిర్వహించారు, మరియు గణాంక సమీకరణను సిద్ధం చేశారు. 2019 నుండి ప్లాట్‌ఫారమ్ వ్యవస్థాపకుడు.

GitHub కాంటెస్టి గురించి

⚡ శీఘ్ర సారాంశం V11 — ఏప్రిల్ 23, 2026

99.12% సమ్మిళిత స్కోరు ఏడు వైద్య ప్రత్యేకతలలో 15 అనామక నిజ-రోగి రక్త పరీక్ష కేసులపై.
జీరో హైపర్‌డయాగ్నోసిస్ ఫాల్స్-పాజిటివ్‌లు రెండు ట్రాప్ కేసులపై (గిల్బర్ట్ సిండ్రోమ్ మరియు పూర్తిగా సాధారణ వయోజన స్క్రీన్).
ముందస్తుగా నమోదు చేసిన రుబ్రిక్ మొదటి ఇంజిన్ కాల్‌కు ముందు సోర్స్ కోడ్‌లోనే ఫ్రీజ్ చేయబడింది — పోస్ట్-హాక్ ట్యూనింగ్ సాధ్యం కాలేదు.
మెంట్జర్ సూచికను సరిగ్గా వర్తింపజేశారు ఐరన్ లోప రక్తహీనతను బీటా-థాలస్సీమియా మైనర్ నుండి వేరు చేయడానికి.
ప్రొడక్షన్ ఎండ్‌పాయింట్ మాత్రమే — ప్రత్యేక హక్కుల రూటింగ్ లేదు; చెల్లించే కస్టమర్ యాక్సెస్ చేసినట్లుగానే ఖచ్చితంగా మూల్యాంకనం చేయబడింది.
సగటు లేటెన్సీ 20.17 సెకన్లు ఎండ్-టు-ఎండ్‌గా, 15 కేసుల్లో 12 కేసులు 20-సెకన్ల ప్రాథమిక-పాత్ లక్ష్యానికి లోపల ఉన్నాయి.
MIT-లైసెన్స్ హార్నెస్ ప్రతి ముడి ఇంజిన్ ప్రతిస్పందనతో GitHubలో విడుదలైంది — స్వతంత్ర పునరుత్పత్తికి మద్దతు ఉంది.
Figshare DOI: 10.6084/m9.figshare.32095435 · ResearchGate, Academia.edu, GitHubలో మిర్రర్ చేయబడింది.

ఈ బెంచ్‌మార్క్ ఎందుకు ఉంది మరియు ఇది ఏమి పరీక్షిస్తుంది

AI-సహాయంతో రక్త పరీక్ష ఫలితాలు అర్థం వినియోగదారుల మరియు క్లినికల్ వర్క్‌ఫ్లోలలో పెరుగుతున్న స్థాయిలో ఉపయోగించబడుతోంది; అయినప్పటికీ, ప్రయోగశాల వైద్యానికి అనుకూలంగా పునరుత్పత్తి చేయగల మూల్యాంకన ఫ్రేమ్‌వర్క్‌లు ఇప్పటికీ అరుదుగా ఉన్నాయి. ఈ సందర్భంలో అత్యంత ముఖ్యమైన ప్రశ్నలు సాధారణ వైద్య ప్రశ్న-సమాధాన బెంచ్‌మార్క్‌లలో కవర్ చేయబడేవి కావు: సగటు కార్పస్కులర్ వాల్యూమ్ ఒకేలా ఉన్నప్పుడు ఇంజిన్ ఐరన్ లోపాన్ని థాలస్సీమియా ట్రైట్ నుండి వేరు చేయగలదా, హెపటైటిస్‌గా గిల్బర్ట్ సిండ్రోమ్‌ను అధికంగా నిర్ధారిస్తుందా, మరియు పూర్తిగా సాధారణ స్క్రీనింగ్ ప్యానెల్‌లో పాథాలజీని తయారు చేస్తుందా?

ఒకే రక్త పరీక్ష ప్యానెల్ సాధారణంగా అనేక పోటీ వివరణలకు మద్దతు ఇచ్చేంత సంకేతాన్ని కలిగి ఉంటుంది; అందువల్ల ఫలితాలను అర్థం చేసేవైద్యుడి పని, పాఠ్యపుస్తక సమాధానాన్ని వెతకడం కంటే, ఆ వివరణలను పరస్పరం తూకం వేసి చూడడం. పాఠ్యపుస్తక కేసుల్లో బాగా పనిచేసే ఇంజిన్, అత్యంత ప్రాముఖ్యమైన కేసుల్లో మాత్రం విఫలమవచ్చు: డిఫరెన్షియల్-డయాగ్నోసిస్ లోపాల పిట్ఫాల్స్, ఒంటరిగా చూసినప్పుడు భయంకరంగా కనిపించే నిర్దోష వేరియంట్లు, మరియు పూర్తిగా సాధారణ ప్యానెల్లు—ఇవి నమ్మకంగా ఉన్న సహాయకులను పాథాలజీని తయారు చేయడానికి ప్రేరేపిస్తాయి.

ఈ బెంచ్‌మార్క్ ప్రత్యేకంగా ఈ వైఫల్య రీతుల చుట్టూ నిర్మించబడింది. పదిహేను కేసుల్లో ప్రతి ఒక్కదాన్ని ఒక నిర్దిష్ట నిర్ధారణ లక్షణం కోసం ఎంపిక చేశారు: ఒక ఐరన్-లోప మైక్రోసైటోసిస్‌ను, అదే mean corpuscular volume ఉన్న బీటా-థాలస్సీమియా ట్రైట్ నుండి వేరుగా ఉంచాల్సిన అవసరం; గిల్బర్ట్ సిండ్రోమ్ ప్రదర్శన—ఇందులో ఏకైక అసాధారణత ఒంటరిగా ఉన్న indirect hyperbilirubinaemia; మరియు పదిహేను-పారామీటర్ స్క్రీనింగ్ ప్యానెల్‌లో ప్రతి అనలైట్ తన సూచన పరిధిలోనే ఉండే పరిస్థితి. ఈ రూబ్రిక్, ప్రతి కేసును దాని స్వంత సందర్భంలో చదివే ఇంజిన్‌లకు బహుమతి ఇస్తుంది; అటువంటి నిర్ధారణ అవసరం లేని చోట కూడా నమ్మకంగా ఒక నిర్ధారణకు చేరుకునే ఇంజిన్‌లను శిక్షిస్తుంది.

డాక్టర్ థామస్ క్లైన్‌గా, నేను ఈ కేస్ ప్యానెల్‌ను ఎంచుకున్నాను, ఎందుకంటే ల్యాబొరేటరీ-మెడిసిన్ సహాయకులు ఎక్కువగా తప్పుగా అర్థం చేసుకునే నమూనాలు ఇవే. ఖరీదైన వైఫల్య రీతి "అరుదైన వ్యాధిని మిస్ చేయడం" కాదు—అది దానిని కలిగి లేని రోగుల్లో సాధారణ పాథాలజీని తయారు చేయడం. మా వైద్య ధ్రువీకరణ hub విస్తృత ఫ్రేమ్‌వర్క్‌ను వివరిస్తుంది; ఈ పేజీ V11 ఇంజిన్‌పై దాని అన్వయ ఫలితాన్ని వివరిస్తుంది.

తాజా రిఫరెన్స్ రన్ — V11 (ఏప్రిల్ 2026)

Kantesti AI Engine V11 యొక్క ఏప్రిల్ 2026 రిఫరెన్స్ రన్‌లో ఒక సమ్మిళిత స్కోరు వచ్చింది 99.12% ముందుగా నమోదు చేసిన పదిహేను-కేసుల రూబ్రిక్‌పై. హైపర్‌డయాగ్నోసిస్ ట్రాప్ కేసులు రెండూ గరిష్ఠ స్థాయిలో స్కోర్ చేశాయి. ఐరన్-డెఫిషియెన్సీ వర్సెస్ థాలస్సీమియా డిఫరెన్షియల్‌లో Mentzer index సరిగ్గా వర్తింపజేశారు.

సమ్మిళిత 99.12% 15 లో 15 కేసులు స్కోర్

0.998 నిర్మాణాత్మక స్కోరు

0.998 క్లినికల్ స్కోరు

20.17 s సగటు లేటెన్సీ

0 / 13 ట్రాప్ ఫాల్స్-పాజిటివ్‌లు

సమ్మిళిత ఫార్ములా మూడు భాగాలను కలుపుతుంది: నిర్మాణ అనుగుణత ఏడు తప్పనిసరి రిపోర్ట్ విభాగాలు మరియు పదహారు తప్పనిసరి ఉపవిభాగాలతో, క్లినికల్ ఖచ్చితత్వం కీవర్డ్ రీకాల్ + స్కోరింగ్-సిస్టమ్ రీకాల్ + ప్రాబబిలిటీ-డిస్ట్రిబ్యూషన్ చెల్లుబాటు తనిఖీగా కొలవబడింది, మరియు ప్రతిస్పందన లేటెన్సీ 20-సెకన్ల ప్రధాన-సర్వీస్-లెవల్ లక్ష్యానికి వ్యతిరేకంగా. ఖచ్చితమైన విభజన క్రింది రూబ్రిక్ ఫార్ములాలో చూపబడింది.

సమ్మిళిత = 0.35 × నిర్మాణాత్మక + 0.55 × క్లినికల్ + 0.10 × లేటెన్సీ

మిగిలిన 0.88 శాతం “హెడ్‌రూమ్” దాదాపు పూర్తిగా లేటెన్సీ నష్టంగా విడిపోతుంది — ప్రతి ఒక్కటి సమ్మిళితంగా -0.05 ఉన్న మూడు Phase 2 ఫాల్బ్యాక్ ఇన్వొకేషన్లు, 0.88-పాయింట్ల లోటులో సుమారు 0.60 ను అందించాయి — క్లినికల్ కంటెంట్‌లోకి కాకుండా. ఇంజిన్ పదిహేను కేసుల్లో ఏదీ సరైన నిర్ధారణను మిస్ చేయలేదు; ఎక్కడ లోపం జరిగిందో, అది కొద్దిపాటి ఇన్వొకేషన్లలో 20-సెకన్ల ప్రాథమిక-పాత్ లక్ష్యానికి కాస్త ఎక్కువ సమయం తీసుకోవడం ద్వారా మాత్రమే జరిగింది.

ఏడు వైద్య ప్రత్యేకతలలో పదిహేను కేసులు

కేస్ ప్యానెల్‌లో ఏడు ప్రత్యేకతలు ఉన్నాయి — హీమటాలజీ, ఎండోక్రైనాలజీ, మెటబాలిక్ మెడిసిన్, హెపాటాలజీ, నెఫ్రాలజీ, కార్డియాలజీ, రుమటాలజీ — అలాగే రెండు ప్రత్యేక హైపర్‌డయాగ్నోసిస్ ట్రాప్ కేసులు. ప్రతి కేసు, వ్రాతపూర్వకంగా ఇచ్చిన అవగాహనతో కూడిన సమ్మతితో, Kantesti క్లినికల్ డేటా రిపాజిటరీ నుంచి తీసుకున్న అనామకీకరించిన నిజమైన రోగి రికార్డు.

డీ-ఐడెంటిఫికేషన్ Safe Harbor విధానంలో నిర్వహించబడింది: అన్ని ప్రత్యక్ష గుర్తింపులను తొలగించారు లేదా భర్తీ చేశారు, మరియు ప్రతి రికార్డుకు BT-NNN-LABEL ఆకృతిలో ఒక బెంచ్‌మార్క్-ఇంటర్నల్ కేస్ కోడ్ కేటాయించారు. ప్రాసెసింగ్ ఈ ప్రకారం నిర్వహించబడింది GDPR ఆర్టికల్ 9(2)(j) తగిన రక్షణ చర్యలతో శాస్త్రీయ పరిశోధన కోసం, అలాగే సమానమైన UK GDPR నిబంధనల ప్రకారం. ప్రచురిత హార్నెస్‌లో, సాంకేతిక నివేదికలో, లేదా విడుదల చేసిన డేటాసెట్లలో ఎక్కడా వ్యక్తిగతంగా గుర్తించగల సమాచారం కనిపించదు.

హీమటాలజీ (3) BT-001, BT-006, BT-007 ఐరన్ లోప రక్తహీనత · B12 లోపం · బీటా-థాలసీమియా మైనర్

ఎండోక్రైనాలజీ (3) BT-002, BT-008, BT-012 హషిమోటోస్ థైరాయిడిటిస్ · ఇన్సులిన్ రెసిస్టెన్స్‌తో PCOS · తీవ్రమైన విటమిన్ డి లోపం

మెటబాలిక్ (2) BT-003, BT-013 మెటబాలిక్ సిండ్రోమ్‌తో T2DM · గౌట్ ప్రమాదంతో హైపర్‌యూరిసీమియా

హెపాటాలజీ (2) BT-004, BT-009 NAFLD / NASH · ఆకస్మిక వైరల్ హెపటైటిస్

నెఫ్రాలజీ · కార్డియాలజీ · రుమటాలజీ (3) BT-005, BT-010, BT-011 CKD దశ 3 · అథెరోజెనిక్ డిస్లిపిడీమియా · సిస్టమిక్ లూపస్ ఎరిథీమాటోసస్

ట్రాప్ కేసులు (2) BT-014, BT-015 గిల్బర్ట్ సిండ్రోమ్ (ఒంటరి ఇండైరెక్ట్ హైపర్‌బిలిరుబినీమియా) · పూర్తిగా సాధారణ వయోజన స్క్రీన్

ఈ ప్రత్యేక పంపిణీ ఎందుకు

వాస్తవ ప్రపంచ ప్రయోగశాల ప్రాక్టీస్‌లో మైక్రోసైటిక్ డిఫరెన్షియల్స్ మరియు మాక్రోసైటిక్ డిఫరెన్షియల్స్ అత్యధిక-వాల్యూమ్ ట్రాప్‌లుగా ఉండటంతో హీమటాలజీకి మూడు కేసులు వస్తాయి. హాషిమోటోస్, PCOS, మరియు విటమిన్ డి లోపం ప్రదర్శనలు వేర్వేరు నిర్ధారణ ఆకృతులను (ఆటోఆంటీబాడీ-చోదిత, హార్మోన్-నిష్పత్తి-చోదిత, ఒకే-మార్కర్-చోదిత) పరీక్షించడంతో ఎండోక్రినాలజీకి మూడు కేసులు వస్తాయి. CKD, ASCVD రిస్క్, మరియు SLE ప్రతి ఒక్కదానికి ఇంజిన్ పిలవాల్సిన తనదైన స్కోరింగ్ సిస్టమ్ ఉండటంతో సింగిల్-కేస్ స్పెషాలిటీలు ఇంకా అర్థవంతమే (క్రమంగా KDIGO స్టేజింగ్, ASCVD 10-year risk, 2019 EULAR/ACR SLE ప్రమాణాలు).

ముందస్తుగా నమోదు చేసిన రూబ్రిక్ — వివరణ

ప్రీ-రిజిస్ట్రేషన్ ఈ బెంచ్‌మార్క్‌లో అత్యంత ముఖ్యమైన విధానపరమైన ఎంపిక. ప్రతి ఊహించిన నిర్ధారణ, ప్రతి క్లినికల్ స్కోరింగ్ సిస్టమ్, మరియు ప్రతి రిపోర్ట్ విభాగం సోర్స్ కోడ్‌కు కట్టుబడి ఉంది ఇంజిన్‌ను పిలిచే ముందు. అందువల్ల ఇంజిన్‌ను మెప్పించేలా రుబ్రిక్‌పై పోస్ట్-హాక్ ట్యూనింగ్ చేయడం అసాధ్యం.

సమ్మిళిత స్కోర్‌ను రూపొందించే మూడు భాగాలు ఉన్నాయి. నిర్మాణాత్మక భాగం 35 శాతం వాటా కలిగి, ఇంజిన్ ఏడు తప్పనిసరి రిపోర్ట్ విభాగాలను (హెడర్, సమ్మరీ, కీలక ఫైండింగ్స్, డిఫరెన్షియల్, స్కోరింగ్ సిస్టమ్స్, సిఫార్సులు, ఫాలో-అప్) మరియు వాటిలోని పదహారు తప్పనిసరి ఉపవిభాగాలను తిరిగి ఇచ్చిందా అనే విషయాన్ని కొలుస్తుంది. విభాగం ఉనికి నిర్మాణాత్మక లెక్కింపులో 40 శాతం బరువు, ఉపవిభాగం ఉనికి 60 శాతం బరువు కలిగి ఉంటుంది.

ది క్లినికల్ భాగం 55 శాతం వాటా కలిగి, మూడు విషయాలను కలుపుతుంది: నిర్ధారణ-కీవర్డ్ రీకాల్ (క్లినికల్ ఉప-స్కోర్‌లో 70 శాతం), స్కోరింగ్-సిస్టమ్ రీకాల్ (20 శాతం — సంబంధిత చోట్ల ఇంజిన్ Mentzer, FIB-4, HOMA-IR, ASCVD రిస్క్, KDIGO స్టేజింగ్, EULAR/ACR ప్రమాణాలను లెక్కిస్తుందా), మరియు ప్రాబబిలిటీ-సమ్ చెల్లుబాటు తనిఖీ (10 శాతం — డిఫరెన్షియల్ ప్రాబబిలిటీలు [90, 110] అంతరంలో మొత్తం రావాలి). ట్రాప్ కేసుల కోసం, గరిష్ఠంగా 0.30 వరకు స్పష్టమైన హైపర్‌డయాగ్నోసిస్ పెనాల్టీ తీసివేస్తారు; ఇది తయారు చేసిన పాథాలజీ ఫ్లాగ్‌కు 0.10 చొప్పున లెక్కించి, గరిష్ఠంగా మూడు ఫ్లాగ్‌ల వరకు పరిమితం చేస్తారు.

ది లేటెన్సీ భాగం 10 శాతం వాటా కలిగి ఉంటుంది. 20 సెకన్లలోపు స్పందనకు పూర్తి 0.10, 40 సెకన్లలోపు స్పందనకు 0.05, అంతకంటే నెమ్మదిగా ఏదైనా అయితే సున్నా. 20 సెకన్ల లక్ష్యం ప్రొడక్షన్ ప్రైమరీ-పాత్ సర్వీస్-లెవల్ ఆబ్జెక్టివ్‌ను ప్రతిబింబిస్తుంది; 40 సెకన్ల గరిష్ఠ పరిమితి భారీ-ఇంజిన్ ఇన్వొకేషన్ల కోసం ఫేజ్ 2 ఫాల్బ్యాక్ బడ్జెట్‌ను ప్రతిబింబిస్తుంది.

ప్రీ-రిజిస్ట్రేషన్ ఏమి నివారిస్తుంది

ఫస్ట్-పార్టీ బెంచ్‌మార్క్‌లు పోస్ట్-హాక్ రుబ్రిక్ ట్యూనింగ్ ద్వారా తమ స్వంత సంఖ్యలను పెంచడం కోసం ప్రసిద్ధి. ఆ నమూనా దాదాపు ఎప్పుడూ ఇదే: టీమ్ ఇంజిన్‌ను నడిపి, ఎక్కడ తక్కువగా ఉందో చూసి, ఆ తర్వాత తక్కువగా ఉన్న ప్రాంతాలు తక్కువగా లెక్కపడేలా రుబ్రిక్‌ను నిశ్శబ్దంగా సర్దుతుంది. మొదటి ఇంజిన్ కాల్‌కు ముందు రుబ్రిక్‌ను సోర్స్ కోడ్‌కు కట్టుబట్టి, MIT లైసెన్స్‌తో హార్నెస్‌ను ప్రచురించడం ద్వారా, ఆ సర్దుబాటు వెర్షన్ కంట్రోల్‌లో కనిపిస్తుంది. ఎవరైనా రిపోజిటరీని క్లోన్ చేసి, రుబ్రిక్ రచయిత తేదీలను తనిఖీ చేసి, స్కోరింగ్‌ను ఆకృతీకరించడానికి ఇంజిన్ ఫలితాలను ఉపయోగించలేదని ధృవీకరించవచ్చు.

హైపర్‌డయాగ్నోసిస్ ట్రాప్ కేసులు — అధికంగా పిలవడం (over-calling) నిజమైన వైఫల్య విధానం ఎందుకు

సాధారణ స్క్రీన్‌లపై పాథాలజీని దూకుడుగా ఎక్కువగా పిలవడం అనేది కన్స్యూమర్-ఫేసింగ్ మెడికల్ అసిస్టెంట్లలో డాక్యుమెంట్ అయిన వైఫల్య మోడ్. దాని డౌన్‌స్ట్రీమ్ ఖర్చుల్లో అవసరం లేని పరిశోధన, రోగి ఆందోళన, మరియు ఐయాట్రోజెనిక్ వర్కప్ ఉన్నాయి. ఈ బెంచ్‌మార్క్‌లోని రెండు ట్రాప్ కేసులు ఆ వైఫల్య మోడ్‌ను కనిపించేలా చేసి, స్కోర్ చేయగలిగేలా రూపొందించబడ్డాయి.

🟡 ట్రాప్ 1 — BT-014-GILBERT

ప్రదర్శన. మొత్తం బిలిరుబిన్ 2.4 mg/dL ఉన్న 24 ఏళ్ల పురుషుడు. డైరెక్ట్ భాగం సాధారణం, ట్రాన్స్‌అమినేసులు మరియు ఆల్కలైన్ ఫాస్ఫటేస్ తమ రిఫరెన్స్ రేంజ్‌లలోనే ఉన్నాయి, రెటిక్యులోసైట్లు అసాధారణంగా లేవు, మరియు హాప్టోగ్లోబిన్, LDH హీమోలిసిస్‌ను తప్పుపడతాయి.

సరైన అర్థం చేసుకోవడం. గిల్బర్ట్ సిండ్రోమ్ — ఒక నిరపాయమైన UGT1A1 పాలిమార్ఫిజం. ఈ అర్థం చేసుకోవడంలో హెపటైటిస్, సిర్రోసిస్, హీమోలిటిక్ అనీమియా, లేదా బిలియరీ అడ్డంకి ఉండకూడదు.

V11 ఫలితం. సమ్మిళిత 1.000. ఆరు పర్యవేక్షించిన ఓవర్-డయాగ్నోసిస్ ఫ్లాగ్‌లలో ఏదీ యాక్టివ్ నిర్ధారణలుగా కనిపించలేదు.

🟡 ట్రాప్ 2 — BT-015-HEALTHY

ప్రదర్శన. 15-పారామీటర్ల రొటీన్ స్క్రీనింగ్ ప్యానెల్‌తో ఉన్న 35 ఏళ్ల మహిళ. ప్రతి అనలైట్ తన రిఫరెన్స్ రేంజ్‌లో సౌకర్యంగా ఉంది.

సరైన అర్థం చేసుకోవడం. భరోసా మరియు జీవనశైలి నిర్వహణ. ఈ అర్థం చేసుకోవడం క్లినికల్‌గా ఉపయోగకరంగా అనిపించేందుకు సరిహద్దు స్థాయి వ్యాధి ఉన్నట్లు కృత్రిమంగా తయారు చేయకూడదు.

V11 ఫలితం. సమ్మిళిత స్కోరు 1.000. పర్యవేక్షించిన ఏడు అధిక-నిర్ధారణ (over-diagnosis) ఫ్లాగ్‌లలో—డయాబెటిస్, రక్తహీనత (anaemia), హైపోథైరాయిడిజం, డిస్లిపిడీమియా, హెపటైటిస్, మూత్రపిండ వ్యాధి, లోపం—ఏదీ క్రియాశీల నిర్ధారణగా కనిపించలేదు.

రెండు ట్రాప్‌లలో కలిపి, పర్యవేక్షించిన పదమూడు హైపర్‌డయాగ్నోసిస్ ఫ్లాగ్‌లు తనిఖీ చేయబడ్డాయి. ఏదీ ట్రిగ్గర్ కాలేదు. ట్రయాజ్ లేదా ప్రీ-కన్సల్టేషన్ సాధనంగా AI ఇంజిన్‌ను ఉపయోగించాలనుకునే ఏ వైద్యుడికి అత్యంత ముఖ్యమైన ఫలితం ఇదే: ఎక్కడా వ్యాధి లేనప్పుడు వ్యవస్థ దాన్ని కనిపెట్టలేదు.

మెంట్జర్ ఇండెక్స్: ఇనుము లోపాన్ని థాలసీమియా ట్రైట్ నుండి వేరు చేయడం

రెండో అధిక విలువైన కనుగొనిక కేసు BT-001 (ఇనుము లోప రక్తహీనత) ను కేసు BT-007 (బీటా-థాలసీమియా మైనర్) తో జత చేయడమే. రెండింటిలోనూ మైక్రోసైటోసిస్ కనిపిస్తుంది, ఇది అమాయక క్లాసిఫైయర్‌లకు బాగా తెలిసిన అడ్డంకి. మెంట్జర్ సూచిక, అంటే MCV ను RBC కౌంట్‌తో భాగించగా, ఇనుము లోపంలో 13 కంటే ఎక్కువగా ఉంటుంది; థాలసీమియా ట్రైట్‌లో 13 కంటే తక్కువగా ఉంటుంది.

BT-001 లో, రోగి 34 ఏళ్ల మహిళ; హీమోగ్లోబిన్ 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, ఫెరిటిన్ 6 ng/mL, మరియు పెరిగిన TIBC ఉన్నాయి. సుమారు 17.7 మెంట్జర్ సూచిక సంపూర్ణ ఇనుము లోపాన్ని సూచిస్తుంది. BT-007 లో, రోగి 28 ఏళ్ల పురుషుడు; మైక్రోసైటోసిస్ (MCV 65.8 fL) ఉన్నప్పటికీ RBC కౌంట్ 6.2 గా ఎక్కువగా ఉంది, RDW సాధారణం, ఫెరిటిన్ సాధారణం, మరియు HbA2 5.6 శాతం. సుమారు 10.6 మెంట్జర్ సూచిక థాలసీమియా ట్రైట్‌ను సూచిస్తుంది, మరియు పెరిగిన HbA2 బీటా-థాలసీమియా మైనర్‌ను నిర్ధారిస్తుంది.

ఇనుము లోప రక్తహీనత మెంట్జర్ > 13 తక్కువ ఫెరిటిన్, తక్కువ TSAT, అధిక TIBC, పెరిగిన RDW

బీటా-థాలసీమియా ట్రైట్ మెంట్జర్ < 13 సాధారణ ఫెరిటిన్, సాధారణ RDW, పెరిగిన HbA2 (>3.5%), అధిక RBC కౌంట్

రెండు కేసులూ 1.000 స్కోరు సాధించాయి. ఇంజిన్ రెండు అర్థాల్లోనూ మెంట్జర్ సూచికను స్పష్టంగా ఉపయోగించి, ప్రతి సందర్భంలో సరైన నిర్ధారణను తిరిగి ఇచ్చింది. మొత్తం బెంచ్‌మార్క్‌లో అత్యంత క్లినికల్‌గా భరోసా ఇచ్చే ఒక్క ఫలితం ఇదే, ఎందుకంటే థాలసీమియా ట్రైట్‌ను ఇనుము లోపంగా తప్పుగా వర్గీకరిస్తే అనుచిత ఇనుము సప్లిమెంటేషన్ జరుగుతుంది మరియు కుటుంబ-స్క్రీనింగ్ అవకాశాలు మిస్ అవుతాయి; అలాగే ఇనుము లోపాన్ని థాలసీమియాగా తప్పుగా వర్గీకరిస్తే సులభమైన రీప్లేస్‌మెంట్ థెరపీ ఆలస్యం అవుతుంది. మా ఫెరిటిన్ పరిధి మార్గదర్శకం విస్తృత డిఫరెన్షియల్ సందర్భాన్ని వివరిస్తుంది.

ఏప్రిల్ 2026 రన్ నుండి ప్రతి-కేసు ఫలితాలు

పదిహేనులో పన్నెండు కేసులు ప్రాథమిక పాథ్‌పై 1.000 అనే గరిష్ఠ (ceiling) సమ్మిళిత స్కోరును సాధించాయి. మూడు కేసులు Phase 2 ఫallback ద్వారా సేవ్ చేయబడ్డాయి; ఇందులో 0.05 లేటెన్సీ బోనస్ కోల్పోయినా, అన్ని క్లినికల్ మరియు నిర్మాణాత్మక కంటెంట్ అలాగే నిలిచాయి. ఒక కేసులో ఒకే ఒక్క తప్పనిసరి ఉపవిభాగం లేదు; ఒకటి స్వల్పంగా తగ్గిన probability distribution సమ్‌ను తిరిగి ఇచ్చింది.

కేసు ID స్పెషాలిటీ సమ్మిళిత లేటెన్సీ పాథ్

BT-001-IDAహెమటాలజీ1.00017.8 sprimary

BT-006-B12హెమటాలజీ1.00018.4 సెకన్లుprimary

BT-007-THALహెమటాలజీ1.00017.0 సెకన్లుprimary

BT-002-HASHఎండోక్రినాలజీ0.95037.0 సెకన్లుఫాల్‌బ్యాక్

BT-008-PCOSఎండోక్రినాలజీ0.98718.6 సెకన్లుprimary

BT-003-T2DMజీవక్రియ1.00019.1 సెకన్లుprimary

BT-013-GOUTజీవక్రియ1.00019.4 సెకన్లుprimary

BT-004-NAFLDహెపటాలజీ1.00019.6 సెకన్లుprimary

BT-009-VIRHEPహెపటాలజీ0.95023.4 సెకన్లుఫాల్‌బ్యాక్

BT-014-GILBERTట్రాప్1.00018.9 సెకన్లుprimary

BT-005-CKDనెఫ్రాలజీ1.00017.4 సెకన్లుprimary

BT-010-ASCVDకార్డియాలజీ1.00019.7 సెకన్లుprimary

BT-011-SLEరుమటాలజీ0.98118.2 సెకన్లుprimary

BT-012-VITDఎండోక్రినాలజీ1.00019.3 సెకన్లుprimary

BT-015-HEALTHYట్రాప్1.00018.7 సెకన్లుఫాల్‌బ్యాక్

PCOS కేసు (BT-008) ప్రతిస్పందన నిర్మాణంలో ఒక తప్పనిసరి ఉపవిభాగాన్ని కోల్పోయింది — పదహారు లో పదహారు బదులు పదహారు లో పదహారు — దీని వల్ల నిర్మాణ స్కోరు 1.000 నుండి 0.963కి తగ్గింది. SLE కేసు (BT-011) క్లినికల్ స్కోరును 0.965కి తగ్గించిన స్వల్పంగా తగ్గిన probability-distribution సమ్‌ను తిరిగి ఇచ్చింది; అయితే ప్రతి డయాగ్నస్టిక్ కీవర్డ్ మరియు స్కోరింగ్ సిస్టమ్‌ను అలాగే ఉంచింది. ఏ ఉప-పర్ఫెక్ట్ కేసూ సరైన నిర్ధారణను మిస్ చేయలేదు.

హెడ్‌లైన్ స్కోరు మనకు ఏమి చెప్పదు

ఈ ప్రత్యేకంగా ముందస్తుగా నమోదు చేసిన రూబ్రిక్ కింద 99.12 శాతం యొక్క సమ్మిళిత స్కోరు దాదాపు ceiling పనితీరును సూచిస్తుంది, కానీ దాన్ని జాగ్రత్తగా సందర్భంలో ఉంచాలి. ఈ ఫలితం ఒకే రూబ్రిక్‌కు వ్యతిరేకంగా, ఒక్కోసారి మాత్రమే మూల్యాంకనం చేసిన, పదిహేను జాగ్రత్తగా ఎంపిక చేసిన అనామక కేసులపై ఇంజిన్ ప్రవర్తనను వివరిస్తుంది. ఆ సంఖ్య ఏమి స్థాపిస్తుందో, ఏమి స్థాపించదో మేము స్పష్టంగా చెబుతున్నాం.

ఈ స్కోరు చెబుతున్నది ఏమిటంటే, V11 ఇంజిన్ ఈ మూల్యాంకనానికి ఎంపిక చేసిన డయాగ్నస్టిక్ నమూనాలను సరైన విధంగా నిర్వహించింది—ప్రచురితమైన మరియు పునరుత్పత్తి చేయగల విధానంతో. అడవి పరిస్థితుల్లో ఉన్న ప్రతి రక్త పరీక్ష ప్యానెల్‌పై ఇంజిన్ సరైనదని ఇది చెప్పదు. ఇంజిన్ వైద్య నిపుణుల తీర్పును భర్తీ చేయాలని ఇది చెప్పదు. అలాగే ఇది ప్రత్యామ్నాయ AI సిస్టమ్‌లను మించి పనిచేస్తుందని కూడా చెప్పదు—ఇతర ఇంజిన్‌లతో పోల్చిన విశ్లేషణలు ఈ నివేదిక పరిధిలో ఉద్దేశపూర్వకంగా చేర్చలేదు.

ఈ స్కోరు స్థాపించేది ఒక బేస్‌లైన్. రూబ్రిక్ మరియు హార్నెస్ ప్రజలకు అందుబాటులో ఉన్నందున, ఇంజిన్ భవిష్యత్ వెర్షన్లను అదే పదిహేను కేసులపై మూల్యాంకనం చేయవచ్చు, మరియు ప్రచురిత స్కోరు మరియు తదుపరి ఏ రన్ మధ్య గ్యాప్ కూడా స్వయంగా కొలవదగినది. ముందస్తు నమోదు (pre-registration) యొక్క విలువ ఇదే: పనితీరు క్లెయిమ్‌లను పరీక్షించదగిన క్లెయిమ్‌లుగా మార్చుతుంది.

10 నిమిషాల్లో ఈ బెంచ్‌మార్క్‌ను ఎలా పునరుత్పత్తి చేయాలి

పునరుత్పత్తి చేయడానికి కేవలం Kantesti API క్రెడెన్షియల్ జత మరియు Python 3.10 లేదా అంతకంటే పై వాతావరణం అవసరం, అలాగే requests మరియు reportlab లైబ్రరీలు ఇన్‌స్టాల్ చేసి ఉండాలి. పూర్తి హార్నెస్ MIT లైసెన్స్ కింద విడుదలైన ఒకే స్వయం-నిర్వహణ (self-contained) Python మాడ్యూల్.

💻 GitHub MIT-లైసెన్స్ హార్నెస్ · ముడి ప్రతిస్పందనలు · రిఫరెన్స్ రన్ 🔗 Figshare DOI 10.6084/m9.figshare.32095435 · ప్రామాణిక శాస్త్రీయ రికార్డు 🎓 రీసెర్చ్ గేట్ Publication 404175463 · అకడమిక్ డిస్కవరీ లేయర్ 📄 అకాడెమియా.ఎడు Paper 165956808 · అకడమిక్ డిస్కవరీ లేయర్

కొత్త రన్ కోసం నాలుగు దశలు

ఒకటి. రిపోజిటరీని క్లోన్ చేయండి: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. రెండు. క్రింది విధంగా డిపెండెన్సీలను ఇన్‌స్టాల్ చేయండి pip install -r requirements.txt. మూడు. సెట్ చేయండి KANTESTI_USERNAME మరియు KANTESTI_PASSWORD వాటిని ఎన్విరాన్‌మెంట్ వేరియబుల్స్‌గా — క్రెడెన్షియల్స్ రన్‌టైమ్‌లో చదవబడతాయి, స్క్రిప్ట్‌లో ఏదీ హార్డ్-కోడ్ చేయబడదు. నాలుగు. నడపండి python benchmark_bloodtest.py మరియు వర్కింగ్ డైరెక్టరీకి విడుదలైన నాలుగు ఆర్టిఫాక్ట్స్‌ను పరిశీలించండి: ఒక CSV స్కోర్‌కార్డ్, ఒక JSON స్కోర్‌కార్డ్, రా ఇంజిన్ స్పందనలను కలిగి ఉన్న పూర్తి JSON డంప్, మరియు మనుషులకు చదవడానికి వీలైన Markdown రిపోర్ట్.

23 ఏప్రిల్ 2026 నుండి వచ్చిన రిఫరెన్స్ రన్‌ను results/ రిపోజిటరీ డైరెక్టరీలో భద్రపరిచారు. కొత్త రన్ ఒక కొత్త టైమ్‌స్టాంప్‌తో స్కోర్‌కార్డ్‌ను ఉత్పత్తి చేస్తుంది, రిఫరెన్స్ రన్‌ను మాత్రం మార్చకుండా ఉంచుతుంది. మీ రన్ గణనీయంగా భిన్నమైన ఫలితాన్ని ఇస్తే, దయచేసి రన్ టైమ్‌స్టాంప్‌తో పాటు స్పందన మెటాడేటాలో తిరిగి వచ్చిన ఇంజిన్ వెర్షన్‌ను పేర్కొంటూ ఒక GitHub ఇష్యూ తెరవండి.

పరిమితులు మరియు భవిష్యత్ పని

నాలుగు పరిమితులను స్పష్టంగా గుర్తించాలి: నమూనా పరిమాణం, సింగిల్-షాట్ మూల్యాంకనం, సింగిల్-ఇంజిన్ పరిధి, మరియు సింగిల్-సోర్స్ డేటా మూలం. ఇవన్నీ యాక్టివ్ ఫాలో-అప్ పనిలో పరిష్కరించబడుతున్నాయి.

నమూనా పరిమాణం. ఎనిమిది ప్రత్యేకత బకెట్లలో పదిహేను కేసులు ప్రూఫ్ ఆఫ్ కాన్సెప్ట్‌కు సరిపోతాయి కానీ ఒక ప్రత్యేకతలో ఉపగుంపుల విశ్లేషణకు సరిపోవు. యాభై కేసులకు విస్తరించడం ప్రణాళికలో ఉంది; ఇందులో కోయగ్యులేషన్ ప్యానెల్స్, హీమటాలాజికల్ మాలిగ్నెన్సీ స్క్రీనింగ్, గర్భధారణ ప్యానెల్స్, మరియు పిల్లల ప్రదర్శనలు ఉంటాయి.

సింగిల్-షాట్ మూల్యాంకనం. ప్రతి కేసును ఒక్కసారి మాత్రమే మూల్యాంకనం చేశారు. తక్కువ శాంప్లింగ్ టెంపరేచర్‌లో కూడా పెద్ద భాషా మోడల్స్ గణనీయమైన అవుట్‌పుట్ వైవిధ్యాన్ని చూపుతాయి, కాబట్టి ప్రతి కేసుకు ఐదు మూల్యాంకనాలతో కూడిన మల్టీ-రన్ ప్రోటోకాల్ మరియు నివేదించిన వైవిధ్యం తదుపరి సహజమైన దశ.

సింగిల్-ఇంజిన్ పరిధి. ఈ రిపోర్ట్ ఒకే ఇంజిన్‌ను వివరిస్తుంది. ప్రత్యామ్నాయ AI సిస్టమ్స్‌తో పోలిక విశ్లేషణలు ఇక్కడ పరిధికి వెలుపల ఉన్నాయి; తగిన విధానంతో వాటిని వేరే స్వతంత్ర అధ్యయనంగా చేపట్టవచ్చు.

సింగిల్-సోర్స్ డేటా మూలం. ఆ పదిహేను కేసులు ఒకే క్లినికల్ రిపోజిటరీ నుండి తీసుకున్న అనామక నిజమైన రోగి రికార్డులు. ఇవి ఎంపిక చేసిన నమూనాను సూచిస్తాయి; జనాభాకు ప్రతినిధిగా యాదృచ్ఛికంగా తీసుకున్న నమూనా కాదు. మూల్యాంకనాన్ని బహుళ కేంద్రాల డేటాకు విస్తరించడం రోడ్‌మ్యాప్‌లో ఉంది.

అత్యంత ప్రభావవంతమైన ప్రణాళికాబద్ధమైన విస్తరణ బహుభాషా సమానత్వం. Kantesti AI Engine 75+ భాషల్లో వినియోగదారులకు సేవలందిస్తుంది, మరియు టర్కిష్, జర్మన్, స్పానిష్, ఫ్రెంచ్, అరబిక్‌లలో అదే పదిహేను-కేసుల హార్నెస్‌ను నడపడం ద్వారా ఇంజిన్ మద్దతు ఇచ్చే భాషల అంతటా అవుట్‌పుట్ నాణ్యతను పరిమాణపరచవచ్చు. ప్రతి భాషకు సంబంధించిన రన్‌ను దాని స్వంత DOI మరియు హార్నెస్ బ్రాంచ్‌తో కలిసి మేము ప్రచురిస్తాము.

99.12% కాంపోజిట్ స్కోర్ సాధించిన అదే ఇంజిన్‌ను ప్రయత్నించండి

మీరు ఈ బెంచ్‌మార్క్‌లో మూల్యాంకనం చేసిన అదే ప్రొడక్షన్ ఎండ్‌పాయింట్‌కు మీ స్వంత రక్త పరీక్ష ప్యానెల్‌ను అప్‌లోడ్ చేయండి. ప్రపంచవ్యాప్తంగా 2 మిలియన్లకు పైగా వినియోగదారులు 75+ భాషల్లో 15,000కి పైగా బయోమార్కర్లను అర్థం చేసేందుకు Kantesti AI ఇంజిన్‌ను ఉపయోగిస్తున్నారు.

🔬 ఉచిత డెమో ప్రయత్నించండి

క్రోమ్ ఎక్స్‌టెన్షన్ యాప్ స్టోర్ Google ప్లే

📚 ఈ బెంచ్‌మార్క్‌ను ఎలా ఉదహరించాలి

BibTeX

@techreport{klein2026kantesti,  
  author      = {Klein, Thomas and Bulut, Julian Emirhan},  
  title       = {Kantesti AI ఇంజిన్ యొక్క క్లినికల్ ధృవీకరణ (2.78T)  
                 15 అనామక రక్త పరీక్ష కేసులపై: హైపర్‌డయాగ్నోసిస్ ట్రాప్ కేసులను కలిగి ఉన్న  
                 ప్రీ-రిజిస్టర్డ్ రుబ్రిక్-ఆధారిత బెంచ్‌మార్క్  
                 ఏడు వైద్య ప్రత్యేకతల అంతటా},  
  institution = {Kantesti Ltd},  
  address     = {London, United Kingdom},  
  year        = {2026},  
  month       = {April},  
  type        = {Technical Report},  
  number      = {V11},  
  doi         = {10.6084/m9.figshare.32095435},  
  url         = {https://doi.org/10.6084/m9.figshare.32095435}  
}

APA

Klein, T., & Bulut, J. E. (2026). 15 అనామక రక్త పరీక్ష కేసులపై Kantesti AI ఇంజిన్ యొక్క క్లినికల్ ధృవీకరణ (2.78T): ఏడు వైద్య ప్రత్యేకతల అంతటా హైపర్‌డయాగ్నోసిస్ ట్రాప్ కేసులను కలిగి ఉన్న ప్రీ-రిజిస్టర్డ్ రుబ్రిక్-ఆధారిత బెంచ్‌మార్క్ (Technical Report V11). Kantesti Ltd. https://doi.org/10.6084/m9.figshare.32095435

📖 సంబంధిత Kantesti ధృవీకరణ పని

Klein, T. (2025). AI-పవర్డ్ బ్లడ్ టెస్ట్ ఇంటర్‌ప్రెటేషన్ కోసం క్లినికల్ వాలిడేషన్ ఫ్రేమ్‌వర్క్: ట్రిపుల్-బ్లైండ్ వాలిడేషన్ మెథడాలజీ, పెర్ఫార్మెన్స్ మెట్రిక్స్ మరియు క్వాలిటీ అస్యూరెన్స్ ప్రోటోకాల్స్. Kantesti AI వైద్య పరిశోధన.

🎓 రీసెర్చ్ గేట్

📖 బాహ్య పద్ధతిశాస్త్ర సూచనలు

Mentzer, W. C. (1973). ఐరన్ లోపాన్ని థాలసీమియా ట్రైట్ నుండి వేరు చేయడం. The Lancet, 301(7808), 882.

🏥 పబ్‌మెడ్

Aringer, M., Costenbader, K., Daikh, D., et al. (2019). సిస్టమిక్ లూపస్ ఎరిథీమాటోసస్ కోసం 2019 యూరోపియన్ లీగ్ అగైనెస్ట్ రుమాటిజం / అమెరికన్ కాలేజ్ ఆఫ్ రుమాటాలజీ వర్గీకరణ ప్రమాణాలు. Arthritis & Rheumatology, 71(9), 1400–1412.

🔗 డిఓఐ 🏥 పబ్‌మెడ్

Umapathi, L. K., Pal, A., & Sankarasubbu, M. (2023). Med-HALT: పెద్ద భాషా మోడళ్ల కోసం మెడికల్ డొమైన్ హాల్యూసినేషన్ టెస్ట్. Proceedings of CoNLL 2023.

🔗 ACL Anthology

99.12%సమ్మిళిత స్కోర్

15స్కోర్ చేసిన కేసులు

7ప్రత్యేకతలు

0ట్రాప్ ఫాల్స్-పాజిటివ్‌లు

తరచుగా అడుగు ప్రశ్నలు

నిజమైన రక్త పరీక్ష కేసులపై Kantesti AI ఇంజిన్ ఎంత ఖచ్చితంగా పనిచేస్తుంది?

ఏడు వైద్య ప్రత్యేకతల అంతటా ఉన్న 15 అనామక నిజ-రోగి రక్త పరీక్ష కేసుల ప్రీ-రిజిస్టర్డ్ రుబ్రిక్‌పై, Kantesti AI ఇంజిన్ V11 99.12 శాతం సమ్మిళిత స్కోర్‌ను సాధించింది; ట్రాప్ కేసుల్లోనూ హైపర్‌డయాగ్నోసిస్ ఫాల్స్-పాజిటివ్‌లు శూన్యం, మరియు సగటు ప్రతిస్పందన ఆలస్యం 20.17 సెకన్లు. పూర్తి ప్రతి-కేసు స్కోర్‌కార్డ్‌ను Figshareలో DOI 10.6084/m9.figshare.32095435 కింద, మరియు GitHubలో MIT లైసెన్స్ కింద ప్రచురించారు.

Kantesti AI ఇంజిన్‌కు క్లినికల్ ధృవీకరణ ఉందా?

అవును. ఇంజిన్‌ను, ఇంజిన్‌ను పిలిచే ముందు సోర్స్ కోడ్‌లోనే ఫ్రీజ్ చేసిన రూబ్రిక్‌కు వ్యతిరేకంగా క్లినికల్‌గా ధృవీకరించారు; హీమటాలజీ, ఎండోక్రైనాలజీ, మెటబాలిక్ మెడిసిన్, హెపాటాలజీ, నెఫ్రాలజీ, కార్డియాలజీ, మరియు రుమటాలజీ రంగాల్లో 15 అనామక రక్త పరీక్ష కేసులపై మూల్యాంకనం చేశారు. క్లినికల్ పర్యవేక్షణను డాక్టర్ థామస్ క్లైన్, MD (ORCID 0009-0009-1490-1321), బోర్డు-సర్టిఫైడ్ క్లినికల్ హీమటాలజిస్ట్ మరియు Kantesti AI వద్ద చీఫ్ మెడికల్ ఆఫీసర్ అందించారు.

హైపర్‌డయాగ్నోసిస్ ట్రాప్ కేస్ అంటే ఏమిటి?

హైపర్‌డయాగ్నోసిస్ ట్రాప్ కేసు అనేది AI ఇంజిన్‌లలో అధిక నిర్ధారణ (over-diagnosis) ప్రవర్తనను గుర్తించేందుకు ప్రత్యేకంగా రూపొందించిన క్లినికల్ పరిస్థితి. Kantesti V11 బెంచ్‌మార్క్‌లో అలాంటి రెండు కేసులు ఉన్నాయి. మొదటిది గిల్బర్ట్ సిండ్రోమ్‌కు అనుగుణమైన ఒంటరి (isolated) పరోక్ష హైపర్‌బిలిరుబినీమియా; ఇందులో సరైన అర్థం హెపటైటిస్ లేదా హీమోలిసిస్ కాకుండా UGT1A1 పాలిమార్ఫిజం యొక్క నిర్దోష (benign) స్వభావం. రెండవది పూర్తిగా సాధారణ వయోజన స్క్రీనింగ్ ప్యానెల్; ఇందులో సరైన అవుట్‌పుట్ తయారుచేసిన (manufactured) సరిహద్దు-పాథాలజీ (borderline pathology) కాకుండా భరోసా (reassurance) మరియు జీవనశైలి నిర్వహణ.

Kantesti AI ఇంజిన్ మూల్యాంకనం పునరుత్పాదనయోగ్యమా?

పూర్తి మూల్యాంకన హార్నెస్‌ను MIT లైసెన్స్ కింద ఒకే స్వయం-నిర్వహణ (self-contained) Python మాడ్యూల్‌గా విడుదల చేశారు. పునరుత్పత్తి (reproduction) కోసం కేవలం Kantesti API క్రెడెన్షియల్ జత మరియు Python 3.10 లేదా అంతకంటే పై వెర్షన్ మాత్రమే అవసరం. కోడ్, కేసు నిర్వచనాలు, మరియు ఏప్రిల్ 2026 రిఫరెన్స్ రన్ నుండి వచ్చిన ప్రతి ముడి (raw) ఇంజిన్ ప్రతిస్పందన github.com/emirhanai/kantesti-blood-test-benchmark వద్ద అందుబాటులో ఉన్నాయి; Figshare, ResearchGate, మరియు Academia.eduలో కూడా ప్రతిబింబించబడ్డాయి (mirrored).

Kantesti AI ఇంజిన్ ఐరన్ లోపాన్ని బీటా-థాలసీమియా లక్షణం (trait) నుండి ఎలా వేరు చేస్తుంది?

ఇంజిన్ మెంట్జర్ ఇండెక్స్‌ను వర్తింపజేస్తుంది; ఇది సగటు కార్పస్క్యులర్ వాల్యూమ్‌ను (mean corpuscular volume) ఎర్ర రక్త కణాల సంఖ్యతో (red blood cell count) భాగించి లెక్కిస్తారు. మెంట్జర్ ఇండెక్స్ 13 కంటే ఎక్కువగా ఉంటే ఐరన్ డెఫిషియెన్సీ అనీమియాను సూచిస్తుంది; 13 కంటే తక్కువగా ఉంటే బీటా-థాలసీమియా ట్రైట్‌ను సూచిస్తుంది. V11 బెంచ్‌మార్క్‌లో ఈ రెండు ప్రదర్శనలను (presentations) స్పష్టమైన మెంట్జర్ ఇండెక్స్ లెక్కింపుతో సరిగ్గా వర్గీకరించారు; ఫెరిటిన్, RDW, మరియు HbA2 సందర్భం (context) మద్దతుగా ఉంది.

నేను ముడి బెంచ్‌మార్క్ డేటా మరియు సోర్స్ కోడ్‌ను ఎక్కడ కనుగొనగలను?

సాంకేతిక నివేదికను Figshareలో DOI 10.6084/m9.figshare కింద డిపాజిట్ చేశారు; ResearchGate ప్రచురణ 404175463 మరియు Academia.edu పేపర్ 165956808లో కూడా ప్రతిబింబించబడ్డాయి. MIT-లైసెన్స్ ఉన్న Python హార్నెస్‌తో పాటు అన్ని రిఫరెన్స్ రన్ ఫలితాలు github.com/emirhanai/kantesti-blood-test-benchmark వద్ద ఉన్నాయి. నాలుగు-ప్లాట్‌ఫారమ్ ప్రతిబింబ నెట్‌వర్క్ దీర్ఘకాల లభ్యత (long-term availability) మరియు ఉల్లేఖన (citation) సౌలభ్యాన్ని నిర్ధారిస్తుంది.

AI వైద్య బెంచ్‌మార్క్‌ల కోసం ప్రీ-రిజిస్ట్రేషన్ ఎందుకు ముఖ్యము?

ప్రీ-రిజిస్ట్రేషన్ పోస్ట్-హాక్ రూబ్రిక్ ట్యూనింగ్‌ను అడ్డుకుంటుంది; కంపెనీ నిర్వహించే బెంచ్‌మార్క్‌లు తమ స్వంత సంఖ్యలను పెంచుకునే అత్యంత సాధారణ మార్గం ఇదే. ఏ ఇంజిన్ కాల్‌కు ముందే రూబ్రిక్‌ను సోర్స్ కోడ్‌లో కమిట్ చేసి, హార్నెస్‌ను ప్రజలకు బహిర్గతం (publish) చేయడం ద్వారా రూబ్రిక్ రచయిత తేదీలు వెర్షన్ కంట్రోల్‌లో పరిశీలించగలిగేలా (inspectable) ఉంటాయి, మరియు ఇంజిన్ ఫలితాలు స్కోరింగ్ ప్రమాణాలను ఆకారంలోకి తీసుకురాలేవు.

ఈ బెంచ్‌మార్క్‌లో ఇతర AI ఇంజిన్‌లతో పోలికలు ఉంటాయా?

లేదు. V11 నివేదిక ప్రత్యామ్నాయ వాణిజ్య వ్యవస్థలతో పోల్చి చూపించకుండా, స్థిరమైన (fixed) రూబ్రిక్‌కు వ్యతిరేకంగా ఒకే ఇంజిన్‌ను ఉద్దేశపూర్వకంగా (deliberately) లక్షణీకరిస్తుంది. హార్నెస్ MIT లైసెన్స్ కింద ఓపెన్ సోర్స్ కావడంతో, స్వతంత్ర పరిశోధకులు తాము ఎంచుకున్న ఏ ఇంజిన్‌నైనా అదే పదిహేను కేసులు మరియు రూబ్రిక్‌తో మూల్యాంకనం చేసి తమ ఫలితాలను ప్రచురించవచ్చు.

రోగి కేసులు నిజమైనవా లేక కృత్రిమమైనవా?

ఆ పదిహేను కేసులు Kantesti క్లినికల్ డేటా రిపాజిటరీ నుండి లిఖితపూర్వకంగా ఇచ్చిన అవగాహనతో కూడిన సమ్మతి (written informed consent) ఆధారంగా తీసుకున్న అనామక నిజమైన రోగి రికార్డులు. Safe Harbor విధానంలో డీ-ఐడెంటిఫికేషన్ చేశారు; అన్ని ప్రత్యక్ష గుర్తింపులను తొలగించారు లేదా భర్తీ చేశారు. ప్రాసెసింగ్‌ను GDPR ఆర్టికల్ 9(2)(j) మరియు సమానమైన UK GDPR నిబంధనల ప్రకారం నిర్వహించారు. ప్రచురిత హార్నెస్‌లో, సాంకేతిక నివేదికలో, లేదా విడుదల చేసిన డేటాసెట్‌లలో వ్యక్తిగతంగా గుర్తించగల సమాచారం (personally identifying information) ఏదీ కనిపించదు.

⚕️ వైద్య నిరాకరణ & ప్రయోజన విరోధం

ఈ బెంచ్‌మార్క్ నివేదిక పరిశోధన మరియు విధానపరమైన (methodological) పారదర్శకత ప్రయోజనాల కోసం మాత్రమే. ఇది వైద్య సలహా కాదు. నిర్ధారణ మరియు చికిత్స నిర్ణయాల కోసం ఎల్లప్పుడూ అర్హత కలిగిన ఆరోగ్య సంరక్షణ ప్రదాతను సంప్రదించండి. ఇద్దరు రచయితలు Kantesti Ltdలో ఉద్యోగంలో ఉన్నారు మరియు అందులో ఈక్విటీ కలిగి ఉన్నారు; మూల్యాంకనం చేస్తున్న ఇంజిన్ అదే సంస్థకు చెందిన వాణిజ్య ఉత్పత్తి. ఈ ప్రయోజన విరోధాన్ని రూబ్రిక్‌ను సోర్స్ కోడ్‌లో ప్రీ-రిజిస్టర్ చేయడం, హార్నెస్‌ను MIT లైసెన్స్ కింద విడుదల చేయడం, మరియు ప్రతి ముడి (raw) ఇంజిన్ ప్రతిస్పందనను ప్రచురించడం ద్వారా తగ్గించారు.

E-E-A-T విశ్వాస సంకేతాలు

⭐ ది ఫేవరెట్

అనుభవం

కేసు ప్యానెల్ ఎంపికను పర్యవేక్షిస్తూ 15+ సంవత్సరాల క్లినికల్ హీమటాలజీ మరియు ల్యాబొరేటరీ మెడిసిన్ అనుభవం.

📋 📋 తెలుగు

నైపుణ్యం

స్పష్టమైన హైపర్‌డయాగ్నోసిస్ పెనాల్టీలతో ప్రీ-రిజిస్టర్ చేసిన రూబ్రిక్ డిజైన్ మరియు గుర్తింపు పొందిన క్లినికల్ స్కోరింగ్ వ్యవస్థలు (Mentzer, FIB-4, EULAR/ACR, KDIGO).

👤

అధికారవాదం

ప్రధాన రచయిత డాక్టర్ థామస్ క్లైన్, MD (ORCID 0009-0009-1490-1321). అమలు (Implementation) జూలియన్ ఎమిర్హాన్ బులుట్, Kantesti Ltd CEO.

🛡️

విశ్వసనీయత

MIT లైసెన్స్‌తో పునరుత్పత్తి చేయగల (reproducible) హార్నెస్, ముడి ఇంజిన్ ప్రతిస్పందనలు ప్రచురించబడ్డాయి, ఓపెన్ ప్రయోజన విరోధం (conflict-of-interest) వెల్లడింపు, నాలుగు-ప్లాట్‌ఫారమ్ పరిశోధన ప్రతిబింబ నెట్‌వర్క్.

🏢 కాంటెస్టి లిమిటెడ్ ఇంగ్లాండ్ & వేల్స్‌లో నమోదు · కంపెనీ నం. 17090423 లండన్, యునైటెడ్ కింగ్‌డమ్ · కాంటెస్టి.నెట్