ເປັນຫຍັງ benchmark ນີ້ຈຶ່ງມີ ແລະມັນທົດສອບຫຍັງ

ການວິເຄາະເລືອດດ້ວຍ AI ຖືກນໍາໃຊ້ຫຼາຍຂຶ້ນໃນການໃຊ້ງານຂອງຜູ້ບໍລິໂພກ ແລະ ດ້ານການແພດ, ແຕ່ກອບການປະເມີນທີ່ສາມາດທົດຊ້ໍາໄດ້ ທີ່ຖືກປັບໃຫ້ເໝາະກັບການແພດທາງຫ້ອງທົດລອງ ຍັງບໍ່ຄ່ອຍມີ. ຄໍາຖາມທີ່ສໍາຄັນທີ່ສຸດໃນສະພາບນີ້ ບໍ່ແມ່ນຄໍາຖາມທີ່ຖືກຄອບຄຸມໂດຍ benchmark ການຕອບຄໍາຖາມທາງການແພດທົ່ວໄປ: ເຄື່ອງຈັກ (engine) ສາມາດແຍກ iron deficiency ອອກຈາກ thalassaemia trait ໄດ້ບໍ ເມື່ອ MCV ມີຄ່າຄືກັນ, ມັນຈະ over-diagnose Gilbert's syndrome ເປັນ hepatitis ບໍ, ແລະ ມັນສ້າງພະຍາດຂຶ້ນໃນແຜນກວດທີ່ປົກກະຕິສົມບູນບໍ?

ແຜນວຽກການກຳນົດລະບຽບລ່ວງໜ້າ (pre-registered) ທີ່ສະແດງວ່າເຄື່ອງຈັກ Kantesti AI ຖືກປະເມີນຢ່າງໃດ ທຽບກັບເກນຄະແນນທີ່ຖືກແຊ່ແຂງ (frozen)
ຮູບທີ 1: ໂຄງສ້າງຂອງ benchmark — ທຸກກໍລະນີ, ທຸກຄໍາສໍາຄັນ, ທຸກລະບົບການໃຫ້ຄະແນນ ຖືກກໍານົດໃນ source code ກ່ອນທີ່ engine ຈະເຫັນ PDF ສັກເອກ. ການປັບຄ່າ rubric ພາຍຫຼັງ (post-hoc rubric tuning) ເປັນໄປບໍ່ໄດ້ຕາມການອອກແບບ.

ການກວດເລືອດແບບກຸ່ມດຽວມັກຈະມີຂໍ້ມູນພຽງພໍທີ່ສາມາດຮອງຮັບການຕີຄວາມໄດ້ຫຼາຍຢ່າງທີ່ແຂ່ງກັນ, ແລະວຽກຂອງແພດຜູ້ຕີຄວາມແມ່ນການຊັ່ງນ້ຳໜັກການຕີຄວາມເຫຼົ່ານັ້ນທຽບກັນ ບໍ່ແມ່ນການຄົ້ນຫາຄຳຕອບຈາກປຶ້ມຕຳລາ. ເຄື່ອງຈັກທີ່ເຮັດໄດ້ດີໃນກໍລະນີຕົວຢ່າງຈາກຕຳລາ ຍັງສາມາດລົ້ມເຫຼວໃນກໍລະນີທີ່ສຳຄັນທີ່ສຸດ: ກັບດັກການວິນິດໄຈແຍກພະຍາດ, ຕົວແປທີ່ບໍ່ເປັນອັນຕະລາຍທີ່ເບິ່ງອັນຕະລາຍເມື່ອເບິ່ງແບບດຽວ, ແລະ ກຸ່ມການກວດທີ່ປົກກະຕິຢ່າງສົມບູນ ທີ່ລໍ້ໃຫ້ຜູ້ຊ່ວຍທີ່ໝັ້ນໃຈສ້າງພະຍາດຂຶ້ນມາ.

ເກນມາດຕະຖານນີ້ຖືກສ້າງຂຶ້ນໂດຍອີງໃສ່ຮູບແບບຄວາມລົ້ມເຫຼວເຫຼົ່ານັ້ນໂດຍກົງ. ທັງ 15 ກໍລະນີ ຖືກເລືອກເພື່ອຄຸນສົມບັດການວິນິດໄຈທີ່ສະເພາະ: microcytosis ທີ່ຂາດເຫຼັກ ທີ່ຕ້ອງແຍກໃຫ້ຊັດຈາກ beta-thalassaemia trait ທີ່ມີ mean corpuscular volume ຄ້າຍກັນ, ການສະແດງຂອງ Gilbert's syndrome ທີ່ຄວາມຜິດປົກກະຕິພຽງແຕ່ແມ່ນ isolated indirect hyperbilirubinaemia, ແລະ ກຸ່ມການກວດຄັດກອງ 15 ພາລາມິເຕີ ທີ່ທຸກຕົວວິເຄາະຢູ່ໃນຊ່ວງອ້າງອີງຂອງຕົນ. ເກນການປະເມີນຈະໃຫ້ຄະແນນແກ່ເຄື່ອງຈັກທີ່ອ່ານແຕ່ລະກໍລະນີຕາມເງື່ອນໄຂຂອງມັນເອງ ແລະຈະຫັກຄະແນນໃຫ້ເຄື່ອງຈັກທີ່ພະຍາຍາມສະຫຼຸບການວິນິດໄຈຢ່າງໝັ້ນໃຈ ໃນບ່ອນທີ່ບໍ່ມີການວິນິດໄຈແນວນັ້ນທີ່ຄວນຈະຮອງຮັບ.

ໃນນາມຂອງ Thomas Klein, MD, ຂ້າພະເຈົ້າເລືອກຊຸດກໍລະນີນີ້ ເພາະວ່ານີ້ແມ່ນຮູບແບບທີ່ຂ້າພະເຈົ້າເຫັນຜູ້ຊ່ວຍດ້ານການແພດ-ຫ້ອງທົດລອງ ເຮັດຜິດພາດບໍ່ເລືອກຫຼາຍທີ່ສຸດ. ຄວາມລົ້ມເຫຼວທີ່ແພງ ບໍ່ແມ່ນ "ພາດພະຍາດທີ່ຫາຍາກ" — ແຕ່ແມ່ນການປະດິດພະຍາດປົກກະຕິໃນຄົນເຈັບທີ່ບໍ່ໄດ້ມີພະຍາດນັ້ນ. ຂອງພວກເຮົາ ການກວດສອບທາງການແພດ hub ອະທິບາຍກອບລວມທີ່ກວ້າງກວ່າ; ໜ້ານີ້ອະທິບາຍຜົນທີ່ນຳໄປໃຊ້ຂອງມັນກັບເຄື່ອງຈັກ V11.

ການທົດສອບອ້າງອີງລ່າສຸດ — V11 (ເດືອນເມສາ 2026)

ການທົດສອບອ້າງອີງຂອງເດືອນເມສາ 2026 ສຳລັບ Kantesti AI Engine V11 ໄດ້ຜະລິດຄະແນນລວມເປັນ 99.12% ໃນເກນການປະເມີນ 15 ກໍລະນີທີ່ລົງທະບຽນໄວ້ກ່ອນ. ທັງສອງກໍລະນີກັບດັກການວິນິດໄຈເກີນຈຳນວນ ໄດ້ຄະແນນຢູ່ທີ່ຂີດສູງ. ດັດຊະນີ Mentzer ຖືກນຳໃຊ້ຢ່າງຖືກຕ້ອງໃນການແຍກຄວາມຂາດເຫຼັກກັບ thalassaemia.

ຄະແນນລວມ 99.12% 15 ຈາກ 15 ກໍລະນີ ໄດ້ຄະແນນ
0.998 ຄະແນນດ້ານໂຄງສ້າງ
0.998 ຄະແນນດ້ານຄວາມຖືກຕ້ອງທາງຄລີນິກ
20.17 s ຄ່າເວລາລ່າຊ້າສະເລ່ຍ
0 / 13 ການກວດຜິດແບບ false-positives ຂອງກັບດັກ

ສູດຄະແນນລວມປະກອບດ້ວຍ 3 ສ່ວນ: ຄວາມສອດຄ່ອງດ້ານໂຄງສ້າງ ກັບ 7 ພາກສ່ວນລາຍງານທີ່ຕ້ອງມີ ແລະ 16 ພາກສ່ວນຍ່ອຍທີ່ຕ້ອງມີ, ຄວາມຖືກຕ້ອງທາງຄລີນິກ ວັດແທກເປັນ keyword recall ບວກກັບ scoring-system recall ບວກກັບການກວດຄວາມຖືກຕ້ອງຂອງ probability-distribution, ແລະ ເວລາຕອບກັບ ທຽບກັບເປົ້າໝາຍ 20 ວິນາທີ ສຳລັບ primary-path service-level. ການແຍກຢ່າງລະອຽດຖືກສະແດງໃນສູດເກນການປະເມີນດ້ານລຸ່ມ.

ຄະແນນລວມ = 0.35 × ດ້ານໂຄງສ້າງ + 0.55 × ດ້ານຄລີນິກ + 0.10 × ດ້ານເວລາລ່າຊ້າ

ຈຸດຫວ່າງທີ່ເຫຼືອ 0.88 ເປີເຊັນຂອງ headroom ທີ່ເຫຼືອຈະແຕກອອກເກືອບທັງໝົດເປັນການສູນເສຍດ້ານ latency — ການເອີ້ນ fallback ຂອງ Phase 2 ຈຳນວນ 3 ຄັ້ງ ແຕ່ລະຄັ້ງທີ່ມີ composite ຕ່ຳກວ່າ -0.05 ປະກອບສ່ວນປະມານ 0.60 ຂອງການຂາດເສຍ 0.88 ຈຸດ — ແທນທີ່ຈະເປັນເນື້ອໃນທາງຄລີນິກ. ເຄື່ອງຈັກບໍ່ໄດ້ພາດການວິນິດໄຊທີ່ຖືກຕ້ອງໃນທັງ 15 ກໍລະນີ; ບ່ອນທີ່ບົກພ່ອງ ມັນເຮັດໂດຍໃຊ້ເວລາດົນກວ່າເປົ້າໝາຍ 20 ວິນາທີ ຂອງ primary-path ເລັກນ້ອຍ ໃນຈຳນວນນ້ອຍຂອງການເອີ້ນ.

ສິບຫ້າກໍລະນີ ຂ້າມ 7 ສາຂາທາງການແພດ

ກະດານກໍລະນີຄອບຄຸມ 7 ສາຂາ — ເຮມາໂຕໂລຢີ, ເອນໂດຄຣິໂນໂລຢີ, ຢາດ້ານ metabolic, ເຮປາໂຕໂລຢີ, ເນຟໂຟໂລຢີ, ຄາດິໂອໂລຢີ, ຣູມາໂຕໂລຢີ — ພ້ອມກັບ 2 ກໍລະນີກັກກັນ hyperdiagnosis ທີ່ອຸທິດໃຫ້ໂດຍສະເພາະ. ແຕ່ລະກໍລະນີແມ່ນບັນທຶກຄົນເຈັບຈິງທີ່ຖືກບໍ່ລະບຸຕົວຕົນ (anonymised) ທີ່ດຶງມາຈາກຄັງຂໍ້ມູນທາງຄລີນິກ Kantesti ພາຍໃຕ້ການໃຫ້ຄວາມຍິນຍອມທາງຂຽນຢ່າງມີຂໍ້ມູນຄົບຖ້ວນ.

ແຜນທີ່ການຄຸ້ມຄອງຂອງກໍລະນີກວດເລືອດທີ່ບໍ່ລະບຸຕົວຕົນ 15 ກໍລະນີ ທີ່ແຈກຢາຍຂ້າມ 7 ສາຂາການແພດ ພ້ອມກັບກໍລະນີກັບດັກ hyperdiagnosis
ຮູບທີ 2: ການແຈກຈ່າຍກໍລະນີຂອງເຮມາໂຕໂລຢີ, ເອນໂດຄຣິໂນໂລຢີ, ຢາດ້ານ metabolic, ເຮປາໂຕໂລຢີ, ເນຟໂຟໂລຢີ, ຄາດິໂອໂລຢີ, ຣູມາໂຕໂລຢີ, ພ້ອມກັບ 2 ກໍລະນີກັກກັນ — ໂຣກ Gilbert's syndrome ແລະ ແຜງກວດຄັດກອງທີ່ປົກກະຕິສົມບູນ.

ການບໍ່ລະບຸຕົວຕົນ (De-identification) ໄດ້ດຳເນີນພາຍໃຕ້ວິທີ Safe Harbor: ຕົວລະບຸໂດຍກົງທັງໝົດຖືກລົບອອກ ຫຼື ທົດແທນ, ແລະ ແຕ່ລະບັນທຶກໄດ້ຖືກກຳນົດລະຫັດກໍລະນີພາຍໃນທີ່ເປັນ benchmark ໃນຮູບແບບ BT-NNN-LABEL. ການປະມວນຜົນໄດ້ດຳເນີນຕາມ GDPR ມາດຕາ 9(2)(j) ສຳລັບການຄົ້ນຄວ້າທາງວິທະຍາສາດ ພ້ອມກັບມາດຕະການປົກປ້ອງທີ່ເໝາະສົມ, ແລະ ຂໍ້ກຳນົດ UK GDPR ທີ່ເທົ່າທຽມກັນ. ບໍ່ມີຂໍ້ມູນທີ່ລະບຸຕົວບຸກຄົນ (personally identifying information) ປາກົດຢູ່ບ່ອນໃດໃນ harness ທີ່ຖືກເຜີຍແຜ່, ລາຍງານທາງວິຊາການ, ຫຼື ຊຸດຂໍ້ມູນທີ່ປ່ອຍອອກ.

ເຮມາໂຕໂລຢີ (3) BT-001, BT-006, BT-007 ພາວະເລືອດຈາງຈາກຂາດເຫຼັກ (Iron deficiency anaemia) · ຂາດວິຕາມິນ B12 · ເບຕ້າ-ธາລັດຊີເມຍສ໌ ຂັ້ນນ້ອຍ (Beta-thalassaemia minor)
ເອນໂດຄຣິໂນໂລຢີ (3) BT-002, BT-008, BT-012 ໂຣກ Hashimoto's thyroiditis · PCOS ພ້ອມການຕ້ານອິນຊູລິນ · ຂາດວິຕາມິນດີຮ້າຍແຮງ
Metabolic (2) BT-003, BT-013 T2DM ພ້ອມໂຣກ metabolic syndrome · Hyperuricaemia ພ້ອມຄວາມສ່ຽງຂອງ gout
ເຮປາໂຕໂລຢີ (2) BT-004, BT-009 NAFLD / NASH · ຕັບອັກເສບໄວຣັດສຸກເສີນ
ເນຟໂຟໂລຢີ · ຄາດິໂອໂລຢີ · ຣູມາໂຕໂລຢີ (3) BT-005, BT-010, BT-011 CKD ຂັ້ນທີ 3 · ໄຂມັນໃນເລືອດທີ່ກໍ່ໃຫ້ເກີດ atherogenic dyslipidaemia · Systemic lupus erythematosus
ກໍລະນີກັກກັນ (2) BT-014, BT-015 Gilbert's syndrome (isolated indirect hyperbilirubinaemia) · ແຜງກວດຄັດກອງຜູ້ໃຫຍ່ທີ່ປົກກະຕິສົມບູນ

ເປັນຫຍັງການແຈກຈ່າຍນີ້ຈຶ່ງເປັນພິເສດ

ວິຊາການເລືອດ (Hematology) ໄດ້ສາມກໍລະນີ ເພາະວ່າການຈຳແນກແບບ microcytic ແລະ macrocytic ແມ່ນກັບດັກທີ່ມີປະລິມານສູງສຸດໃນການປະຕິບັດງານຫ້ອງທົດລອງຕົວຈິງ. ວິຊາຕໍ່ມະນຸດ (Endocrinology) ໄດ້ສາມກໍລະນີ ເພາະວ່າການສະແດງອາການຂອງ Hashimoto's, PCOS, ແລະ ຂາດວິຕາມິນດີ ມີຮູບແບບການວິນິດໄຊທີ່ແຕກຕ່າງກັນ (ຂັບເຄື່ອນໂດຍ autoantibody, ຂັບເຄື່ອນໂດຍອັດຕາຮໍໂມນ, ແລະ ຂັບເຄື່ອນໂດຍຕົວຊີ້ດຽວ). ສາຂາທີ່ມີພຽງກໍລະນີດຽວຍັງມີຄວາມໝາຍ ເພາະແຕ່ລະຢ່າງຂອງ CKD, ຄວາມສ່ຽງ ASCVD, ແລະ SLE ມີລະບົບຄະແນນຂອງຕົນເອງ ທີ່ເຄື່ອງຈະຕ້ອງເອີ້ນໃຊ້ (KDIGO staging, ຄວາມສ່ຽງ 10 ປີຂອງ ASCVD, ແລະ ເກນ SLE 2019 EULAR/ACR ຕາມລຳດັບ).

ກຳນົດເກນທີ່ລົງທະບຽນໄວ້ (pre-registered rubric), ອະທິບາຍ

ການລົງທະບຽນກ່ອນການດຳເນີນການ (pre-registration) ແມ່ນການຕັດສິນໃຈດ້ານວິທີການ (methodological) ທີ່ສຳຄັນທີ່ສຸດໃນແບັນມາກນີ້. ທຸກການວິນິດໄຊທີ່ຄາດໄວ້, ທຸກລະບົບຄະແນນທາງຄລີນິກ, ແລະ ທຸກສ່ວນຂອງລາຍງານ ໄດ້ຖືກກຳນົດໄວ້ໃນ source code ກ່ອນທີ່ເຄື່ອງຈະຖືກເອີ້ນໃຊ້. ດັດແກ້ພາຍຫຼັງ (post-hoc) ຂອງ rubric ເພື່ອໃຫ້ອອກມາດີກັບເຄື່ອງ ຈຶ່ງເປັນໄປບໍ່ໄດ້.

ອົງປະກອບສາມຢ່າງ ປະກອບເປັນຄະແນນລວມ. ສ່ວນ ດ້ານໂຄງສ້າງ (structural component) ມີຄ່າ 35 ເປີເຊັນ ແລະວັດວ່າເຄື່ອງໄດ້ສົ່ງຄືນ 7 ສ່ວນລາຍງານທີ່ຕ້ອງມີ (header, summary, key findings, differential, scoring systems, recommendations, follow-up) ແລະ 16 ສ່ວນຍ່ອຍທີ່ຕ້ອງມີພາຍໃນພວກມັນ. ການມີຢູ່ຂອງສ່ວນ (Section presence) ມີນ້ຳໜັກ 40 ເປີເຊັນ ແລະ ການມີຢູ່ຂອງສ່ວນຍ່ອຍ (subsection presence) ມີນ້ຳໜັກ 60 ເປີເຊັນ ພາຍໃນການຄຳນວນດ້ານໂຄງສ້າງ.

ໄດ້ ສ່ວນດ້ານຄລີນິກ (clinical component) ມີຄ່າ 55 ເປີເຊັນ ແລະລວມ 3 ຢ່າງ: ການຈື່ຄຳສຳຄັນການວິນິດໄຊ (diagnosis-keyword recall) (70 ເປີເຊັນຂອງຄະແນນຍ່ອຍດ້ານຄລີນິກ), ການຈື່ລະບົບຄະແນນ (scoring-system recall) (20 ເປີເຊັນ — ເຄື່ອງຄຳນວນ Mentzer, FIB-4, HOMA-IR, ຄວາມສ່ຽງ ASCVD, KDIGO staging, ເກນ EULAR/ACR ບ່ອນທີ່ເໝາະສົມບໍ), ແລະ ການກວດຄວາມຖືກຕ້ອງດ້ານຄວາມເປັນໄປໄດ້ລວມ (probability-sum validity check) (10 ເປີເຊັນ — ຄວາມເປັນໄປໄດ້ຂອງ differential ຄວນລວມໄດ້ພາຍໃນຊ່ວງ [90, 110]). ສຳລັບກໍລະນີກັບດັກ (trap cases) ຈະຫັກໂທດການ hyperdiagnosis ຢ່າງຊັດເຈນ ເຖິງ 0.30 ໂດຍຄຳນວນເປັນ 0.10 ຕໍ່ປ້າຍສະແດງພະຍາດທີ່ປອມ (fabricated pathology flag), ຈຳກັດບໍ່ໃຫ້ເກີນສາມປ້າຍ.

ໄດ້ ສ່ວນດ້ານເວລາລ່າຊ້າ (latency component) ມີຄ່າ 10 ເປີເຊັນ. ການຕອບທີ່ຕ່ຳກວ່າ 20 ວິນາທີ ໄດ້ຄົບເຕັມ 0.10, ການຕອບທີ່ຕ່ຳກວ່າ 40 ວິນາທີ ໄດ້ 0.05, ແລະ ສິ່ງໃດທີ່ຊ້າກວ່ານັ້ນ ໄດ້ສູນ. ເປົ້າໝາຍ 20 ວິນາທີ ສະທ້ອນວັດຖຸປະສົງລະດັບການບໍລິການ (production primary-path service-level objective); ຂອບເຂດ 40 ວິນາທີ ສະທ້ອນງົບສຳຮອງສຳລັບ Phase 2 ສຳລັບການເອີ້ນໃຊ້ເຄື່ອງຢ່າງໜັກ.

ພາບໜ້າຈໍສຸດທ້າຍ (terminal screenshot) ຂອງຊຸດທົດສອບ (benchmark harness) ທີ່ໄດ້ຮັບລິຂະສິດ MIT ຂອງ Kantesti ທີ່ກຳລັງແລ່ນ ແລະ ສົ່ງຄະແນນຕໍ່ກໍລະນີ
ຮູບທີ 3: ການທົດສອບໃນການປະຕິບັດ (harness). ແຕ່ລະກໍລະນີຖືກສ້າງເປັນ A4 PDF, ອັບໂຫລດໄປຍັງ endpoint v11 ຂອງ production, ແລະ ຖືກຄະແນນທຽບກັບ rubric ທີ່ຖືກຍຶດແຂງ (frozen). ຄຳຕອບດິບທຸກອັນຖືກບັນທຶກໄວ້ຄຽງຄູ່ກັບ aggregated scorecard.

ສິ່ງທີ່ pre-registration ປ້ອງກັນ

ແບັນມາກຂອງຜູ້ສ້າງເອງ (first-party benchmarks) ເປັນທີ່ຮູ້ກັນດີວ່າມັກຈະເພີ່ມຕົວເລກຂອງຕົນເອງຜ່ານການດັດແກ້ rubric ພາຍຫຼັງ (post-hoc). ຮູບແບບເກືອບຈະເປັນແນວນີ້ສະເໝີ: ທີມງານເອີ້ນໃຊ້ເຄື່ອງ, ເຫັນວ່າບ່ອນໃດທີ່ຕົກຕ່ຳ, ຈາກນັ້ນກໍປັບ rubric ຢ່າງງຽບໆ ເພື່ອໃຫ້ບ່ອນທີ່ຕົກຕ່ຳນັ້ນນັບໜ້ອຍລົງ. ໂດຍການກຳນົດ rubric ໃຫ້ເປັນ source code ກ່ອນການເອີ້ນເຄື່ອງຄັ້ງທຳອິດ ແລະ ເຜີຍແຜ່ harness ພາຍໃຕ້ລິຂະສິດ MIT, ການປັບນັ້ນຈະປາກົດໃຫ້ເຫັນໃນ version control. ຜູ້ໃດກໍສາມາດ clone ຮີໂປຊິຕໍຣີ (repository), ກວດສອບວັນທີຜູ້ຂຽນ rubric, ແລະ ຢືນຢັນວ່າຜົນຂອງເຄື່ອງບໍ່ໄດ້ຖືກນຳໄປໃຊ້ເພື່ອປັ້ນຄະແນນ.

ກໍລະນີກັບດັກ hyperdiagnosis — ເປັນຫຍັງການເອີ້ນຜິດຫຼາຍ (over-calling) ຈຶ່ງເປັນຮູບແບບຄວາມລົ້ມເຫຼວທີ່ແທ້

ການເອີ້ນພະຍາດ (pathology) ຢ່າງຮຸກຮານເກີນໄປໃນໜ້າຈໍປົກກະຕິ ແມ່ນຮູບແບບຄວາມລົ້ມເຫຼວ (failure mode) ທີ່ຖືກບັນທຶກໄວ້ສຳລັບຜູ້ຊ່ວຍທາງການແພດທີ່ສຳລັບຜູ້ໃຊ້ (consumer-facing medical assistants). ຄ່າໃຊ້ຈ່າຍຕໍ່ເນື່ອງ (downstream costs) ລວມມີການສືບສວນທີ່ບໍ່ຈຳເປັນ, ຄວາມກັງວົນຂອງຄົນເຈັບ, ແລະ ການກວດປິ່ນປົວທີ່ເກີດຈາກການຮັກສາແບບບໍ່ຈຳເປັນ (iatrogenic workup). ສອງກໍລະນີກັບດັກ (trap cases) ໃນແບັນມາກນີ້ ຖືກອອກແບບເພື່ອໃຫ້ຮູບແບບຄວາມລົ້ມເຫຼວນັ້ນ ປາກົດໃຫ້ເຫັນ ແລະ ຖືກຄະແນນໄດ້.

ການປຽບທຽບຂ້າງຄຽງຂອງ AI ທີ່ຄາດແຕ່ງ (fabricating) ຕັບອັກເສບ (hepatitis) ໃນແຜງກວດຂອງ Gilbert's syndrome ທຽບກັບເຄື່ອງຈັກ Kantesti ທີ່ລະບຸຄວາມປອດໄພ (benign) ຂອງ polymorphism UGT1A1 ໄດ້ຖືກຕ້ອງ
ຮູບທີ 4: ການອອກແບບກໍລະນີກັບດັກ (trap-case design). ເຄື່ອງທີ່ຕິດປ້າຍຢ່າງໝັ້ນໃຈວ່າ Gilbert's syndrome ເປັນ hepatitis, ຫຼື ທີ່ສ້າງພະຍາດທີ່ຢູ່ແຄມຂອບ (borderline pathology) ໃນໜ້າຈໍທີ່ປົກກະຕິ 100% ຈະຖືກລົງໂທດ — ບໍ່ແມ່ນຖືກໃຫ້ລາງວັນສຳລັບການຟັງດູຄືກັບທາງຄລີນິກ.

🟡 ກໍລະນີກັບດັກ 1 — BT-014-GILBERT

ການສະແດງອາການ (Presentation). ຊາຍອາຍຸ 24 ປີ ມີ bilirubin ທັງໝົດ 2.4 mg/dL. ສ່ວນທີ່ໂດຍກົງ (direct fraction) ແມ່ນປົກກະຕິ, transaminases ແລະ alkaline phosphatase ຢູ່ໃນຂອບເຂດອ້າງອີງຂອງມັນ, reticulocytes ບໍ່ເປັນຫຍັງ, ແລະ haptoglobin ແລະ LDH ຕັດອອກ haemolysis.

ການອ່ານທີ່ຖືກຕ້ອງ (Correct interpretation). Gilbert's syndrome — ຄວາມປ່ຽນແປງທີ່ບໍ່ເປັນອັນຕະລາຍຂອງ UGT1A1. ການອ່ານບໍ່ຄວນເອີ້ນ hepatitis, cirrhosis, haemolytic anaemia, ຫຼື biliary obstruction.

ຜົນ V11. ຄະແນນລວມ 1.000. ບໍ່ມີໜຶ່ງໃນ 6 ສັນຍານການວິນິດໄຊເກີນໄປ (over-diagnosis flags) ທີ່ຖືກຕິດຕາມ ປາກົດຂຶ້ນເປັນການວິນິດໄຊທີ່ເປັນຢູ່ (active diagnoses).

🟡 ກໍລະນີກັບດັກ 2 — BT-015-HEALTHY

ການສະແດງອາການ (Presentation). ແມ່ຍິງອາຍຸ 35 ປີ ກັບຊຸດກວດຄັດກອງປະຈຳວັນ 15 ພາລາມິເຕີ. ທຸກຕົວວັດ (analyte) ຢູ່ໃນຂອບເຂດອ້າງອີງຂອງມັນຢ່າງສະບາຍ.

ການອ່ານທີ່ຖືກຕ້ອງ (Correct interpretation). ການຢືນຢັນໃຫ້ໝັ້ນໃຈ ແລະການຮັກສາວິຖີຊີວິດ. ການອ່ານຜົນບໍ່ຄວນປະດິດພະຍາດຂອບເຂດໃຫ້ເຫັນວ່າມີຄວາມເປັນປະໂຫຍດທາງຄລີນິກ.

ຜົນ V11. ຄະແນນລວມ 1.000. ບໍ່ມີໜຶ່ງໃນເຈັດສັນຍານການກວດພົບເກີນ (over-diagnosis) ທີ່ຕິດຕາມ — ໂລກເບົາຫວານ, ໂລກຈາງ (anaemia), ໂລກຕ່ອມໄທຣອຍຕໍ່າ (hypothyroidism), ພະຍາດໄຂມັນໃນເລືອດຜິດປົກກະຕິ (dyslipidaemia), ຕັບອັກເສບ (hepatitis), ພະຍາດໝາກໄຂ່ຫຼັງ, ການຂາດແຄນ — ປາກົດເປັນການວິນິດໄສທີ່ເປັນຢູ່.

ໃນທັງສອງກັບດັກ (traps), ໄດ້ກວດສອບສັນຍານການວິນິດໄສເກີນ (hyperdiagnosis) ທີ່ຕິດຕາມຈຳນວນ 13 ຢ່າງ. ບໍ່ມີອັນໃດຖືກກະຕຸ້ນ. ນີ້ແມ່ນຜົນທີ່ສຳຄັນທີ່ສຸດສຳລັບແພດທຸກຄົນທີ່ກຳລັງພິຈາລະນານຳໃຊ້ລະບົບ AI ເປັນເຄື່ອງມືຄັດກອງ (triage) ຫຼືກ່ອນການປຶກສາ: ລະບົບບໍ່ໄດ້ປະດິດພະຍາດຂຶ້ນມາຖ້າບໍ່ມີຢູ່.

ດັດຊະນີ Mentzer: ແຍກຄວາມຂາດເຫຼັກ (iron deficiency) ອອກຈາກລັກສະນະ thalassaemia trait

ພົບຄັ້ງທີ່ມີຄຸນຄ່າສູງອີກຢ່າງໜຶ່ງ ກ່ຽວກັບການຈັບຄູ່ຂອງ case BT-001 (ພາວະຈາງຈາກການຂາດເຫຼັກ) ກັບ case BT-007 (beta-thalassaemia minor). ທັງສອງຢ່າງມີ microcytosis ແລະເປັນອຸປະສັກທີ່ຮູ້ຈັກດີສຳລັບຕົວຈຳແນກ (classifiers) ທີ່ຍັງບໍ່ຊຳນານ. ດັດຊະນີ Mentzer ທີ່ຄຳນວນເປັນ MCV ຫານດ້ວຍຈຳນວນ RBC ເກີນ 13 ໃນການຂາດເຫຼັກ ແລະຕ່ຳກວ່າ 13 ໃນລັກສະນະ thalassaemia.

ໃນ BT-001, ຄົນເຈັບເປັນແມ່ຍິງອາຍຸ 34 ປີ ມີ hemoglobin 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, ferritin 6 ng/mL, ແລະ TIBC ສູງ. ດັດຊະນີ Mentzer ປະມານ 17.7 ສະໜັບສະໜູນການຂາດເຫຼັກແບບຈຳເພາະ (absolute iron deficiency). ໃນ BT-007, ຄົນເຈັບເປັນຊາຍອາຍຸ 28 ປີ ມີ microcytosis (MCV 65.8 fL) ແຕ່ມີ RBC ສູງ 6.2, RDW ປົກກະຕິ, ferritin ປົກກະຕິ, ແລະ HbA2 5.6 ເປີເຊັນ. ດັດຊະນີ Mentzer ປະມານ 10.6 ຊີ້ໄປທາງ thalassaemia trait ແລະ HbA2 ທີ່ສູງຢືນຢັນ beta-thalassaemia minor.

ພາວະຈາງຈາກການຂາດເຫຼັກ Mentzer > 13 ferritin ຕ່ຳ, TSAT ຕ່ຳ, TIBC ສູງ, RDW ສູງ
thalassaemia trait Mentzer < 13 ferritin ປົກກະຕິ, RDW ປົກກະຕິ, HbA2 ສູງ (>3.5%), RBC ສູງ

ທັງສອງກໍລະນີໄດ້ຄະແນນ 1.000. ເຄື່ອງຈັກໄດ້ເອີ້ນໃຊ້ດັດຊະນີ Mentzer ຢ່າງຊັດເຈນໃນທັງສອງການອ່ານ ແລະໄດ້ສົ່ງການວິນິດໄສທີ່ຖືກຕ້ອງໃນແຕ່ລະກໍລະນີ. ນີ້ແມ່ນຜົນທີ່ເຮັດໃຫ້ໝັ້ນໃຈທາງຄລີນິກທີ່ສຸດພຽງອັນດຽວໃນທັງໝົດການທົດສອບ (benchmark), ເພາະການຈັດຜິດ thalassaemia trait ເປັນການຂາດເຫຼັກ ຈະນຳໄປສູ່ການໃຫ້ເສີມເຫຼັກທີ່ບໍ່ເໝາະສົມ ແລະເສຍໂອກາດໃນການຄັດກອງຄອບຄົວ, ແລະການຈັດຜິດການຂາດເຫຼັກເປັນ thalassaemia ຈະຊັກຊ້າການປິ່ນປົວທົດແທນທີ່ງ່າຍດາຍ. ພວກເຮົາ ຄູ່ມືຊ່ວງ ferritin ອະທິບາຍບັນບັນທຶກບຣິບົດການແຍກຄວາມເປັນໄປໄດ້ (differential) ທີ່ກວ້າງຂຶ້ນ.

ຜົນລັບລາຍກໍລະນີຈາກການດໍາເນີນງານເດືອນເມສາ 2026

ສິບສອງຈາກສິບຫ້າກໍລະນີ ບັນລຸຄະແນນລະດັບສູງສຸດ (ceiling) ຂອງ 1.000 ໃນ path ປະຖົມ (primary). ສາມກໍລະນີ ໄດ້ຮັບການບໍລິການຜ່ານການສຳຮອງຂັ້ນທີ 2 (Phase 2 fallback) ໂດຍເສຍບົດລາງວັນ latency 0.05 ແຕ່ຮັກສາທຸກເນື້ອຫາທາງຄລີນິກ ແລະໂຄງສ້າງ. ໜຶ່ງກໍລະນີ ຂາດຍ່ອຍບັງຄັບ (mandatory subsection) ພຽງອັນດຽວ; ແລະໜຶ່ງກໍລະນີ ສົ່ງຜົນລວມຄວາມເປັນໄປໄດ້ (probability distribution sum) ທີ່ຫຼຸດລົງແບບພຽງເລັກນ້ອຍ.

ລະຫັດກໍລະນີ (Case ID) ສາຂາຊ່ຽວຊານ (Specialty) ຄະແນນລວມ ເວລາລ່າຊ້າ (Latency) ເສັ້ນທາງ (Path)
BT-001-IDAHematology1.00017.8 sprimary
BT-006-B12Hematology1.00018.4 ວິນາທີprimary
BT-007-THALHematology1.00017.0 ວິນາທີprimary
BT-002-HASHendocrinology0.95037.0 ວິນາທີການກັບຄືນໄປໃຊ້ຄ່າເລີ່ມຕົ້ນ
BT-008-PCOSendocrinology0.98718.6 ວິນາທີprimary
BT-003-T2DMເມຕາໂບລິກ1.00019.1 ວິນາທີprimary
BT-013-GOUTເມຕາໂບລິກ1.00019.4 ວິນາທີprimary
BT-004-NAFLDການສຶກສາດ້ານຕັບ1.00019.6 ວິນາທີprimary
BT-009-VIRHEPການສຶກສາດ້ານຕັບ0.95023.4 ວິນາທີການກັບຄືນໄປໃຊ້ຄ່າເລີ່ມຕົ້ນ
BT-014-GILBERTກັບດັກ1.00018.9 ວິນາທີprimary
BT-005-CKDພະຍາດໝາກໄຂ່ຫຼັງ1.00017.4 ວິນາທີprimary
BT-010-ASCVDດ້ານການກວດຫົວໃຈ (Cardiology)1.00019.7 ວິນາທີprimary
BT-011-SLEການຮັກສາພະຍາດຂໍ້ແລະພູມຕ້ານທານ (Rheumatology)0.98118.2 ວິນາທີprimary
BT-012-VITDendocrinology1.00019.3 ວິນາທີprimary
BT-015-HEALTHYກັບດັກ1.00018.7 ວິນາທີການກັບຄືນໄປໃຊ້ຄ່າເລີ່ມຕົ້ນ

ກໍລະນີ PCOS (BT-008) ໄດ້ສູນເສຍພາຍຍ່ອຍທີ່ຈຳເປັນອັນໜຶ່ງໃນໂຄງສ້າງຄຳຕອບ — ສິບຫ້າຈາກສິບຫົກ ແທນທີ່ຈະເປັນສິບຫົກຈາກສິບຫົກ — ເຊິ່ງໄດ້ຫັກຄະແນນໂຄງສ້າງຈາກ 1.000 ເປັນ 0.963. ກໍລະນີ SLE (BT-011) ສົ່ງຄືນຜົນລວມຂອງຄວາມເປັນໄປໄດ້ທີ່ຖືກຫຼຸດລົງແບບພຽງເລັກນ້ອຍ ຊຶ່ງເຮັດໃຫ້ຄະແນນດ້ານຄລີນິກຫຼຸດລົງເປັນ 0.965 ໃນຂະນະທີ່ຍັງຮັກສາຄຳສັບການວິນິດໄຊແລະລະບົບການໃຫ້ຄະແນນທຸກອັນໄວ້. ບໍ່ມີກໍລະນີທີ່ບໍ່ສົມບູນທັງສອງກໍລະນີທີ່ພາດການວິນິດໄຊທີ່ຖືກຕ້ອງ.

ຄະແນນຫົວຂ່າວບໍ່ໄດ້ບອກພວກເຮົາຫຍັງ

ຄະແນນລວມ 99.12 ເປີເຊັນ ພາຍໃຕ້ກົດເກນທີ່ລົງທະບຽນໄວ້ສະເພາະນີ້ ສະແດງຜົນໃກ້ຂອບເທິງ (near-ceiling performance) ແຕ່ຄວນຈັດວາງຄຳອະທິບາຍແບບລະມັດລະວັງ. ຜົນລັບອະທິບາຍພຶດຕິກຳຂອງເຄື່ອງຈັກ ຕໍ່ກັບກໍລະນີທີ່ຖືກຄັດເລືອກແບບລະບຸຊື່ (anonymised) ຈຳນວນສິບຫ້າກໍລະນີ ທີ່ຖືກປະເມີນແຕ່ລະກໍລະນີຄັ້ງດຽວ ພາຍໃຕ້ກົດເກນອັນດຽວ. ພວກເຮົາຊັດເຈນກ່ຽວກັບຈຳນວນນີ້ບອກຫຍັງ ແລະບໍ່ໄດ້ຢືນຢັນຫຍັງ.

ຄະແນນບອກວ່າເຄື່ອງຈັກ V11 ຈັດການຮູບແບບການວິນິດໄຊທີ່ເລືອກສຳລັບການປະເມີນນີ້ໄດ້ຖືກຕ້ອງ ດ້ວຍວິທີການທີ່ເຜີຍແຜ່ແລະສາມາດທົດລອງຊ້ຳໄດ້. ມັນບໍ່ໄດ້ບອກວ່າເຄື່ອງຈັກຖືກຕ້ອງທຸກແຜງການກວດເລືອດ (blood test panel) ທີ່ມີຢູ່ໃນໂລກຈິງ. ມັນບໍ່ໄດ້ບອກວ່າເຄື່ອງຈັກຄວນມາທົດແທນການຕັດສິນໃຈຂອງແພດຜູ້ຊຳນານ. ແລະມັນບໍ່ໄດ້ບອກວ່າເຄື່ອງຈັກດີກວ່າລະບົບ AI ອື່ນ — ການວິເຄາະປຽບທຽບກັບເຄື່ອງຈັກອື່ນໆແມ່ນຈົດໄວ້ບໍ່ໃຫ້ຢູ່ໃນຂອບເຂດຂອງລາຍງານນີ້ໂດຍຈົງໃຈ.

ສິ່ງທີ່ຄະແນນບອກໄດ້ແມ່ນພື້ນຖານ (baseline). ດ້ວຍກົດເກນ (rubric) ແລະຊຸດທົດສອບ (harness) ທີ່ເປີດເຜີຍ, ຮຸ່ນໃໝ່ຂອງເຄື່ອງຈັກສາມາດຖືກປະເມີນທຽບກັບກໍລະນີສິບຫ້າກໍລະນີດຽວກັນ, ແລະຊ່ອງຫ່າງລະຫວ່າງຄະແນນທີ່ເຜີຍແຜ່ ແລະການຮັນຄັ້ງຕໍ່ມາໃດໆ ກໍສາມາດວັດໄດ້ເອງ. ນີ້ແມ່ນຄຸນຄ່າຂອງການລົງທະບຽນໄວ້ກ່ອນ (pre-registration): ມັນປ່ຽນຄຳກ່າວດ້ານຄວາມສາມາດ (performance claims) ໃຫ້ເປັນຄຳກ່າວທີ່ສາມາດທົດສອບໄດ້.

ວິທີການທົດລອງເກณฑ໌ມາດຕະຖານນີ້ຄືນໃນ 10 ນາທີ

ການທົດລອງຊ້ຳຕ້ອງການພຽງຄູ່ໃບຢັ້ງຢືນ API Kantesti ແລະສະພາບແວດລ້ອມ Python 3.10 ຫຼືຕໍ່ມາ ພ້ອມກັບ requests ແລະ reportlab ຕິດຕັ້ງຫ້ອງສະໝຸດ (libraries) ແລ້ວ. ຊຸດທົດສອບທັງໝົດແມ່ນໂມດູນ Python ດຽວທີ່ບັນຈຸຕົວເອງ (self-contained) ທີ່ປ່ອຍອອກພາຍໃຕ້ລິຂະສິດ MIT.

ແຜນວຽກເຄືອຂ່າຍຄວາມສາມາດທົດຊ້ຳໄດ້ (reproducibility) ທີ່ສະແດງວ່າ benchmark ຖືກສະທ້ອນ (mirrored) ໄປທີ່ Figshare, ResearchGate, Academia.edu ແລະ GitHub ໂດຍມີ Figshare DOI ເປັນຈຸດຍຶດຫຼັກ (canonical anchor)
ຮູບທີ 5: ການປຽບທຽບ (benchmark) ຖືກສະທ້ອນຢູ່ໃນສີ່ແພລດຟອມວິຈັຍ. Figshare DOI ແມ່ນຕົວລະບຸທາງວິຊາການທີ່ເປັນມາດຕະຖານ; ResearchGate, Academia.edu, ແລະ GitHub ເປັນບ່ອນເກັບສຳເນົາຂະໜານພ້ອມດ້ວຍໂຄດ ແລະຂໍ້ມູນດິບ (raw data).

ສີ່ຂັ້ນຕອນສຳລັບການຮັນໃໝ່ (fresh run)

ອັນໜຶ່ງ. ໂຄນໂປຣເຈັກ (Clone the repository): git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. ສອງ. ຕິດຕັ້ງການພຶ່ງພາອາໄສດ້ວຍ pip install -r requirements.txt. ສາມ. ຕັ້ງ KANTESTI_USERNAME ແລະ KANTESTI_PASSWORD ເປັນຕົວແປສະພາບแวดລ້ອມ — ຂໍ້ມູນລັບຖືກອ່ານໃນເວລາແລ່ນ ແລະບໍ່ມີການຝັງຄ່າໄວ້ໃນສະຄຣິບ. ສີ່. ແລ່ນ python benchmark_bloodtest.py ແລະກວດເບິ່ງສິ່ງທີ່ຖືກສ້າງອອກມາ 4 ຢ່າງໃນໂຟນເດີເຮັດວຽກ: ບັດຄະແນນ CSV, ບັດຄະແນນ JSON, ການຖິ້ມ JSON ທັງໝົດລວມທັງຄໍາຕອບດິບຂອງເຄື່ອງຈັກ, ແລະລາຍງານ Markdown ທີ່ອ່ານງ່າຍ.

ການແລ່ນອ້າງອີງຈາກ 23 ເມສາ 2026 ຖືກຮັກສາໄວ້ໃນ results/ ໃນໂຟນເດີຂອງຄັງໂຄງການ (repository). ການແລ່ນໃໝ່ຈະສ້າງບັດຄະແນນໃໝ່ທີ່ມີ timestamp ໃໝ່ ໂດຍບໍ່ໄປປ່ຽນການແລ່ນອ້າງອີງ. ຖ້າການແລ່ນຂອງທ່ານໃຫ້ຜົນທີ່ຕ່າງຢ່າງມີນັຍສໍາຄັນ, ກະລຸນາເປີດ GitHub issue ພ້ອມ timestamp ຂອງການແລ່ນ ແລະເວີຊັນຂອງ engine ທີ່ສົ່ງກັບມາໃນ response metadata.

ຂໍ້ຈໍາກັດ ແລະ ວຽກງານໃນອະນາຄົດ

ຂໍ້ຈໍາກັດ 4 ຂໍ້ຄວນຮັບຮູ້ແບບຊັດເຈນ: ຂະໜາດຕົວຢ່າງ, ການປະເມີນແບບຄັ້ງດຽວ, ຂອບເຂດຂອງເຄື່ອງຈັກດຽວ, ແລະຕົ້ນກໍາເນີດຂໍ້ມູນຈາກແຫຼ່ງດຽວ. ແຕ່ລະຂໍ້ກໍາລັງຖືກຈັດການໃນວຽກຕິດຕາມຢ່າງເປັນການຈິງ.

ຂະໜາດຕົວຢ່າງ. ສິບຫ້າກໍລະນີຂ້າມເຈັດບັກເກັດສະເພາະດ້ານ 8 ກຸ່ມ ພຽງພໍສໍາລັບ proof of concept ແຕ່ບໍ່ພຽງພໍສໍາລັບການວິເຄາະຍ່ອຍພາຍໃນສາຂາສະເພາະ. ການຂະຫຍາຍໄປສູ່ 50 ກໍລະນີ ຖືກວາງແຜນ ແລະຈະລວມເຖິງ coagulation panels, ການຄັດກອງມະເລັງເລືອດທາງຮູບເລືອດ (haematological malignancy) , ຊຸດກວດການຖືພາ (pregnancy panels), ແລະການນໍາສະເໜີຂອງພະຍາດໃນເດັກ (paediatric presentations).

ການປະເມີນແບບຄັ້ງດຽວ. ແຕ່ລະກໍລະນີຖືກປະເມີນພຽງຄັ້ງດຽວ. ໂມເດວພາສາຂະໜາດໃຫຍ່ມີຄວາມແປຜົນຂອງຜົນອອກທີ່ບໍ່ສົມຄວນ ເຖິງອຸນຫະພູມການສຸ່ມຕໍ່າ, ດັ່ງນັ້ນ ຂັ້ນຕອນການປະເມີນຫຼາຍຄັ້ງ (multi-run) ດ້ວຍ 5 ການປະເມີນຕໍ່ກໍລະນີ ແລະລາຍງານຄວາມແປ (variance) ແມ່ນຂັ້ນຕອນຕໍ່ໄປທີ່ເໝາະສົມ.

ຂອບເຂດຂອງເຄື່ອງຈັກດຽວ. ລາຍງານນີ້ອະທິບາຍເຖິງ engine ພຽງໜຶ່ງ. ການວິເຄາະປຽບທຽບກັບລະບົບ AI ອື່ນແມ່ນຢູ່ນອກຂອບເຂດທີ່ນີ້; ພວກເຮົາອາດຈະດໍາເນີນການເປັນການສຶກສາອິດສະຫຼະແບບແຍກຕ່າງຫາກ ພ້ອມວິທີການທີ່ເໝາະສົມ.

ຕົ້ນກໍາເນີດຂໍ້ມູນຈາກແຫຼ່ງດຽວ. ສິບຫ້າກໍລະນີແມ່ນບັນທຶກຂໍ້ມູນຜູ້ປ່ວຍຈິງທີ່ຖືກປົກປິດຊື່ (anonymised) ທີ່ດຶງມາຈາກຄັງຂໍ້ມູນທາງຄລີນິກແຫ່ງດຽວ. ພວກມັນແທນຕົວຢ່າງທີ່ຖືກຄັດເລືອກ (curated) ແລະບໍ່ແມ່ນການສຸ່ມທີ່ສະທ້ອນປະຊາກອນ (population-representative random draw). ການຂະຫຍາຍການປະເມີນໄປສູ່ຂໍ້ມູນຫຼາຍສູນ (multi-centre) ຢູ່ໃນແຜນງານລ່ວງໜ້າ.

ການຂະຫຍາຍທີ່ມີຜົນກະທົບຫຼາຍທີ່ສຸດທີ່ວາງແຜນແມ່ນຄວາມສະເໝີພາສາຫຼາຍພາສາ (multi-language parity). Kantesti AI Engine ໃຫ້ບໍລິການແກ່ຜູ້ໃຊ້ໃນ 75+ ພາສາ, ແລະການແລ່ນ harness ດຽວກັນທີ່ມີ 15 ກໍລະນີໃນຕຸລະກີ, ເຢຍລະມັນ, ສະເປນ, ຝຣັ່ງ, ແລະ ອາຣັບ ຈະວັດແທກຄຸນນະພາບຂອງຜົນອອກຂ້າມພາສາທີ່ engine ຮອງຮັບ. ພວກເຮົາຈະເຜີຍແຜ່ການແລ່ນສໍາລັບແຕ່ລະພາສາພ້ອມ DOI ຂອງຕົນເອງ ແລະ harness branch ຂອງຕົນເອງ.