Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Ďakujeme, že ste navštívili Nature.com.Verzia prehliadača, ktorý používate, má obmedzenú podporu CSS.Na dosiahnutie najlepších výsledkov odporúčame použiť novšiu verziu prehliadača (alebo vypnúť režim kompatibility v programe Internet Explorer).Medzitým, aby sme zabezpečili nepretržitú podporu, zobrazujeme stránku bez štýlu alebo JavaScriptu.
Zuby sa považujú za najpresnejší ukazovateľ veku ľudského tela a často sa používajú pri forenznom posudzovaní veku.Zamerali sme sa na overenie odhadov veku zubov založených na dolovaní údajov porovnaním presnosti odhadu a klasifikácie 18-ročného prahu s tradičnými metódami a odhadmi veku založenými na dolovaní údajov.Od kórejských a japonských občanov vo veku 15 až 23 rokov bolo zozbieraných celkovo 2657 panoramatických röntgenových snímok.Boli rozdelené do tréningovej sady, z ktorých každá obsahovala 900 kórejských röntgenových snímok, a internej testovacej sady, ktorá obsahovala 857 japonských röntgenových snímok.Porovnali sme presnosť a efektívnosť klasifikácie tradičných metód s testovacími súbormi modelov data miningu.Presnosť tradičnej metódy na internom testovacom súbore je o niečo vyššia ako pri modeli dolovania údajov a rozdiel je malý (priemerná absolútna chyba <0,21 roka, stredná kvadratická chyba <0,24 roka).Výkon klasifikácie pre 18-ročnú hranicu je tiež podobný medzi tradičnými metódami a modelmi dolovania údajov.Tradičné metódy teda môžu byť nahradené modelmi dolovania údajov pri vykonávaní forenzného hodnotenia veku pomocou zrelosti druhých a tretích molárov u kórejských adolescentov a mladých dospelých.
Zubný odhad veku je široko používaný v súdnom lekárstve a detskom zubnom lekárstve.Najmä z dôvodu vysokej korelácie medzi chronologickým vekom a vývojom chrupu je dôležitým kritériom pri posudzovaní veku detí a dospievajúcich hodnotenie veku podľa štádií vývoja chrupu1,2,3.U mladých ľudí však odhadovanie veku zubov na základe zrelosti zubov má svoje obmedzenia, pretože rast zubov je takmer dokončený, s výnimkou tretích stoličiek.Právnym účelom určenia veku mládeže a mladistvých je poskytnúť presné odhady a vedecké dôkazy o tom, či dosiahli plnoletosť.V medicínsko-právnej praxi dospievajúcich a mladých dospelých v Kórei sa vek odhadoval pomocou Leeovej metódy a na základe údajov uvádzaných Ohom a kol.5 sa predpovedala zákonná hranica 18 rokov.
Strojové učenie je typ umelej inteligencie (AI), ktorý sa opakovane učí a klasifikuje veľké množstvo údajov, samostatne rieši problémy a riadi programovanie údajov.Strojové učenie môže objaviť užitočné skryté vzorce vo veľkých objemoch údajov6.Naproti tomu klasické metódy, ktoré sú náročné na prácu a čas, môžu mať obmedzenia pri práci s veľkými objemami zložitých údajov, ktoré je ťažké manuálne spracovať7.Preto bolo nedávno vykonaných mnoho štúdií s využitím najnovších počítačových technológií na minimalizáciu ľudských chýb a efektívne spracovanie viacrozmerných údajov8,9,10,11,12.Hlboké učenie sa vo veľkej miere používa najmä v analýze lekárskych obrazov a boli hlásené rôzne metódy odhadu veku pomocou automatickej analýzy röntgenových snímok na zlepšenie presnosti a účinnosti odhadu veku13,14,15,16,17,18,19,20 .Napríklad Halabi a kol. 13 vyvinuli algoritmus strojového učenia založený na konvolučných neurónových sieťach (CNN) na odhadnutie veku kostry pomocou röntgenových snímok rúk detí.Táto štúdia navrhuje model, ktorý aplikuje strojové učenie na lekárske obrázky a ukazuje, že tieto metódy môžu zlepšiť presnosť diagnostiky.Li et al14 odhadli vek z röntgenových snímok panvy pomocou hlbokého učenia CNN a porovnali ich s výsledkami regresie pomocou odhadu štádia osifikácie.Zistili, že model hlbokého učenia CNN vykazoval rovnakú výkonnosť pri odhade veku ako tradičný regresný model.Štúdia Guo et al. [15] hodnotila výkonnosť technológie CNN pri klasifikácii vekovej tolerancie na základe dentálnych ortofotografií a výsledky modelu CNN dokázali, že ľudia prekonali jej výkonnosť pri klasifikácii podľa veku.
Väčšina štúdií o odhade veku pomocou strojového učenia využíva metódy hlbokého učenia13,14,15,16,17,18,19,20.Odhaduje sa, že vek založený na hlbokom učení je presnejší ako tradičné metódy.Tento prístup však poskytuje málo príležitostí na prezentáciu vedeckého základu pre odhady veku, ako sú napríklad ukazovatele veku používané v odhadoch.O tom, kto kontroly vykonáva, sa vedie aj súdny spor.Správne a súdne orgány preto ťažko akceptujú odhad veku na základe hlbokého učenia.Data mining (DM) je technika, ktorá dokáže objaviť nielen očakávané, ale aj neočakávané informácie ako metóda na objavovanie užitočných korelácií medzi veľkým množstvom údajov6,21,22.Strojové učenie sa často používa pri dolovaní údajov a dolovanie údajov aj strojové učenie používajú rovnaké kľúčové algoritmy na objavovanie vzorov v údajoch.Odhad veku pomocou vývoja chrupu je založený na hodnotení zrelosti cieľových zubov skúšajúcim a toto hodnotenie je vyjadrené ako štádium pre každý cieľový zub.DM možno použiť na analýzu korelácie medzi štádiom hodnotenia zubného lekára a skutočným vekom a má potenciál nahradiť tradičnú štatistickú analýzu.Ak teda použijeme techniky DM na odhad veku, môžeme implementovať strojové učenie do forenzného odhadu veku bez obáv o právnu zodpovednosť.Bolo publikovaných niekoľko porovnávacích štúdií o možných alternatívach k tradičným manuálnym metódam používaným vo forenznej praxi a metódam založeným na EBM na určenie veku zubov.Shen a kol.23 ukázali, že model DM je presnejší ako tradičný Camererov vzorec.Galibourg et al24 použili rôzne metódy DM na predpovedanie veku podľa Demirdjianovho kritéria25 a výsledky ukázali, že metóda DM prekonala metódy Demirdjian a Willems v odhade veku francúzskej populácie.
Na odhadnutie zubného veku kórejských dospievajúcich a mladých dospelých sa v kórejskej forenznej praxi široko používa Leeova metóda 4.Táto metóda využíva tradičnú štatistickú analýzu (ako je viacnásobná regresia) na skúmanie vzťahu medzi kórejskými subjektmi a chronologickým vekom.V tejto štúdii sú metódy odhadu veku získané pomocou tradičných štatistických metód definované ako „tradičné metódy“.Leeova metóda je tradičná metóda a jej presnosť bola potvrdená Oh et al.5;použiteľnosť odhadu veku na základe modelu DM v kórejskej forenznej praxi je však stále otázna.Naším cieľom bolo vedecky overiť potenciálnu užitočnosť odhadu veku na základe modelu DM.Účelom tejto štúdie bolo (1) porovnať presnosť dvoch modelov DM pri odhade zubného veku a (2) porovnať klasifikačnú výkonnosť 7 modelov DM vo veku 18 rokov s tými, ktoré boli získané pomocou tradičných štatistických metód Zrelosť sekundy a tretie stoličky v oboch čeľustiach.
Priemery a štandardné odchýlky chronologického veku podľa štádia a typu zubov sú zobrazené online v doplnkovej tabuľke S1 (tréningová sada), doplnkovej tabuľke S2 (interná testovacia sada) a doplnkovej tabuľke S3 (externá testovacia sada).Hodnoty kappa pre intra- a interobserver spoľahlivosť získané z tréningového súboru boli 0,951 a 0,947.Hodnoty P a 95% intervaly spoľahlivosti pre hodnoty kappa sú uvedené v online doplnkovej tabuľke S4.Hodnota kappa bola interpretovaná ako „takmer dokonalá“, v súlade s kritériami Landisa a Kocha26.
Pri porovnaní strednej absolútnej chyby (MAE) tradičná metóda mierne prekonáva model DM pre všetky pohlavia a v externom mužskom testovacom súbore, s výnimkou viacvrstvového perceptrónu (MLP).Rozdiel medzi tradičným modelom a modelom DM na internom testovacom súbore MAE bol 0,12–0,19 roka u mužov a 0,17–0,21 roka u žien.Pri externej testovacej batérii sú rozdiely menšie (0,001–0,05 roka pre mužov a 0,05–0,09 roka pre ženy).Okrem toho je stredná kvadratická chyba (RMSE) o niečo nižšia ako tradičná metóda, s menšími rozdielmi (0,17–0,24, 0,2–0,24 pre mužský interný testovací súbor a 0,03–0,07, 0,04–0,08 pre externý testovací súbor).).MLP vykazuje o niečo lepší výkon ako Single Layer Perceptron (SLP), s výnimkou prípadu ženského externého testovacieho setu.V prípade MAE a RMSE má súbor externých testov vyššie skóre ako súbor interných testov pre všetky pohlavia a modely.Všetky MAE a RMSE sú uvedené v tabuľke 1 a na obrázku 1.
MAE a RMSE tradičných a data miningových regresných modelov.Stredná absolútna chyba MAE, odmocnina zo štvorcovej chyby RMSE, jednovrstvový perceptrón SLP, viacvrstvový perceptrón MLP, tradičná metóda CM.
Klasifikačný výkon (s limitom 18 rokov) tradičných a DM modelov bol preukázaný z hľadiska citlivosti, špecifickosti, pozitívnej prediktívnej hodnoty (PPV), negatívnej prediktívnej hodnoty (NPV) a plochy pod krivkou prevádzkovej charakteristiky prijímača (AUROC). 27 (tabuľka 2, obrázok 2 a doplnkový obrázok 1 online).Pokiaľ ide o citlivosť internej testovacej batérie, tradičné metódy dopadli najlepšie medzi mužmi a horšie medzi ženami.Rozdiel v klasifikačnej výkonnosti medzi tradičnými metódami a SD je však 9,7 % u mužov (MLP) a len 2,4 % u žien (XGBoost).Medzi modelmi DM vykazovala logistická regresia (LR) lepšiu citlivosť u oboch pohlaví.Pokiaľ ide o špecifickosť súboru interných testov, pozorovalo sa, že štyri modely SD fungovali dobre u mužov, zatiaľ čo tradičný model fungoval lepšie u žien.Rozdiely v klasifikačnej výkonnosti u mužov a žien sú 13,3 % (MLP) a 13,1 % (MLP), čo naznačuje, že rozdiel v klasifikačnej výkonnosti medzi modelmi prevyšuje citlivosť.Medzi modelmi DM sa medzi mužmi najlepšie darilo modelom podporného vektorového stroja (SVM), rozhodovacieho stromu (DT) a náhodného lesa (RF), zatiaľ čo model LR dosiahol najlepšie medzi ženami.AUROC tradičného modelu a všetkých modelov SD bol väčší ako 0,925 (k-najbližší sused (KNN) u mužov), čo dokazuje vynikajúcu klasifikačnú výkonnosť pri rozlišovaní vzoriek vo veku 18 rokov28.V prípade externého testovacieho súboru došlo v porovnaní s interným testovacím súborom k zníženiu výkonu klasifikácie z hľadiska citlivosti, špecifickosti a AUROC.Okrem toho sa rozdiel v citlivosti a špecifickosti medzi klasifikačným výkonom najlepších a najhorších modelov pohyboval od 10 % do 25 % a bol väčší ako rozdiel v internej testovacej sade.
Citlivosť a špecifickosť klasifikačných modelov data miningu v porovnaní s tradičnými metódami s limitom 18 rokov.KNN k najbližšiemu susedovi, vektorový stroj podpory SVM, logistická regresia LR, rozhodovací strom DT, náhodný les RF, XGB XGBoost, viacvrstvový perceptrón MLP, tradičná metóda CM.
Prvým krokom v tejto štúdii bolo porovnanie presnosti odhadov veku zubov získaných zo siedmich modelov DM s tými, ktoré boli získané pomocou tradičnej regresie.MAE a RMSE boli hodnotené v interných testovacích súboroch pre obe pohlavia a rozdiel medzi tradičnou metódou a modelom DM sa pohyboval od 44 do 77 dní pre MAE a od 62 do 88 dní pre RMSE.Hoci tradičná metóda bola v tejto štúdii o niečo presnejšia, je ťažké dospieť k záveru, či taký malý rozdiel má klinický alebo praktický význam.Tieto výsledky naznačujú, že presnosť odhadu zubného veku pomocou modelu DM je takmer rovnaká ako pri tradičnej metóde.Priame porovnanie s výsledkami z predchádzajúcich štúdií je ťažké, pretože žiadna štúdia neporovnávala presnosť modelov DM s tradičnými štatistickými metódami využívajúcimi rovnakú techniku zaznamenávania zubov v rovnakom vekovom rozmedzí ako v tejto štúdii.Galibourg et al24 porovnávali MAE a RMSE medzi dvoma tradičnými metódami (Demirjianova metóda25 a Willemsova metóda29) a 10 modelmi DM vo francúzskej populácii vo veku 2 až 24 rokov.Uviedli, že všetky modely DM boli presnejšie ako tradičné metódy, s rozdielmi 0,20 a 0,38 roka v MAE a 0,25 a 0,47 roka v RMSE v porovnaní s Willemsovou a Demirdjianovou metódou.Rozdiel medzi modelom SD a tradičnými metódami uvedený v štúdii z Halibourgu zohľadňuje početné správy30, 31, 32, 33 o tom, že metóda Demirdjian presne neodhaľuje vek zubov v iných populáciách ako francúzskych Kanaďanov, na ktorých bola štúdia založená.v tejto štúdii.Tai et al 34 použili algoritmus MLP na predpovedanie veku zubov z 1636 čínskych ortodontických fotografií a porovnali jeho presnosť s výsledkami metódy Demirjian a Willems.Uviedli, že MLP má vyššiu presnosť ako tradičné metódy.Rozdiel medzi Demirdjianovou metódou a tradičnou metódou je <0,32 roka a Willemsovou metódou je 0,28 roka, čo je podobné výsledkom tejto štúdie.Výsledky týchto predchádzajúcich štúdií24,34 sú tiež v súlade s výsledkami tejto štúdie a presnosť odhadu veku modelu DM a tradičnej metódy je podobná.Na základe prezentovaných výsledkov však môžeme len opatrne konštatovať, že použitie DM modelov na odhad veku môže nahradiť existujúce metódy z dôvodu nedostatku porovnávacích a referenčných predchádzajúcich štúdií.Na potvrdenie výsledkov získaných v tejto štúdii sú potrebné následné štúdie s použitím väčších vzoriek.
Medzi štúdiami testujúcimi presnosť SD pri odhadovaní veku zubov niektoré preukázali vyššiu presnosť ako naša štúdia.Stepanovsky et al 35 aplikovali 22 SD modelov na panoramatické röntgenové snímky 976 českých obyvateľov vo veku 2,7 až 20,5 roka a otestovali presnosť každého modelu.Hodnotili vývoj celkovo 16 horných a dolných ľavých stálych zubov pomocou klasifikačných kritérií navrhnutých Moorreesom a kol.36.MAE sa pohybuje od 0,64 do 0,94 roka a RMSE sa pohybuje od 0,85 do 1,27 roka, čo je presnejšie ako dva modely DM použité v tejto štúdii.Shen et al23 použili metódu Cameriere na odhadnutie zubného veku siedmich stálych zubov v ľavej dolnej čeľusti u obyvateľov východnej Číny vo veku 5 až 13 rokov a porovnali ho s vekom odhadnutým pomocou lineárnej regresie, SVM a RF.Ukázali, že všetky tri modely DM majú vyššiu presnosť v porovnaní s tradičnou formulou Cameriere.MAE a RMSE v Shenovej štúdii boli nižšie ako v modeli DM v tejto štúdii.Zvýšená presnosť štúdií Stepanovského et al.35 a Shen a kol.23 môže byť spôsobené zahrnutím mladších jedincov do ich študijných vzoriek.Pretože odhady veku pre účastníkov s vyvíjajúcimi sa zubami sa stávajú presnejšie, keď sa počet zubov zvyšuje počas zubného vývoja, presnosť výslednej metódy odhadu veku môže byť ohrozená, keď sú účastníci štúdie mladší.Okrem toho je chyba MLP v odhade veku o niečo menšia ako chyba SLP, čo znamená, že MLP je presnejšia ako SLP.MLP sa považuje za o niečo lepšie na odhad veku, pravdepodobne kvôli skrytým vrstvám v MLP38.Existuje však výnimka pre vonkajšiu vzorku žien (SLP 1,45, MLP 1,49).Zistenie, že MLP je pri hodnotení veku presnejšia ako SLP, si vyžaduje ďalšie retrospektívne štúdie.
Porovnávala sa aj klasifikačná výkonnosť modelu DM a tradičnej metódy na 18-ročnom prahu.Všetky testované SD modely a tradičné metódy na internom testovacom súbore ukázali prakticky prijateľné úrovne diskriminácie pre 18-ročnú vzorku.Senzitivita u mužov bola vyššia ako 87,7 % a u žien 94,9 % a špecificita bola vyššia ako 89,3 % a 84,7 %.AUROC všetkých testovaných modelov tiež presahuje 0,925.Pokiaľ je nám známe, žiadna štúdia netestovala výkonnosť modelu DM pre 18-ročnú klasifikáciu na základe zrelosti zubov.Výsledky tejto štúdie môžeme porovnať s klasifikačným výkonom modelov hlbokého učenia na panoramatických röntgenových snímkach.Guo et al.15 vypočítali klasifikačný výkon modelu hlbokého učenia založeného na CNN a manuálnej metódy založenej na Demirjianovej metóde pre určitý vekový prah.Senzitivita a špecifickosť manuálnej metódy bola 87,7 % a 95,5 % a senzitivita a špecificita modelu CNN presiahla 89,2 % a 86,6 %.Dospeli k záveru, že modely hlbokého učenia môžu nahradiť alebo prekonať manuálne hodnotenie pri klasifikácii vekových limitov.Výsledky tejto štúdie ukázali podobný výkon klasifikácie;Predpokladá sa, že klasifikácia pomocou modelov DM môže nahradiť tradičné štatistické metódy na odhad veku.Spomedzi modelov bol DM LR najlepší model z hľadiska citlivosti pre mužskú vzorku a citlivosti a špecifickosti pre ženskú vzorku.LR je na druhom mieste v špecifickosti pre mužov.Navyše, LR je považovaný za jeden z užívateľsky príjemnejších modelov DM35 a je menej zložitý a náročný na spracovanie.Na základe týchto výsledkov bol LR považovaný za najlepší hraničný klasifikačný model pre 18-ročných v kórejskej populácii.
Celkovo bola presnosť odhadu veku alebo výkonu klasifikácie na externom testovacom súbore nízka alebo nižšia v porovnaní s výsledkami na internom testovacom súbore.Niektoré správy naznačujú, že presnosť alebo účinnosť klasifikácie klesá, keď sa odhady veku založené na kórejskej populácii aplikujú na japonskú populáciu5, 39 a podobný model sa našiel v tejto štúdii.Tento trend zhoršovania bol pozorovaný aj v modeli DM.Preto na presný odhad veku, dokonca aj pri použití DM v procese analýzy, by sa mali uprednostňovať metódy odvodené z údajov pôvodnej populácie, ako sú tradičné metódy5,39,40,41,42.Keďže nie je jasné, či modely hlbokého učenia môžu vykazovať podobné trendy, sú potrebné štúdie porovnávajúce presnosť a efektivitu klasifikácie pomocou tradičných metód, modelov DM a modelov hlbokého učenia na rovnakých vzorkách, aby sa potvrdilo, či umelá inteligencia dokáže prekonať tieto rasové rozdiely v obmedzenom veku.hodnotenia.
Ukazujeme, že tradičné metódy možno nahradiť odhadom veku na základe modelu DM vo forenznej praxi odhadu veku v Kórei.Objavili sme tiež možnosť implementácie strojového učenia na forenzné hodnotenie veku.Existujú však jasné obmedzenia, ako je nedostatočný počet účastníkov tejto štúdie na definitívne určenie výsledkov a nedostatok predchádzajúcich štúdií na porovnanie a potvrdenie výsledkov tejto štúdie.V budúcnosti by sa štúdie DM mali vykonávať s väčším počtom vzoriek a rôznorodejšími populáciami, aby sa zlepšila jeho praktická použiteľnosť v porovnaní s tradičnými metódami.Na overenie uskutočniteľnosti použitia umelej inteligencie na odhad veku vo viacerých populáciách sú potrebné budúce štúdie na porovnanie presnosti klasifikácie a účinnosti modelov DM a hlbokého učenia s tradičnými metódami v rovnakých vzorkách.
Štúdia použila 2 657 ortografických fotografií zozbieraných od dospelých Kórejčanov a Japoncov vo veku 15 až 23 rokov.Kórejské röntgenové snímky boli rozdelené do 900 tréningových sád (19,42 ± 2,65 rokov) a 900 interných testovacích sád (19,52 ± 2,59 rokov).Tréningový súbor bol zhromaždený v jednej inštitúcii (Soul St. Mary's Hospital) a vlastný testovací súbor bol zhromaždený v dvoch inštitúciách (Seoul National University Dental Hospital a Yonsei University Dental Hospital).Zhromaždili sme tiež 857 röntgenových snímok z iných údajov o populácii (Iwate Medical University, Japonsko) na externé testovanie.Ako externý testovací súbor boli vybrané röntgenové snímky japonských subjektov (19,31 ± 2,60 rokov).Údaje sa zbierali retrospektívne na analýzu štádií vývoja chrupu na panoramatických röntgenových snímkach zhotovených počas zubného ošetrenia.Všetky zozbierané údaje boli anonymné, okrem pohlavia, dátumu narodenia a dátumu röntgenového snímku.Kritériá zaradenia a vylúčenia boli rovnaké ako predtým publikované štúdie 4 , 5 .Skutočný vek vzorky sa vypočítal odčítaním dátumu narodenia od dátumu zhotovenia rádiografie.Vzorová skupina bola rozdelená do deviatich vekových skupín.Rozdelenie podľa veku a pohlavia je uvedené v tabuľke 3. Táto štúdia bola vykonaná v súlade s Helsinskou deklaráciou a schválená Inštitucionálnou revíznou radou (IRB) v Soule St. Mary's Hospital na Katolíckej univerzite v Kórei (KC22WISI0328).Vzhľadom na retrospektívny dizajn tejto štúdie nebolo možné získať informovaný súhlas od všetkých pacientov podstupujúcich rádiografické vyšetrenie na terapeutické účely.Nemocnica svätej Márie (IRB) v Soule Kórejskej univerzite upustila od požiadavky informovaného súhlasu.
Vývojové štádiá bimaxilárnych druhých a tretích molárov boli hodnotené podľa Demircanových kritérií25.Vybral sa iba jeden zub, ak sa na ľavej a pravej strane každej čeľuste našiel rovnaký typ zuba.Ak boli homológne zuby na oboch stranách v rôznych vývojových štádiách, vybral sa zub s nižším vývojovým štádiom, aby sa zohľadnila neistota v odhadovanom veku.Dvaja skúsení pozorovatelia hodnotili sto náhodne vybraných röntgenových snímok z tréningového súboru, aby otestovali spoľahlivosť medzi pozorovateľmi po predkalibrácii na určenie štádia zrelosti zubov.Intraobserver spoľahlivosť bola hodnotená dvakrát v trojmesačných intervaloch primárnym pozorovateľom.
Pohlavie a vývojové štádium druhého a tretieho molára každej čeľuste v tréningovej sade odhadol primárny pozorovateľ trénovaný s rôznymi modelmi DM a skutočný vek bol stanovený ako cieľová hodnota.Modely SLP a MLP, ktoré sú široko používané v strojovom učení, boli testované proti regresným algoritmom.Model DM kombinuje lineárne funkcie pomocou vývojových štádií štyroch zubov a kombinuje tieto údaje na odhad veku.SLP je najjednoduchšia neurónová sieť a neobsahuje skryté vrstvy.SLP funguje na základe prahového prenosu medzi uzlami.Model SLP v regresii je matematicky podobný viacnásobnej lineárnej regresii.Na rozdiel od modelu SLP má model MLP viacero skrytých vrstiev s nelineárnymi aktivačnými funkciami.Naše experimenty používali skrytú vrstvu iba s 20 skrytými uzlami s nelineárnymi aktivačnými funkciami.Použite gradientný zostup ako metódu optimalizácie a MAE a RMSE ako stratovú funkciu na trénovanie nášho modelu strojového učenia.Najlepšie získaný regresný model bol aplikovaný na interné a externé testovacie sady a bol odhadnutý vek zubov.
Bol vyvinutý klasifikačný algoritmus, ktorý využíva zrelosť štyroch zubov na trénovacej sade na predpovedanie, či má vzorka 18 rokov alebo nie.Na zostavenie modelu sme odvodili sedem reprezentačných algoritmov strojového učenia6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost a (7) MLP .LR je jedným z najpoužívanejších klasifikačných algoritmov44.Ide o algoritmus učenia pod dohľadom, ktorý využíva regresiu na predpovedanie pravdepodobnosti údajov patriacich do určitej kategórie od 0 do 1 a klasifikuje údaje ako patriace do pravdepodobnejšej kategórie na základe tejto pravdepodobnosti;používa sa hlavne na binárnu klasifikáciu.KNN je jedným z najjednoduchších algoritmov strojového učenia45.Keď dostane nové vstupné dáta, nájde k dát blízko existujúcej množiny a potom ich zaradí do triedy s najvyššou frekvenciou.Pre počet uvažovaných susedov (k) sme nastavili 3.SVM je algoritmus, ktorý maximalizuje vzdialenosť medzi dvoma triedami pomocou funkcie jadra na rozšírenie lineárneho priestoru do nelineárneho priestoru nazývaného polia46.Pre tento model používame odchýlku = 1, mocninu = 1 a gama = 1 ako hyperparametre pre polynomické jadro.DT sa používa v rôznych oblastiach ako algoritmus na rozdelenie celého súboru údajov do niekoľkých podskupín reprezentovaním rozhodovacích pravidiel v stromovej štruktúre47.Model je nakonfigurovaný s minimálnym počtom záznamov na uzol 2 a používa Gini index ako mieru kvality.RF je súborová metóda, ktorá kombinuje viacero DT na zlepšenie výkonu pomocou metódy bootstrap agregácie, ktorá generuje slabý klasifikátor pre každú vzorku náhodným vykreslením vzoriek rovnakej veľkosti viackrát z pôvodného súboru údajov48.Ako kritériá oddelenia uzlov sme použili 100 stromov, 10 hĺbok stromov, 1 minimálnu veľkosť uzla a index prímesí Gini.Klasifikácia nových údajov je určená väčšinou hlasov.XGBoost je algoritmus, ktorý kombinuje techniky zosilnenia pomocou metódy, ktorá berie ako trénovacie údaje chybu medzi skutočnými a predpokladanými hodnotami predchádzajúceho modelu a zvyšuje chybu pomocou gradientov49.Je to široko používaný algoritmus vďaka svojmu dobrému výkonu a efektívnosti zdrojov, ako aj vysokej spoľahlivosti ako funkcia korekcie nadmerného vybavenia.Model je vybavený 400 nosnými kolesami.MLP je neurónová sieť, v ktorej jeden alebo viacero perceptrónov tvorí viacero vrstiev s jednou alebo viacerými skrytými vrstvami medzi vstupnou a výstupnou vrstvou38.Pomocou toho môžete vykonávať nelineárnu klasifikáciu, kde keď pridáte vstupnú vrstvu a získate výslednú hodnotu, predpovedaná výsledná hodnota sa porovná so skutočnou výslednou hodnotou a chyba sa prenesie späť.Vytvorili sme skrytú vrstvu s 20 skrytými neurónmi v každej vrstve.Každý model, ktorý sme vyvinuli, bol aplikovaný na interné a externé súbory na testovanie výkonnosti klasifikácie výpočtom citlivosti, špecifickosti, PPV, NPV a AUROC.Citlivosť je definovaná ako pomer vzorky, ktorej vek sa odhaduje na 18 rokov alebo viac, k vzorke, ktorej vek sa odhaduje na 18 rokov alebo viac.Špecifickosť je podiel vzoriek mladších ako 18 rokov a vzoriek, ktorých vek sa odhaduje na menej ako 18 rokov.
Zubné štádiá hodnotené v tréningovom súbore boli pre štatistickú analýzu prevedené na numerické štádiá.Uskutočnila sa viacrozmerná lineárna a logistická regresia s cieľom vyvinúť prediktívne modely pre každé pohlavie a odvodiť regresné vzorce, ktoré možno použiť na odhad veku.Tieto vzorce sme použili na odhad veku zubov pre interné aj externé testovacie sady.Tabuľka 4 ukazuje regresné a klasifikačné modely použité v tejto štúdii.
Spoľahlivosť medzi pozorovateľmi a medzi pozorovateľmi bola vypočítaná pomocou Cohenovej kappa štatistiky.Na testovanie presnosti DM a tradičných regresných modelov sme vypočítali MAE a RMSE pomocou odhadovaného a skutočného veku interných a externých testovacích súborov.Tieto chyby sa bežne používajú na vyhodnotenie presnosti predpovedí modelu.Čím je chyba menšia, tým je presnosť predpovede vyššia24.Porovnajte MAE a RMSE interných a externých testovacích sád vypočítaných pomocou DM a tradičnej regresie.Klasifikačná výkonnosť 18-ročného limitu v tradičnej štatistike bola hodnotená pomocou kontingenčnej tabuľky 2 × 2.Vypočítaná senzitivita, špecificita, PPV, NPV a AUROC testovacieho súboru boli porovnané s nameranými hodnotami modelu klasifikácie DM.Údaje sú vyjadrené ako priemer ± štandardná odchýlka alebo číslo (%) v závislosti od charakteristík údajov.Obojstranné hodnoty P <0,05 sa považovali za štatisticky významné.Všetky rutinné štatistické analýzy boli uskutočnené s použitím SAS verzie 9.4 (SAS Institute, Cary, NC).DM regresný model bol implementovaný v Pythone pomocou backendu Keras50 2.2.4 a Tensorflow51 1.8.0 špeciálne pre matematické operácie.Model klasifikácie DM bol implementovaný v prostredí analýzy znalostí Waikato a analytickej platforme Konstanz Information Miner (KNIME) 4.6.152.
Autori uznávajú, že údaje podporujúce závery štúdie možno nájsť v článku a doplnkových materiáloch.Súbory údajov generované a/alebo analyzované počas štúdie sú dostupné od príslušného autora na primeranú žiadosť.
Ritz-Timme, S. a kol.Posúdenie veku: najnovší stav techniky na splnenie špecifických požiadaviek forenznej praxe.medzinárodnosť.J. Právne lekárstvo.113, 129-136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. a Olze, A. Aktuálny stav forenzného posudzovania veku žijúcich subjektov pre účely trestného stíhania.Forenzná.liek.Patológia.1, 239-246 (2005).
Pan, J. a kol.Modifikovaná metóda na hodnotenie veku zubov u detí vo veku 5 až 16 rokov vo východnej Číne.klinický.Ústny prieskum.25, 3463 – 3474 (2021).
Lee, SS atď. Chronológia vývoja druhých a tretích molárov u Kórejčanov a jej aplikácia na forenzné posúdenie veku.medzinárodnosť.J. Právne lekárstvo.124, 659-665 (2010).
Oh, S., Kumagai, A., Kim, SY a Lee, SS Presnosť odhadu veku a odhad 18-ročného prahu na základe zrelosti druhých a tretích molárov u Kórejcov a Japoncov.PLoS ONE 17, e0271247 (2022).
Kim, JY, a kol.Predoperačná analýza údajov založená na strojovom učení môže predpovedať výsledok liečby spánkovej chirurgie u pacientov s OSA.veda.Správa 11, 14911 (2021).
Han, M. a kol.Presný odhad veku zo strojového učenia s ľudským zásahom alebo bez neho?medzinárodnosť.J. Právne lekárstvo.136, 821 – 831 (2022).
Khan, S. a Shaheen, M. Od dolovania údajov k dolovaniu údajov.J.Informácie.veda.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. a Shaheen, M. WisRule: The First Cognitive Algorithm for Association Rule Mining.J.Informácie.veda.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. a Abdullah U. Karm: Tradičné dolovanie údajov založené na pravidlách asociácie založených na kontexte.vypočítať.Matt.ďalej.68, 3305 – 3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. a Habib M. Deep learning based sémantickej podobnosti pomocou textových údajov.informovať.technológií.ovládanie.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. a Shahin, M. Systém na rozpoznávanie aktivity v športových videách.multimédiá.Nástroje Aplikácie https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS a kol.Výzva strojového učenia RSNA v detskom veku kostí.Rádiológia 290, 498–503 (2019).
Li, Y. a kol.Forenzný odhad veku z röntgenových snímok panvy pomocou hlbokého učenia.EURO.žiarenia.29, 2322 – 2329 (2019).
Guo, YC, a kol.Presná veková klasifikácia pomocou manuálnych metód a hlbokých konvolučných neurónových sietí z ortografických projekčných obrázkov.medzinárodnosť.J. Právne lekárstvo.135, 1589 – 1597 (2021).
Alabama Dalora a kol.Odhad kostného veku pomocou rôznych metód strojového učenia: systematický prehľad literatúry a metaanalýza.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. a Yang, J. Populačný špecifický odhad veku Afroameričanov a Číňanov na základe objemov pulpných komôr prvých molárov pomocou počítačovej tomografie s kužeľovým lúčom.medzinárodnosť.J. Právne lekárstvo.136, 811 – 819 (2022).
Kim S., Lee YH, Noh YK, Park FK a Oh KS Určenie vekových skupín žijúcich ľudí pomocou obrázkov prvých molárov založených na umelej inteligencii.veda.Správa 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. a Urschler, M. Automatický odhad veku a väčšinová veková klasifikácia z viacrozmerných údajov MRI.IEEE J. Biomed.Zdravotné upozornenia.23, 1392 – 1403 (2019).
Cheng, Q., Ge, Z., Du, H. a Li, G. Odhad veku založený na 3D segmentácii pulpnej komory prvých stoličiek z počítačovej tomografie s kužeľovým lúčom integráciou hlbokého učenia a súborov úrovní.medzinárodnosť.J. Právne lekárstvo.135, 365 – 373 (2021).
Wu, WT a kol.Data mining v klinických veľkých dátach: bežné databázy, kroky a modely metód.Svet.liek.zdroj.8, 44 (2021).
Yang, J. a kol.Úvod do medicínskych databáz a technológií dolovania dát v ére veľkých dát.J. Avid.Základná medicína.13, 57 – 69 (2020).
Shen, S. a kol.Camererova metóda na odhad veku zubov pomocou strojového učenia.BMC Oral Health 21, 641 (2021).
Galliburg A. a kol.Porovnanie rôznych metód strojového učenia na predpovedanie veku zubov pomocou metódy Demirdjian staging.medzinárodnosť.J. Právne lekárstvo.135, 665 – 675 (2021).
Demirdjian, A., Goldstein, H. a Tanner, JM Nový systém hodnotenia veku zubov.odfrknúť si.biológia.45, 211-227 (1973).
Landis, JR a Koch, GG Opatrenia dohody pozorovateľov o kategorických údajoch.Biometria 33, 159-174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK a Choi HK.Textúrna, morfologická a štatistická analýza dvojrozmerného zobrazovania magnetickou rezonanciou s využitím techník umelej inteligencie na diferenciáciu primárnych mozgových nádorov.Zdravotné informácie.zdroj.https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Čas odoslania: Jan-04-2024

Validácia modelu dolovania údajov oproti tradičným metódam odhadu veku zubov medzi kórejskými adolescentmi a mladými dospelými