• my

Validácia modelu ťažby údajov proti tradičným metódam odhadu zubného veku medzi kórejskými adolescentmi a mladými dospelými

Ďakujeme za návštevu nature.com. Verzia prehliadača, ktorú používate, má obmedzenú podporu CSS. Najlepšie výsledky odporúčame použiť novšiu verziu vášho prehliadača (alebo vypnutie režimu kompatibility v internetovom prieskume). Medzitým, aby sme zaistili nepretržitú podporu, zobrazujeme web bez stylingu alebo JavaScript.
Zuby sa považujú za najpresnejší ukazovateľ veku ľudského tela a často sa používajú pri hodnotení forenzného veku. Zamerali sme sa na overenie odhadov zubného veku založeného na dolovaní údajov porovnaním presnosti odhadu a výkonnosti klasifikácie 18-ročnej prahovej hodnoty s tradičnými metódami a odhadmi veku založených na ťažbe údajov. Z kórejských a japonských občanov vo veku 15 až 23 rokov bolo zhromaždených celkom 2657 panoramatických rádiografov. Boli rozdelené do výcvikového súboru, z ktorých každá obsahovala 900 kórejských rádiografov a internú skúšobnú sadu obsahujúcu 857 japonských rádiografov. Porovnali sme presnosť klasifikácie a efektívnosť tradičných metód s testovacími sadami modelov ťažby údajov. Presnosť tradičnej metódy na množine interných testov je mierne vyššia ako presnosť modelu ťažby údajov a rozdiel je malý (priemerná absolútna chyba <0,21 rok, priemerná koreňová priemerná štvorcová chyba <0,24 rok). Výkonnosť klasifikácie pre 18-ročnú hranicu je tiež podobná medzi tradičnými metódami a modelmi ťažby údajov. Tradičné metódy sa teda môžu nahradiť modelmi ťažby údajov pri vykonávaní forenzného veku pomocou zrelosti druhého a tretieho stoličky u kórejských adolescentov a mladých dospelých.
Odhad zubného veku sa široko používa v forenznej medicíne a pediatrickom stomatológii. Najmä kvôli vysokej korelácii medzi chronologickým vekom a zubným vývojom je hodnotenie veku podľa zubných vývojových štádií dôležitým kritériom na hodnotenie veku detí a adolescentov1,2,3. Odhad zubného veku na základe zubnej zrelosti má však svoje obmedzenia, pretože rast zubov je takmer úplný, s výnimkou tretích stoličiek. Právnym účelom určenia veku mladých ľudí a dospievajúcich je poskytnúť presné odhady a vedecké dôkazy o tom, či dosiahli vek väčšiny. V lekársko-legálnej praxi adolescentov a mladých dospelých v Kórei sa vek odhadoval pomocou Leeovej metódy a na základe údajov uvádzaných OH et al 5 sa predpovedalo právna prahová hodnota 18 rokov.
Strojové učenie je typ umelej inteligencie (AI), ktorá sa opakovane učí a klasifikuje veľké množstvo údajov, rieši problémy samostatne a riadi programovanie dát. Strojové učenie môže objaviť užitočné skryté vzory vo veľkých objemoch údajov6. Naopak, klasické metódy, ktoré sú náročné na prácu a časovo náročné, môžu mať obmedzenia pri riešení veľkých objemov zložitých údajov, ktoré je ťažké manuálne spracovať7. Preto sa nedávno uskutočnilo mnoho štúdií s použitím najnovších počítačových technológií na minimalizáciu ľudských chýb a efektívne spracovanie multidimenzionálnych údajov8,9,10,11,12. Najmä hlboké vzdelávanie sa široko používa pri analýze lekárskych obrazov a rôzne metódy odhadu veku automatickou analýzou rádiografov sa hlásili na zlepšenie presnosti a účinnosti odhadu veku13,14,15,16,17,18,19,20 . Napríklad, Halabi a kol. 13 vyvinuli algoritmus strojového učenia založeného na konvolučných neurónových sieťach (CNN) na odhad kostrového veku pomocou rádiografov detí detí. Táto štúdia navrhuje model, ktorý aplikuje strojové učenie na lekárske obrazy a ukazuje, že tieto metódy môžu zlepšiť diagnostickú presnosť. Li et al14 Odhadovaný vek z röntgenových snímok panvových snímok pomocou hlbokého učenia CNN a porovnával ich s výsledkami regresie pomocou odhadu fázy osifikácie. Zistili, že model CNN Deep Learning vykazoval rovnaký výkon odhadu veku ako tradičný regresný model. Štúdia Guo a kol. [15] hodnotila klasifikáciu vekovej tolerancie technológie CNN založenej na zubných ortofótoch a výsledky modelu CNN dokázali, že ľudia prekonali výkonnosť svojej vekovej klasifikácie.
Väčšina štúdií o odhadovaní veku pomocou strojového učenia využíva metódy hlbokého učenia 13,14,15,16,17,18,19,20. Odhad veku založený na hlbokom učení sa uvádza, že je presnejší ako tradičné metódy. Tento prístup však poskytuje malú príležitosť predstaviť vedecký základ pre odhady veku, ako napríklad vekové ukazovatele používané v odhadoch. Existuje tiež právny spor o to, kto vykonáva inšpekcie. Odhad veku založený na hlbokom učení je preto ťažké prijať administratívne a súdne orgány. Ťažba údajov (DM) je technika, ktorá môže objaviť nielen očakávané, ale aj neočakávané informácie ako metódu na objavovanie užitočných korelácií medzi veľkým množstvom údajov6,21,22. Strojové učenie sa často používa pri získavaní údajov a ťažba údajov aj strojové učenie používajú rovnaké kľúčové algoritmy na objavenie vzorov v údajoch. Odhad veku pomocou zubného vývoja je založený na hodnotení zrelosti cieľových zubov skúšajúceho a toto hodnotenie je vyjadrené ako štádium pre každý cieľový zub. DM sa môže použiť na analýzu korelácie medzi fázou zubného hodnotenia a skutočným vekom a má potenciál nahradiť tradičnú štatistickú analýzu. Preto, ak aplikujeme techniky DM na odhad veku, môžeme implementovať strojové učenie do odhadu forenzného veku bez obáv z právnej zodpovednosti. Bolo publikovaných niekoľko porovnávacích štúdií o možných alternatívach k tradičným manuálnym metódam používaným v forenznej praxi a metódach založených na EBM na určenie zubného veku. Shen et al23 ukázal, že model DM je presnejší ako tradičný recept Camerer. Galibourg et al24 aplikoval rôzne metódy DM na predpovedanie veku podľa Dedirdjského kritéria25 a výsledky ukázali, že metóda DM prekonala metódy Dedirdjian a Willems pri odhadovaní veku francúzskej populácie.
Na odhad zubného veku kórejských dospievajúcich a mladých dospelých sa Leeova metóda 4 bežne používa v kórejskej forenznej praxi. Táto metóda používa tradičnú štatistickú analýzu (napríklad viacnásobnú regresiu) na preskúmanie vzťahu medzi kórejskými subjektmi a chronologickým vekom. V tejto štúdii sú metódy odhadu veku získané pomocou tradičných štatistických metód definované ako „tradičné metódy“. Leeova metóda je tradičná metóda a jej presnosť potvrdila Oh et al. 5; Uplatniteľnosť odhadu veku založeného na modeli DM v kórejskej forenznej praxi je však stále otázna. Naším cieľom bolo vedecky potvrdiť potenciálnu užitočnosť odhadu veku založeného na modeli DM. Účelom tejto štúdie bolo (1) porovnať presnosť dvoch modelov DM pri odhadovaní zubného veku a (2) na porovnanie klasifikačného výkonu 7 dm modelov vo veku 18 rokov s modelmi získanými pomocou tradičnej štatistickej zrelosti splatnosti druhého a tretie stoličky v oboch čeľustiach.
Priemery a štandardné odchýlky chronologického veku podľa stupňa a typu zubov sú zobrazené online v doplnkovej tabuľke S1 (výcviková súprava), doplnkovej tabuľke S2 ​​(interná testovacia súprava) a doplnková tabuľka S3 (externá testovacia súprava). Hodnoty Kappa pre spoľahlivosť v rámci a interrobserveri získané z tréningovej sady boli 0,951 a 0,947. Hodnoty P a 95% intervaly spoľahlivosti pre hodnoty Kappa sú uvedené v online doplnkovej tabuľke S4. Hodnota Kappa bola interpretovaná ako „takmer dokonalá“, čo je v súlade s kritériami Landis a Koch26.
Pri porovnaní priemernej absolútnej chyby (MAE) tradičná metóda mierne prekonáva model DM pre všetky pohlavia a v externej mužskej testovacej sade, s výnimkou viacvrstvového Perceptronu (MLP). Rozdiel medzi tradičným modelom a modelom DM na internej testovacej sade MAE bol 0,12–0,19 rokov u mužov a 0,17–0,21 roka pre ženy. V prípade externej testovacej batérie sú rozdiely menšie (0,001–055 rokov u mužov a 0,05–0,09 rokov pre ženy). Okrem toho je priemerná priemerná štvorcová chyba (RMSE) o niečo nižšia ako tradičná metóda, s menšími rozdielmi (0,17–0,24, 0,2–0,24 pre mužskú internú skúšobnú sadu a 0,03–0,07, 0,04–0.08 pre externú skúšobnú sadu). ). MLP vykazuje o niečo lepší výkon ako Perceptron s jednou vrstvou (SLP), s výnimkou prípadu samica externej testovacej sady. V prípade MAE a RMSE skóre externej testovacej sady vyššie ako interné testovacie súbory pre všetky pohlavia a modely. Všetky MAE a RMSE sú uvedené v tabuľke 1 a na obrázku 1.
MAE a RMSE tradičných a regresných modelov ťažby údajov. Priemerná absolútna chyba MAE, root stredná štvorcová chyba RMSE, jednorvrstva Perceptron SLP, viacvrstvový Perceptron MLP, tradičná metóda CM.
Výkonnosť klasifikácie (s obmedzením 18 rokov) tradičných modelov a DM modelov bola demonštrovaná z hľadiska citlivosti, špecifickosti, pozitívnej prediktívnej hodnoty (PPV), negatívnej prediktívnej hodnoty (NPV) a plochou pod krivkou prevádzkovej charakteristiky prijímača (AUROC) 27 (tabuľka 2, obrázok 2 a doplnkový obrázok 1 online). Pokiaľ ide o citlivosť na internú testovaciu batériu, tradičné metódy sa u mužov najlepšie vykonávajú a horšie u žien. Rozdiel v klasifikačnej výkonnosti medzi tradičnými metódami a SD je však 9,7% u mužov (MLP) a iba 2,4% u žien (XGBOOST). Medzi modelmi DM vykazovala logistická regresia (LR) lepšiu citlivosť u oboch pohlaví. Pokiaľ ide o špecifickosť vnútorného testovacieho súboru, zistilo sa, že štyri modely SD sa u mužov darili dobre, zatiaľ čo tradičný model sa u žien lepšie dosahoval. Rozdiely v klasifikačnej výkonnosti u mužov a žien sú 13,3% (MLP) a 13,1% (MLP), čo naznačuje, že rozdiel v klasifikačnom výkone medzi modelmi presahuje citlivosť. Medzi modely DM modely podporného vektorového stroja (SVM), rozhodovací strom (DT) a náhodné lesné (RF) modely robili najlepšie medzi mužmi, zatiaľ čo model LR sa u žien najviac konal. Auroc tradičného modelu a všetky modely SD boli väčšie ako 0,925 (K-najslužnejší sused (KNN) u mužov), čo demonštruje vynikajúci klasifikačný výkon pri diskriminácii 18-ročných vzoriek28. Pokiaľ ide o externú skúšobnú sadu, došlo k zníženiu klasifikačnej výkonnosti z hľadiska citlivosti, špecifickosti a AUROC v porovnaní s interným testovacím množstvom. Okrem toho rozdiel v citlivosti a špecifickosti medzi klasifikačným výkonom najlepších a najhorších modelov sa pohyboval od 10% do 25% a bol väčší ako rozdiel vo vnútornej testovacej sade.
Citlivosť a špecifickosť modelov klasifikácie dolovania údajov v porovnaní s tradičnými metódami s obmedzením 18 rokov. Knn K najbližšie sused, SVM podporný vektorový stroj, LR logistická regresia, DT rozhodovací strom, RF Random Forest, XGB XGBOOST, MLP viacvrstvový perceptrón, tradičná metóda CM.
Prvým krokom v tejto štúdii bolo porovnanie presnosti odhadov zubného veku získaných zo siedmich modelov DM s modelmi získanými pomocou tradičnej regresie. MAE a RMSE boli hodnotené vo vnútorných testovacích súboroch pre obe pohlavia a rozdiel medzi tradičnou metódou a modelom DM sa pohyboval od 44 do 77 dní pre MAE a od 62 do 88 dní pre RMSE. Aj keď tradičná metóda bola v tejto štúdii o niečo presnejšia, je ťažké dospieť k záveru, či taký malý rozdiel má klinický alebo praktický význam. Tieto výsledky naznačujú, že presnosť odhadu zubného veku pomocou modelu DM je takmer rovnaká ako presnosť tradičnej metódy. Priame porovnanie s výsledkami z predchádzajúcich štúdií je ťažké, pretože žiadna štúdia porovnávala presnosť modelov DM s tradičnými štatistickými metódami s použitím rovnakej techniky zaznamenávania zubov v rovnakom vekovom rozsahu ako v tejto štúdii. Galibourg et al24 porovnával MAE a RMSE medzi dvoma tradičnými metódami (Demirjian Method25 a Willems Method29) a 10 dm modelmi vo francúzskej populácii vo veku 2 až 24 rokov. Uviedli, že všetky modely DM boli presnejšie ako tradičné metódy, s rozdielom 0,20 a 0,38 roka v MAE a 0,25 a 0,47 roka v RMSE v porovnaní s Willems a Dedirdjianskými metódami. Rozdiel medzi modelom SD a tradičnými metódami uvedenými v štúdii Haliburgu zohľadňuje početné správy30,31,32,33, že Delidirdovská metóda presne ne odhaduje zubný vek v populáciách iných ako francúzskych Kanaďanov, na ktorých bola štúdia založená. V tejto štúdii. Tai a kol. 34 použil algoritmus MLP na predpovedanie veku zubov z 1636 čínskych ortodontických fotografií a porovnal svoju presnosť s výsledkami metódy Demirjian a Willems. Uviedli, že MLP má vyššiu presnosť ako tradičné metódy. Rozdiel medzi metódou Demirdjian a tradičnou metódou je <0,32 rokov a metóda Willems je 0,28 roka, čo je podobné výsledkom tejto štúdie. Výsledky týchto predchádzajúcich štúdií24,34 sú tiež v súlade s výsledkami tejto štúdie a presnosť odhadu veku modelu DM a tradičná metóda sú podobné. Na základe predložených výsledkov však môžeme len opatrne dospieť k záveru, že použitie modelov DM na odhad veku môže nahradiť existujúce metódy z dôvodu nedostatku porovnávacích a referenčných predchádzajúcich štúdií. Následné štúdie s použitím väčších vzoriek sú potrebné na potvrdenie výsledkov získaných v tejto štúdii.
Medzi štúdiami, ktoré testovali presnosť SD pri odhadovaní zubného veku, niektoré vykazovali vyššiu presnosť ako naša štúdia. Stepanovsky a kol. 35 aplikoval 22 modelov SD na panoramatické röntgenové snímky 976 českých obyvateľov vo veku 2,7 až 20,5 roka a testovali presnosť každého modelu. Hodnotili vývoj celkom 16 osôb horných a dolných ľavých trvalých zubov pomocou klasifikačných kritérií navrhnutých Moorrees et al 36. MAE sa pohybuje od 0,64 do 0,94 rokov a RMSE sa pohybuje od 0,85 do 1,27 rokov, čo je presnejšie ako dva modely DM použité v tejto štúdii. Shen et al23 použil metódu Cameriere na odhad zubného veku siedmich trvalých zubov v ľavej čínskej vo východných čínskych obyvateľoch vo veku 5 až 13 rokov a porovnával ju s odhadom odhadovaným pomocou lineárnej regresie, SVM a RF. Ukázali, že všetky tri modely DM majú vyššiu presnosť v porovnaní s tradičným Cameriere Formule. MAE a RMSE v Shenovej štúdii boli v tejto štúdii nižšie ako štúdie v modeli DM. Zvýšená presnosť štúdií Stepanovského a kol. 35 a Shen a kol. 23 môže byť spôsobený zahrnutím mladších subjektov do ich vzoriek štúdie. Pretože odhady veku pre účastníkov s rozvojovými zubami sa stávajú presnejšie, keď sa počet zubov zvyšuje počas vývoja zubov, presnosť metódy výsledného veku môže byť ohrozená, keď sú účastníci štúdie mladší. Okrem toho je chyba MLP v odhade veku o niečo menšia ako SLP, čo znamená, že MLP je presnejší ako SLP. MLP sa považuje za o niečo lepšie pre odhad veku, pravdepodobne kvôli skrytým vrstvám v MLP38. Existuje však výnimka pre vonkajšiu vzorku žien (SLP 1,45, MLP 1,49). Zistenie, že MLP je presnejšie ako SLP pri hodnotení veku, si vyžaduje ďalšie retrospektívne štúdie.
Porovnala sa aj klasifikačná výkonnosť modelu DM a tradičná metóda pri 18-ročnej prahovej hodnote. Všetky testované modely SD a tradičné metódy na súbore vnútorných testov vykazovali prakticky prijateľnú úroveň diskriminácie pre 18-ročnú vzorku. Citlivosť pre mužov a ženy bola vyššia ako 87,7% a 94,9% a špecifickosť bola vyššia ako 89,3% a 84,7%. Auroc všetkých testovaných modelov tiež presahuje 0,925. Podľa našich najlepších vedomostí žiadna štúdia netestovala výkonnosť modelu DM pre 18-ročnú klasifikáciu na základe zubnej zrelosti. Výsledky tejto štúdie môžeme porovnávať s klasifikačným výkonom modelov hlbokého vzdelávania na panoramatických rádiografoch. Guo a kol. Citlivosť a špecifickosť manuálnej metódy boli 87,7% a 95,5% a citlivosť a špecifickosť modelu CNN prekročili 89,2% a 86,6%. Dospeli k záveru, že hlboké vzdelávacie modely môžu nahradiť alebo prekonať manuálne hodnotenie v klasifikácii vekových prahov. Výsledky tejto štúdie ukázali podobnú klasifikačnú výkonnosť; Predpokladá sa, že klasifikácia pomocou modelov DM môže nahradiť tradičné štatistické metódy pre odhad veku. Spomedzi modelov bol DM LR najlepším modelom z hľadiska citlivosti pre vzorku mužov a citlivosť a špecifickosť pre ženskú vzorku. LR je na druhom mieste v špecifickosti pre mužov. Okrem toho sa LR považuje za jeden z najžižiadlejších modelov DM35 a je menej zložitý a ťažko spracovateľný. Na základe týchto výsledkov bol LR považovaný za najlepší model klasifikácie medznej hodnoty pre 18-ročných v kórejskej populácii.
Celkovo bola presnosť výkonu veku alebo výkonnosti klasifikácie na externom testovacom súbore zlá alebo nižšia v porovnaní s výsledkami vo vnútornom testovacom súbore. Niektoré správy naznačujú, že presnosť alebo účinnosť klasifikácie sa znižuje, keď sa odhady veku založené na kórejskej populácii uplatňujú na japonskú populáciu5,39 a podobný vzorec bol nájdený v tejto štúdii. Tento trend zhoršenia bol tiež pozorovaný v modeli DM. Preto, aby sa presne odhadol vek, aj keď sa používajú DM v procese analýzy, by sa mali preferovať metódy odvodené z pôvodných údajov o populácii, ako sú tradičné metódy, 5,39,40,41,42. Pretože nie je jasné, či hlboké vzdelávacie modely môžu vykazovať podobné trendy, štúdie porovnávajúce presnosť a efektívnosť klasifikácie pomocou tradičných metód, modelov DM a modelov hlbokého učenia sa na rovnakých vzorkách sú potrebné na potvrdenie, či umelá inteligencia môže prekonať tieto rasové rozdiely v obmedzenom veku. hodnotenia.
Ukazujeme, že tradičné metódy môžu byť nahradené odhadom veku na základe modelu DM v praxi odhadu forenzného veku v Kórei. Zistili sme tiež možnosť implementácie strojového učenia pre hodnotenie forenzného veku. Existujú však jasné obmedzenia, ako napríklad nedostatočný počet účastníkov tejto štúdie na definitívne určenie výsledkov, a nedostatok predchádzajúcich štúdií na porovnanie a potvrdenie výsledkov tejto štúdie. V budúcnosti by sa mali DM štúdie vykonávať s väčším počtom vzoriek a rozmanitejším populáciám, aby sa zlepšila jeho praktická uplatniteľnosť v porovnaní s tradičnými metódami. Na overenie uskutočniteľnosti použitia umelej inteligencie na odhad veku vo viacerých populáciách sú potrebné budúce štúdie na porovnanie presnosti klasifikácie a efektívnosti modelov DM a hlbokého učenia s tradičnými metódami v rovnakých vzorkách.
Štúdia použila 2 657 ortografických fotografií zozbieraných od kórejských a japonských dospelých vo veku od 15 do 23 rokov. Kórejské röntgenové snímky boli rozdelené do 900 tréningových súprav (19,42 ± 2,65 rokov) a 900 interných testovacích súborov (19,52 ± 2,59 rokov). Výcvik bol zozbieraný v jednej inštitúcii (nemocnica Soul St. Mary's Hospital) a vlastný testovací súbor sa zbieral v dvoch inštitúciách (Soul National University Dental Hospital a Yonsei University Dental Hospital). Zhromaždili sme tiež 857 rádiografie z iných údajov založených na populácii (IWate Medical University, Japonsko) na externé testovanie. Röntgenové snímky japonských subjektov (19,31 ± 2,60 rokov) boli vybrané ako externá testovacia súprava. Údaje sa zbierali retrospektívne s cieľom analyzovať štádiá zubného vývoja na panoramatických röntgenových snímkach získaných počas zubného ošetrenia. Všetky zhromaždené údaje boli anonymné, s výnimkou pohlavia, dátumu narodenia a dátumu rádiografie. Kritériá zaradenia a vylúčenia boli rovnaké ako predtým uverejnené štúdie 4, 5. Skutočný vek vzorky sa vypočítal odpočítaním dátumu narodenia od dátumu, keď bol röntgenový snímok odobratý. Skupina vzoriek bola rozdelená do deviatich vekových skupín. Distribúcia veku a pohlavia je uvedená v tabuľke 3 Táto štúdia sa uskutočnila v súlade s Helsinským vyhlásením a schválila Rada pre inštitucionálne preskúmanie (IRB) z nemocnice Soul Panny Márie na Kórejskej univerzite v Kórei (KC22WISI0328). V dôsledku retrospektívneho návrhu tejto štúdie nebolo možné získať informovaný súhlas od všetkých pacientov, ktorí sa podrobili rádiografickému vyšetreniu na terapeutické účely. V Soul Kórejskej univerzite St. Mary's Hospital (IRB) sa vzdala požiadavky na informovaný súhlas.
Vývojové štádiá bimaxilárneho druhého a tretieho stoličky boli hodnotené podľa kritérií Demircan25. Bol vybraný iba jeden zub, ak bol na ľavej a pravej strane každej čeľuste nájdený rovnaký typ zuba. Ak homológne zuby na oboch stranách boli v rôznych vývojových štádiách, zub s nižším vývojovým štádiom bol vybraný, aby sa zohľadnila neistota v odhadovanom veku. Sto náhodne vybraných rádiografie z tréningovej sady boli hodnotené dvoma skúsenými pozorovateľmi, aby testovali spoľahlivosť interrobserveru po predkribrácii, aby sa stanovilo štádium zubnej splatnosti. Spoľahlivosť intraobserveru bola primárnym pozorovateľom dvakrát hodnotená v trojmesačných intervaloch.
Pohlavné a vývojové štádium druhého a tretieho stoličky každej čeľuste v tréningovej sade boli odhadnuté primárnym pozorovateľom vyškoleným s rôznymi modelmi DM a skutočný vek bol stanovený ako cieľová hodnota. Modely SLP a MLP, ktoré sa široko používajú pri strojovom učení, sa testovali proti regresným algoritmom. Model DM kombinuje lineárne funkcie pomocou vývojových štádií štyroch zubov a tieto údaje kombinuje na odhad veku. SLP je najjednoduchšia neurónová sieť a neobsahuje skryté vrstvy. SLP funguje na základe prahového prenosu medzi uzlami. Model SLP v regresii je matematicky podobný viacerej lineárnej regresii. Na rozdiel od modelu SLP má model MLP viac skrytých vrstiev s nelineárnymi aktivačnými funkciami. Naše experimenty používali skrytú vrstvu s iba 20 skrytými uzlami s nelineárnymi aktivačnými funkciami. Ako metódu optimalizácie použite zostup gradientu a MAE a RMSE ako stratovú funkciu na školenie nášho modelu strojového učenia. Najlepšie získaný regresný model sa použil na vnútorné a externé testovacie súbory a odhadoval sa vek zubov.
Bol vyvinutý klasifikačný algoritmus, ktorý využíva zrelosť štyroch zubov na výcvikovom súbore na predpovedanie, či je vzorka vo veku 18 rokov alebo nie. Na zostavenie modelu sme odvodili sedem reprezentatívnych algoritmov strojového učenia 6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) xgboost a (7) MLP . LR je jedným z najpoužívanejších klasifikačných algoritmov44. Je to vedúci vzdelávací algoritmus, ktorý využíva regresiu na predpovedanie pravdepodobnosti údajov patriacich do určitej kategórie od 0 do 1 a klasifikuje údaje patriace do pravdepodobnejšej kategórie na základe tejto pravdepodobnosti; Používa sa hlavne na binárnu klasifikáciu. KNN je jedným z najjednoduchších algoritmov strojového učenia. Ak sa udeľuje nové vstupné údaje, nájde K dáta v blízkosti existujúcej sady a potom ich klasifikuje do triedy s najvyššou frekvenciou. Stanovili sme 3 pre počet uvažovaných susedov (k). SVM je algoritmus, ktorý maximalizuje vzdialenosť medzi dvoma triedami pomocou funkcie jadra na rozšírenie lineárneho priestoru do nelineárneho priestoru nazývaného FieldS46. Pre tento model používame zaujatosť = 1, výkon = 1 a gama = 1 ako hyperparametre pre polynomické jadro. DT sa použil v rôznych oblastiach ako algoritmus na vydelenie celého súboru údajov do niekoľkých podskupín zastúpením pravidiel rozhodovania v stromovej štruktúre47. Model je nakonfigurovaný s minimálnym počtom záznamov na uzol 2 a používa index Gini ako mieru kvality. RF je metóda súboru, ktorá kombinuje viac DT na zlepšenie výkonu pomocou metódy agregácie bootstrapu, ktorá generuje slabý klasifikátor pre každú vzorku náhodne nakreslením vzoriek rovnakej veľkosti viackrát z pôvodného DataSet48. Ako kritériá separácie uzlov sme použili 100 stromov, 10 hĺbok stromu, 1 minimálna veľkosť uzla a index prímesí Gini. Klasifikácia nových údajov je určená väčšinovým hlasovaním. XGBoost je algoritmus, ktorý kombinuje techniky zvyšovania pomocou metódy, ktorá ako školiace údaje berie chybu medzi skutočnými a predpovedanými hodnotami predchádzajúceho modelu a rozširuje chybu pomocou gradientov49. Je to široko používaný algoritmus kvôli jeho dobrému výkonu a efektívnosti zdrojov, ako aj vysokej spoľahlivosti ako nadmernej korekčnej funkcie. Model je vybavený 400 podpornými kolesami. MLP je neurónová sieť, v ktorej jeden alebo viac perceptrónov tvorí viac vrstiev s jednou alebo viacerými skrytými vrstvami medzi vstupnými a výstupnými vrstvami38. Pomocou tohto môžete vykonať nelineárnu klasifikáciu, kde pri pridávaní vstupnej vrstvy a získanie hodnoty výsledku sa predpovedaná hodnota výsledku porovnáva so skutočnou hodnotou výsledku a chyba sa šíri späť. V každej vrstve sme vytvorili skrytú vrstvu s 20 skrytými neurónmi. Každý model, ktorý sme vyvinuli, sa použil na vnútorné a externé sady na testovanie klasifikačného výkonu výpočtom citlivosti, špecifickosti, PPV, NPV a AUROC. Citlivosť je definovaná ako pomer vzorky odhadnutej na 18 rokov alebo staršie k vzorke odhadovanej vo veku 18 rokov alebo viac. Špecifickosť je podiel vzoriek mladších ako 18 rokov a vzorky sa odhadujú na mladší ako 18 rokov.
Zubné fázy hodnotené v tréningovej sade boli prevedené na číselné štádiá pre štatistickú analýzu. Viacrozmerná lineárna a logistická regresia sa uskutočnila s cieľom vyvinúť prediktívne modely pre každý pohlavie a odvodiť regresné vzorce, ktoré sa môžu použiť na odhad veku. Tieto vzorce sme použili na odhad veku zubov pre vnútorné aj externé testovacie sady. Tabuľka 4 ukazuje modely regresie a klasifikácie použité v tejto štúdii.
Spoľahlivosť intra- a interrobserveru sa vypočítala pomocou Cohenovej štatistiky Kappa. Na testovanie presnosti DM a tradičných regresných modelov sme vypočítali MAE a RMSE pomocou odhadovaného a skutočného veku vnútorných a externých testovacích súborov. Tieto chyby sa bežne používajú na vyhodnotenie presnosti predpovedí modelu. Čím menšia je chyba, tým vyššia je presnosť prognózy24. Porovnajte MAE a RMSE vnútorných a externých testovacích súborov vypočítaných pomocou DM a tradičnej regresie. Klasifikačná výkonnosť 18-ročnej medznej hodnoty v tradičnej štatistike sa hodnotila pomocou pohotovostnej tabuľky 2 × 2. Vypočítaná citlivosť, špecifickosť, PPV, NPV a AUROC testovacej sady sa porovnali s nameranými hodnotami klasifikačného modelu DM. Údaje sú vyjadrené ako priemer ± štandardná odchýlka alebo číslo (%) v závislosti od charakteristík údajov. Obojstranné hodnoty P <0,05 sa považovali za štatisticky významné. Všetky rutinné štatistické analýzy sa uskutočňovali pomocou SAS verzie 9.4 (SAS Institute, Cary, NC). Regresný model DM bol implementovaný v Pythone s použitím backend Keras50 2.2.4 a TensorFlow51 1.8.0 špeciálne pre matematické operácie. Model klasifikácie DM bol implementovaný v prostredí Analýzy znalostí Waikato a v analytickej platforme Konstanz Information Miner (Knime) 4.6.152.
Autori uznávajú, že údaje podporujúce závery štúdie možno nájsť v článku a doplnkových materiáloch. Generované a/alebo analyzované údaje o údajoch počas štúdie sú k dispozícii od príslušného autora na primeranú žiadosť.
Ritz-Timme, S. a kol. Posúdenie veku: STRUČNOSTI, KTORÉ SA SPÔSOBIŤ ŠPECIFICKÉ POŽIADAVKY FORENSICKÉHO PRAVIDLÁ. medzinárodnosť. J. Legal Medicine. 113, 129 - 136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. a Olze, A. Súčasný stav forenzného veku hodnotenia živých subjektov na účely trestného stíhania. Forenzná. liek. Patológia. 1, 239 - 246 (2005).
Pan, J. a kol. Modifikovaná metóda hodnotenia zubného veku detí vo veku 5 až 16 rokov vo východnej Číne. klinické. Ústny prieskum. 25, 3463 - 3474 (2021).
Lee, SS atď. Chronológia vývoja druhého a tretieho stoličky v Kórejčanoch a jeho aplikácia na hodnotenie forenzného veku. medzinárodnosť. J. Legal Medicine. 124, 659 - 665 (2010).
Oh, S., Kumagai, A., Kim, Sy a Lee, SS presnosť odhadu veku a odhadu 18-ročnej prahovej hodnoty na základe zrelosti druhého a tretieho stoličky v Kórejčanoch a japončine. PLOS ONE 17, E0271247 (2022).
Kim, Jy, a kol. Analýza údajov založených na strojovom učení môže predpovedať výsledok liečby spánku u pacientov s OSA. Veda. Správa 11, 14911 (2021).
Han, M. a kol. Presný odhad veku zo strojového učenia s ľudským zásahom alebo bez nej? medzinárodnosť. J. Legal Medicine. 136, 821 - 831 (2022).
Khan, S. a Shaheen, M. Od ťažby údajov po ťažbu údajov. J.Information. Veda. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. a Shaheen, M. Wisrule: Prvý kognitívny algoritmus pre ťažbu pravidiel združenia. J.Information. Veda. https://doi.org/10.1177/016555515221108695 (2022).
Shaheen M. a Abdullah U. Karm: Tradičné získavanie údajov na základe kontextových pravidiel združenia. vypočítať. Matt. pokračovať. 68, 3305 - 3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. a Habib M. Detekcia sémantickej podobnosti založená na hlbokom učení pomocou textových údajov. informovať. technológie. ovládanie. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. a Shahin, M. Systém rozpoznávania aktivity v športových videách. multimédiá. Nástroje aplikácie https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS a kol. RSNA Machine Learning Challenge v pediatrickej kosti. Radiology 290, 498–503 (2019).
Li, Y. a kol. Forenzný odhad veku z panvových röntgenových lúčov pomocou hlbokého učenia. Euro. žiarenie. 29, 2322 - 2329 (2019).
Guo, Yc, a kol. Presná veková klasifikácia pomocou manuálnych metód a hlbokých konvolučných neurónových sietí z ortografických projekčných snímok. medzinárodnosť. J. Legal Medicine. 135, 1589 - 1597 (2021).
Alabama Dalora a kol. Odhad kostnej doby pomocou rôznych metód strojového učenia: systematický prehľad literatúry a metaanalýza. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. a Yang, J. Odhad veku afrických Američanov a Číňanov špecifický pre populáciu na základe objemov buničiny prvých stoličiek pomocou počítačovej tomografie s kužeľovým lúčom. medzinárodnosť. J. Legal Medicine. 136, 811 - 819 (2022).
Kim S., Lee YH, Noh YK, Park FK a OH KS určujú vekové skupiny žijúcich ľudí pomocou obrazov prvých stoličiek založené na umelej inteligencii. Veda. Správa 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. a Urschler, M. Automatický odhad veku a klasifikácia veku väčšiny z viacrozmerných údajov MRI. IEEE J. Biomed. Výstrahy na zdravie. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. a Li, G. Vekový odhad založený na segmentácii 3D buničiny prvých stoličiek z kužeľovej lúča počítačovej tomografie integráciou hlbokého učenia a úrovní. medzinárodnosť. J. Legal Medicine. 135, 365 - 373 (2021).
Wu, WT, a kol. Dolovanie údajov v klinických veľkých údajoch: bežné databázy, kroky a modely metód. Svet. liek. zdroj. 8, 44 (2021).
Yang, J. a kol. Úvod do lekárskych databáz a technológie dolovania údajov v ére veľkých údajov. J. Avid. Základný liek. 13, 57 - 69 (2020).
Shen, S. a kol. Camerera metóda odhadu veku zubov pomocou strojového učenia. BMC Oral Health 21, 641 (2021).
Galliburg A. a kol. Porovnanie rôznych metód strojového učenia na predpovedanie zubného veku pomocou metódy dedirdjian. medzinárodnosť. J. Legal Medicine. 135, 665 - 675 (2021).
Demirdjian, A., Goldstein, H. a Tanner, JM Nový systém na hodnotenie zubného veku. odfrknutie. biológia. 45, 211 - 227 (1973).
Landis, Jr a Koch, GG opatrenia pozorovateľa dohody o kategorických údajoch. Biometrics 33, 159 - 174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK a Choi HK. Texturálna, morfologická a štatistická analýza dvojrozmernej magnetickej rezonancie pomocou techník umelej inteligencie na diferenciáciu primárnych nádorov mozgu. Informácie o zdraví. zdroj. https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Čas príspevku: Jan-04-2024