Predicció de malalties cardiovasculars mitjançant l'algorisme de veïns més pròxims de K

Bloc

Predicció de malalties cardiovasculars mitjançant l'algorisme de veïns més pròxims de K

Segons Wikipedia, Cardiovascular és la principal causa de mort a nivell mundial [1]. És una combinació de diferents vasos sanguinis i cardíacs, com ara malalties del cor, atacs cardíacs, ictus, insuficiència cardíaca, arítmia, problemes de vàlvula cardíaca, etc. d’aconseguir aquesta malaltia. Mitjançant la minimització de factors de risc conductuals com el tabaquisme, la dieta poc saludable, l’ús d’alcohol i la inactivitat física, es pot prevenir aquesta malaltia.

Si la gent pot ser conscient per endavant d’aquesta malaltia abans que es converteixi en un nivell de risc més gran, podem minimitzar el nombre de morts i pacients d’alt risc en una quantitat considerable. Amb l’ajut del desenvolupament de l’aprenentatge automàtic i l’alta potència computacional han impulsat l’avanç exponencial de la intel·ligència artificial en el camp de la medicina, on les persones poden utilitzar aquestes tecnologies i elaborar un model i fer les prediccions per identificar la probabilitat que les persones pateixin aquesta malaltia. en les primeres etapes.

regressió lineal múltiple numpy

En aquest article, s’ha proposat i implementat un model d’aprenentatge automàtic per identificar la probabilitat que una persona tingui o no aquesta malaltia, concentrant-se en factors com informació factual, resultats d’exàmens mèdics i informació del pacient recollida d’un conjunt de dades en línia [2]. Per implementar aquest model es va utilitzar l'algorisme de veïns més propers, que és un algorisme de classificació conegut i amb un bon rendiment.

Selecció d'algoritmes

K Els veïns més propers és un algorisme senzill, però a la pràctica funciona increïblement que emmagatzema tots els casos disponibles i classifica les noves dades o casos en funció d’una mesura de semblança. Suggereix que si el nou punt afegit a la mostra és similar als punts veïns, aquest punt pertanyerà a la classe particular dels punts veïns. En general, l'algorisme KNN s'utilitza en aplicacions de cerca on la gent busca elements similars. K a l'algorisme KNN indica el nombre de veïns més propers del nou punt que calia predir.

L’algorisme KNN també es coneix com un aprenent mandrós perquè hi ha menys fase d’aprenentatge del model a causa de la seva capacitat d’aprenentatge força ràpida. En lloc d'això, memoritza el conjunt de dades d'entrenament i tota la feina es realitza en el moment en què es demana la predicció.

Com funciona l'algorisme?

Quan afegim un punt nou a un conjunt de dades mitjançant l'algorisme KNN, podem predir a quina classe pertany el nou punt. Per iniciar la predicció, el primer que hem de fer és seleccionar el valor de K. Segons la figura 1, els punts de color verd pertanyen a la classe X, els punts de color blau pertanyen a la classe Y i els colors grocs classe Z. Quan K = 8, hem de seleccionar 8 punts veïns que tinguin la menor distància al nou punt que representa pel triangle. Com es demostra a la figura 1, quan K = 8, el punt nou s’acosta a un punt groc, tres punts verds i quatre punts blaus. Com que tenim una majoria de punts blaus, en aquest cas, podem dir que per a K = 8 el nou punt pertany a la classe Y.

Seguint endavant si K = 16, hem de buscar 16 punts diferents que siguin els més propers als nous punts. Després de calcular la distància, es comprova que quan K = 16 el nou punt està més a prop de tres punts grocs, cinc punts blaus i vuit punts verds. Per tant, podem dir que quan K = 16 el nou punt pertany a la classe X.

adreça del contracte de token hodl

Per tal de trobar el millor valor de K, podem utilitzar una tècnica de validació creuada per provar diversos valors de K. Us mostraré com utilitzar la tècnica de validació creuada per trobar el millor valor de K en aquest article. Per tal de trobar la menor distància entre els punts veïns, podem utilitzar la distància euclidiana o la distància de Manhattan. En la distància euclidiana, prendrà la distància recta entre dos punts en un espai euclidià mentre que la distància de Manhattan calcularà la distància entre vectors reals utilitzant la suma de la seva diferència absoluta.

# mètode-colze # malaltia-cardiovascular # k-més-propers-veïns # ciència-de-dades

towardsdatascience.com

Predicció de malalties cardiovasculars mitjançant l'algorisme de veïns més pròxims de K

En aquest article, s’ha proposat i implementat un model d’aprenentatge automàtic per identificar la probabilitat que una persona tingui aquesta malaltia o no, concentrant-se en factors com informació factual, resultats d’exàmens mèdics i informació del pacient recollida d’un conjunt de dades en línia.