AI-సహాయక జన్యు అధ్యయనాలతో నిరంతర సమస్యలు

8 November 2024

జో స్టెర్‌బెంక్ ద్వారా కియోంగ్షి లు ఫోటో

విస్కాన్సిన్ విశ్వవిద్యాలయం-మాడిసన్ పరిశోధకులు జన్యుశాస్త్రం మరియు వైద్య రంగాలలో ప్రజాదరణ పొందుతున్న కృత్రిమ మేధస్సు సాధనాలు మధుమేహం వంటి వ్యాధుల ప్రమాద కారకాలతో సహా జన్యువులు మరియు భౌతిక లక్షణాల మధ్య సంబంధం గురించి లోపభూయిష్ట నిర్ధారణలకు దారితీస్తాయని హెచ్చరిస్తున్నారు.

జీనోమ్-వైడ్ అసోసియేషన్ స్టడీస్‌కు సహాయం చేయడానికి పరిశోధకులు AIని ఉపయోగించడంతో తప్పు అంచనాలు ముడిపడి ఉన్నాయి. ఇటువంటి అధ్యయనాలు జన్యువులు మరియు భౌతిక లక్షణాల మధ్య సంబంధాల కోసం అనేక మంది వ్యక్తులలో వందల వేల జన్యు వైవిధ్యాల ద్వారా స్కాన్ చేస్తాయి. ప్రత్యేక ఆసక్తి జన్యు వైవిధ్యాలు మరియు కొన్ని వ్యాధుల మధ్య సాధ్యమయ్యే కనెక్షన్లు.

వ్యాధికి జన్యుశాస్త్రం యొక్క లింక్ ఎల్లప్పుడూ సూటిగా ఉండదు

అనేక ఆరోగ్య పరిస్థితుల అభివృద్ధిలో జన్యుశాస్త్రం పాత్ర పోషిస్తుంది. కొన్ని వ్యక్తిగత జన్యువులలో మార్పులు నేరుగా సిస్టిక్ ఫైబ్రోసిస్ వంటి వ్యాధుల ప్రమాదాన్ని పెంచుతాయి, జన్యుశాస్త్రం మరియు భౌతిక లక్షణాల మధ్య సంబంధం తరచుగా మరింత క్లిష్టంగా ఉంటుంది.

నేషనల్ ఇన్‌స్టిట్యూట్స్ ఆఫ్ హెల్త్ యొక్క ఆల్ ఆఫ్ అస్ ప్రాజెక్ట్ మరియు UK బయోబ్యాంక్ వంటి వ్యక్తుల జన్యు ప్రొఫైల్‌లు మరియు ఆరోగ్య లక్షణాల యొక్క పెద్ద డేటాబేస్‌లను ఉపయోగించడం ద్వారా జన్యు-వ్యాప్త అసోసియేషన్ అధ్యయనాలు ఈ సంక్లిష్టతలలో కొన్నింటిని విడదీయడంలో సహాయపడాయి. అయినప్పటికీ, పరిశోధకులు అధ్యయనం చేయడానికి ప్రయత్నిస్తున్న ఆరోగ్య పరిస్థితుల గురించి ఈ డేటాబేస్‌లు తరచుగా డేటాను కోల్పోతాయి.

“కొన్ని లక్షణాలు కొలవడానికి చాలా ఖరీదైనవి లేదా శ్రమతో కూడుకున్నవి, కాబట్టి జన్యుశాస్త్రంతో వాటి అనుబంధం గురించి అర్థవంతమైన గణాంక నిర్ధారణలను చేయడానికి మీకు తగినంత నమూనాలు లేవు” అని UW-మాడిసన్ డిపార్ట్‌మెంట్ ఆఫ్ బయోస్టాటిస్టిక్స్‌లో అసోసియేట్ ప్రొఫెసర్ అయిన క్వియోంగ్షి లూ చెప్పారు. మరియు మెడికల్ ఇన్ఫర్మేటిక్స్ మరియు జీనోమ్-వైడ్ అసోసియేషన్ అధ్యయనాలపై నిపుణుడు.

AIతో డేటా అంతరాలను తగ్గించడం వల్ల కలిగే నష్టాలు

పరిశోధకులు మరింత అధునాతన AI సాధనాలతో డేటా అంతరాలను తగ్గించడం ద్వారా ఈ సమస్యను అధిగమించడానికి ఎక్కువగా ప్రయత్నిస్తున్నారు.

“మెషిన్ లెర్నింగ్‌లో పురోగతిని పెంచుకోవడానికి ఇది ఇటీవలి సంవత్సరాలలో బాగా ప్రాచుర్యం పొందింది, కాబట్టి మేము ఇప్పుడు ఈ అధునాతన మెషీన్-లెర్నింగ్ AI నమూనాలను కలిగి ఉన్నాము, ఇవి పరిమిత డేటాతో సంక్లిష్ట లక్షణాలు మరియు వ్యాధి ప్రమాదాలను అంచనా వేయడానికి పరిశోధకులు ఉపయోగిస్తున్నాయి” అని లు చెప్పారు.

ఇప్పుడు, లు మరియు అతని సహచరులు వారు ప్రవేశపెట్టే పక్షపాతాల నుండి రక్షణ లేకుండా ఈ మోడళ్లపై ఆధారపడే ప్రమాదాన్ని ప్రదర్శించారు. నేచర్ జెనెటిక్స్ జర్నల్‌లో ఇటీవల ప్రచురించిన పేపర్‌లో బృందం సమస్యను వివరిస్తుంది. దీనిలో, లూ మరియు అతని సహచరులు జీనోమ్-వైడ్ అసోసియేషన్ స్టడీస్‌లో ఉపయోగించే ఒక సాధారణ రకం మెషీన్ లెర్నింగ్ అల్గోరిథం టైప్ 2 డయాబెటిస్‌ను అభివృద్ధి చేసే వ్యక్తికి అనేక జన్యు వైవిధ్యాలను పొరపాటుగా లింక్ చేయగలదని చూపిస్తుంది.

“సమస్య ఏమిటంటే, మీరు మెషిన్ లెర్నింగ్-ప్రిక్టెడ్ డయాబెటిస్ రిస్క్‌ను అసలు ప్రమాదంగా విశ్వసిస్తే, ఆ జన్యు వైవిధ్యాలన్నీ అసలైన మధుమేహంతో సంబంధం కలిగి లేవని మీరు అనుకుంటారు” అని లూ చెప్పారు.

ఈ “తప్పుడు పాజిటివ్‌లు” ఈ నిర్దిష్ట వైవిధ్యాలు మరియు మధుమేహం ప్రమాదానికి మాత్రమే పరిమితం కావు, లూ జతచేస్తుంది, కానీ AI-సహాయక అధ్యయనాలలో విస్తృతమైన పక్షపాతం.

కొత్త గణాంక పద్ధతి తప్పుడు పాజిటివ్‌లను తగ్గించగలదు

AI సాధనాలపై అతిగా ఆధారపడే సమస్యను గుర్తించడంతో పాటు, లూ మరియు అతని సహచరులు తమ AI-సహాయక జీనోమ్-వైడ్ అసోసియేషన్ అధ్యయనాల విశ్వసనీయతకు హామీ ఇవ్వడానికి పరిశోధకులు ఉపయోగించే గణాంక పద్ధతిని ప్రతిపాదించారు. మెషీన్ లెర్నింగ్ అల్గారిథమ్‌లు అసంపూర్ణ సమాచారం ఆధారంగా అనుమితులు చేస్తున్నప్పుడు ప్రవేశపెట్టగల పక్షపాతాన్ని తొలగించడంలో ఈ పద్ధతి సహాయపడుతుంది.

“ఈ కొత్త వ్యూహం గణాంకపరంగా సరైనది” అని లు చెప్పారు, వ్యక్తుల ఎముక ఖనిజ సాంద్రతతో జన్యుసంబంధమైన అనుబంధాలను బాగా గుర్తించడానికి బృందం దీనిని ఉపయోగించిందని పేర్కొంది.

కొన్ని జీనోమ్-వైడ్ అసోసియేషన్ అధ్యయనాలతో AI మాత్రమే సమస్య కాదు

సమూహం యొక్క ప్రతిపాదిత గణాంక పద్ధతి AI-సహాయక అధ్యయనాల యొక్క ఖచ్చితత్వాన్ని మెరుగుపరచడంలో సహాయపడగలదు, లు మరియు అతని సహచరులు కూడా ఇటీవలి కాలంలో అల్గారిథమ్‌ల కంటే ప్రాక్సీ సమాచారంతో డేటా ఖాళీలను పూరించే ఇలాంటి అధ్యయనాలతో సమస్యలను గుర్తించారు.

నేచర్ జెనెటిక్స్‌లో ఇటీవల ప్రచురించబడిన మరొక పేపర్‌లో, జన్యుశాస్త్రం మరియు కొన్ని వ్యాధుల మధ్య సంబంధాలను ఏర్పరచుకునే ప్రయత్నంలో ప్రాక్సీ సమాచారంపై ఎక్కువగా ఆధారపడే అధ్యయనాల గురించి పరిశోధకులు అలారం ధ్వనించారు.

ఉదాహరణకు, UK బయోబ్యాంక్ వంటి పెద్ద ఆరోగ్య డేటాబేస్‌లు పెద్ద జనాభా గురించి టన్ను జన్యు సమాచారాన్ని కలిగి ఉన్నాయి, అయితే చాలా న్యూరోడెజెనరేటివ్ వ్యాధుల వంటి జీవితంలో తర్వాత వచ్చే వ్యాధుల సంభవం గురించి చాలా డేటా లేదు.

అల్జీమర్స్ వ్యాధికి ప్రత్యేకంగా, కొంతమంది పరిశోధకులు కుటుంబ ఆరోగ్య చరిత్ర సర్వేల ద్వారా సేకరించిన ప్రాక్సీ డేటాతో ఆ అంతరాన్ని తగ్గించడానికి ప్రయత్నించారు, ఇక్కడ వ్యక్తులు తల్లిదండ్రుల అల్జీమర్స్ నిర్ధారణను నివేదించవచ్చు.

UW-మాడిసన్ బృందం అటువంటి ప్రాక్సీ-సమాచార అధ్యయనాలు అల్జీమర్స్ ప్రమాదం మరియు అధిక జ్ఞాన సామర్థ్యాల మధ్య “అత్యంత తప్పుదోవ పట్టించే జన్యు సహసంబంధాన్ని” ఉత్పత్తి చేయగలవని కనుగొంది.

“ఈ రోజుల్లో, జన్యు శాస్త్రవేత్తలు మామూలుగా వందల వేల మంది వ్యక్తులను కలిగి ఉన్న బయోబ్యాంక్ డేటాసెట్‌లతో పని చేస్తారు; అయినప్పటికీ, గణాంక శక్తి పెరిగేకొద్దీ, ఈ భారీ డేటాసెట్‌లలో పక్షపాతాలు మరియు లోపాల సంభావ్యత కూడా విస్తరించబడతాయి” అని లు చెప్పారు. “మా సమూహం యొక్క ఇటీవలి అధ్యయనాలు వినయపూర్వకమైన ఉదాహరణలను అందిస్తాయి మరియు బయోబ్యాంక్-స్థాయి పరిశోధన అధ్యయనాలలో గణాంక కఠినత యొక్క ప్రాముఖ్యతను హైలైట్ చేస్తాయి.”

165 బాస్కామ్ హాల్
500 లింకన్ డ్రైవ్
మాడిసన్, 53706

ఇమెయిల్:
: 608’265 -4151
అభిప్రాయం లేదా ప్రశ్నలు? యూనివర్సిటీ ఆఫ్ విస్కాన్సిన్ సిస్టమ్

AI-సహాయక జన్యు అధ్యయనాలతో నిరంతర సమస్యలు

వ్యాధికి జన్యుశాస్త్రం యొక్క లింక్ ఎల్లప్పుడూ సూటిగా ఉండదు

AIతో డేటా అంతరాలను తగ్గించడం వల్ల కలిగే నష్టాలు

కొత్త గణాంక పద్ధతి తప్పుడు పాజిటివ్‌లను తగ్గించగలదు

కొన్ని జీనోమ్-వైడ్ అసోసియేషన్ అధ్యయనాలతో AI మాత్రమే సమస్య కాదు

EDITOR PICKS

డొనాల్డ్ ట్రంప్ తన పాటను అనధికారికంగా ఉపయోగించడంపై ఒలివియా రోడ్రిగో యొక్క ‘ఐకానిక్’ రియాక్షన్

ఇంటెల్ పతనం తర్వాత ఇండెక్స్‌లో చిప్‌మేకర్‌లకు ప్రాతినిధ్యం ఇవ్వడానికి డౌకి ఎన్విడియా అవసరం

రాటెన్ టొమాటోస్ ప్రకారం ఉత్తమ కామెరాన్ డియాజ్ చిత్రం

రూడీ గోబర్ట్ హాలోవీన్ కాస్ట్యూమ్ వైరల్ అవుతోంది